微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pythia 视觉问答研究模块化框架

程序名称:Pythia

授权协议: BSD

操作系统: 跨平台

开发语言: Python

Pythia 介绍

Pythia 是 Facebook 人工智能研究(Facebook AI Research,FAIR)的视觉问答研究模块化框架,它建立在 PyTorch
之上。

特性:

  • Model Zoo:最先进的视觉和语言模型的参考实现,包括 LoRRA(SoQ on VQA 和 TextVQA)、Pythia 模型(VQA 2018 挑战获胜者)和 BAN。
  • Multi-Tasking:支持多任务,允许同时训练多个数据集。
  • Datasets:包括对内置的各种数据集的支持包括 VQA、VizWiz、TextVQA 和 VisualDialog。
  • Modules:为视觉和语言领域中的许多常用图层提供实现
  • distributed:支持基于 DataParallel 和 distributedDataParallel 的分布式培训。
  • Unopinionated:对于基于它构建的数据集和模型实现不受影响。
  • Customization:可自定义损失、指标、调度、优化器、张量板等等

Pythia 还可以作为视觉和语言数据集挑战的入门代码库(TextVQA 挑战、VQA 挑战)。

Pythia 官网

https://github.com/facebookresearch/pythia

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐