微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Tencent ML-Images 大规模多标签图像数据集

程序名称:Tencent ML-Images

授权协议: Apache

操作系统: 跨平台

开发语言: Python

Tencent ML-Images 介绍

Tencent ML-Images 由多标签图像数据集 ML-Images 与业内目前同类深度学习模型中精度最高的深度残差网络 resnet-101 构成。

  • ML-Images : 最大的开源多标签图像数据库包括 17,609,752 个训练集和 88,739 个验证图像 URL,最多可标注 11,166 个类别。

  • resnet-101 model : 在 ML-Images 上进行了预训练,并通过迁移学习在 ImageNet 上实现了 top-1 精度 80.73%。

该项目的主要内容包括

  • ML-Images 数据集的全部图像 URL,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和 URL 自行下载图像。

  • ML-Images 数据集的详细介绍,包括图像来源、图像数量、类别数量、类别的语义标签体系,标注方法,以及图像的标注数量统计量。

  • 完整的代码和模型。提供的代码涵盖从图像下载,图像预处理,基于 ML-Images 的预训练,基于 ImageNet 的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的 resnet-101 模型(在单标签基准数据集 ImageNet 的验证集上的 top-1 精度为 80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

Tencent ML-Images 官网

https://github.com/Tencent/tencent-ml-images

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐