问题 Miminum对Google tensorflow图像分类器的要求


我们计划使用Google Tensorflow构建图像分类器。

我想知道使用卷积深度神经网络训练自定义图像分类器的最小值和最佳要求是什么?

问题具体是:

  • 每个班级应至少提供多少张图片?
  • 我们需要appx吗?每班提供相同数量的训练图像,或者每班的数量可以不同?
  • 错误图像数据对训练数据的影响是什么?例如。 500个网球鞋和50个其他鞋子的图像。
  • 是否有可能训练一个比最近发布的初始-v3模型更多的类的分类器?让我们说:30.000。

1946
2017-12-08 17:45


起源

您是否拥有Inception-v3网络定义,以便您可以更改它,或者只是用于分类的精简版本(部署版本)? - Brent Faust


答案:


“每个班级应该至少提供多少张图片?”

取决于你如何训练。

如果从头开始训练新模型,纯粹监督:对于图像数量的经验法则,您可以查看MNIST和CIFAR任务。这些似乎可以正常工作,每班约5,000张图像。如果你是从头开始训练的话。

您可以通过在ImageNet上训练的模型开始来引导您的网络。这个模型已经具有很好的功能,因此它应该能够学习如何在没有很多标记示例的情况下对新类别进行分类。我认为这个研究不足以告诉你具体的数字。

如果使用未标记的数据进行训练,则每个类别可能只有100个标记图像。最近有很多关于这个主题的研究工作,尽管没有像Imagenet这样大的任务扩展。 易于实施:

http://arxiv.org/abs/1507.00677

复杂实施:

http://arxiv.org/abs/1507.02672
http://arxiv.org/abs/1511.06390
http://arxiv.org/abs/1511.06440

“我们是否需要appx。每班提供相同数量的培训图像,或者每个班级的数量是不同的?”

它应该适用于每个类的不同数量的示例。

“错误的图像数据对训练数据的影响是什么?例如,网球鞋和其他50种鞋的500张图像。”

您应该使用本文中描述的标签平滑技术:

http://arxiv.org/abs/1512.00567

根据您对标签错误率的估算来平滑标签。

“是否有可能训练一个比最近发布的初始-v3模型更多类别的分类器?让我们说:30.000。”


7
2017-12-08 18:49



是否提供了Inception-v3培训时间网(包含所有培训参数)? - Brent Faust


每个班级应至少提供多少张图片?

我们需要appx吗?每班提供相同数量的训练图像,或者每班的数量可以不同?

错误图像数据对训练数据的影响是什么?例如。 500个网球鞋和50个其他鞋子的图像。

这三个问题并不是TensorFlow特有的。但简短的回答是,它取决于模型在处理不平衡数据集和噪声标签时的弹性。

是否有可能训练一个比最近发布的初始-v3模型更多的类的分类器?让我们说:30.000。

当然是。这意味着更大的分类器层,因此您的训练时间可能会更长。除此之外,TensorFlow没有任何限制。


4
2017-12-08 18:05



我同意这三个问题不是特定于TF的,但它们与它有某种联系。对于一个相当好的工作分类器,你会建议每个班级有多少训练图像? - Jabb