识别图像软件哪个好（图像识别方法标准）

导言

大多数与图像识别相关的分类问题都存在着众所周知的/既定的问题。例如，通常情况下，没有足够的数据来对分类系统进行适当的训练，这些数据涵盖的类可能会有所不足，而且最常见的情况是，使用未经仔细检查的数据将意味着我们对数据的标签缺乏合理的分类。

数据是决定你的努力是失败还是成功的关键。这些系统不仅仅需要比人类更多的数据来学习和区分不同的类，它们还需要成千上万倍的数据才能相对较好的完成这项工作。

深度学习依靠大量高质量的数据来预测未来的趋势和行为模式。并且数据集需要代表我们打算预测的类，否则，系统会”曲解”不同类的分布，让你的模型产生偏差。

这些问题通常有一个共同的原因：即查找、提取和存储大量数据的能力不够强大，以及在第二层上对数据的清除、管理和处理能力不足。

虽然我们可以提高计算能力和数据存储能力，但这种情况只有当这是一个复杂的、大的卷积神经网络针对一个大的数据集运行时才会考虑，只有一台机器是不可能的。因为它可能没有足够的空间/内存，而且很可能没有足够的计算能力来运行分类系统。它还需要通过云资源”访问”并行或分布式计算，了解如何运行、组织和设置复杂的集群。

然而，拥有足够的数据和处理能力并不足以防止这些问题的发生。

在这篇文章中，我们将探索和讨论一些不同的技术，这些技术可以解决在处理小数据集时出现的问题，如缓解分类的不平衡，以及如何防止过度拟合。

迁移学习

“数据可能是新的煤炭”，引用自NeilLawrence的话。我们知道深度学习算法需要通过大量的标记数据从零开始训练一个成熟的网络，但是我们常常无法完全理解大量这个词意味着多少数据。简单来说，仅仅是找到满足你训练需求的数据量可能都会给你带来挫折感，但是有一些技术，例如数据增强或迁移学习，将为你的模型节省大量的精力和时间。

迁移学习是一种流行的、非常强大的方法，简而言之，它可以概括为是把已训练好的模型参数迁移到新的模型来帮助新模型训练。这意味着利用现有的模型并改变它以适应你自己的目标。这种方法包括”切断”前训练模型的最后几个层，并使用你的数据集对它们进行再训练。这样做有以下优点：

它在较老的模型上建立了一个新的模型，并对图像分类任务进行了验证。例如，一个建立在CNN体系架构上的模型（比如由Google开发的CNN模型Inception-v3），然后经过ImageNet的预训练；

它减少了训练时间，因为它允许重复使用参数以实现可能需要数周才能达到的性能。

不平衡数据

通常，数据集中的一组标签相对于其他数据集中的标签的比例可能是不平衡的，而这个时候，所占比例较低标的标签组往往是我们感兴趣的一组，因为它相对稀有。例如，假设我们有一个二进制分类问题，X类代表95%的数据，Y类代表其他5%的数据。因此，该模型对X类更”敏感”，对Y类不太”敏感”。当分类器的准确率达到95%时，我们只能说对X类的预测基本都是正确的。

显然，这里的准确性不是一个适当的”评分”。在这种情况下，我们更应该考虑的是预测错误的代价、预测精确度和查全率。一个合理的起点是对不同类型错误的二维表示，换句话说，是一个混淆矩阵。在本文中，可以将其描述为说明实际标签与预测标签的方法，如下图所示。