机器学习训练数据不足怎么办?如何有效增加数据?

机器学习训练数据不足怎么办?如何有效增加数据?

合理增加学习数据

当机器学习训练数据量不足时,如何尽可能合理地增加数据是一个常见的难题。

一种方法是重采样,即直接复制现有数据。此外,过采样可以创建新数据,如 SMOTE 算法和数据增强技术。

然而,需要注意的是,并不是所有数据删除操作都是有益的。例如,将 NUM1 中的一个 A 删除可能不会显着改善数据集,因为重采样也会生成相同的数据。

一个更有效的方法是创建真正的新数据,但要注意以下几点:

  • 不要对测试数据造数据。 测试集应使用真实数据。
  • 确保造出的数据符合原始数据集的分布。

欲了解更多信息,请参阅有关处理不平衡数据集的博客:https://www.cnblogs.com/wuliytTaotao/p/9308944.html

以上就是机器学习训练数据不足怎么办?如何有效增加数据?的详细内容,更多请关注其它相关文章!