针对类别不平衡问题的过采样技术全面分析及其在机器学习模型中的应用

•

原作者:Shivani Rana et al.

•

2025年12月31日

Gemini AI生成的图像

一项研究评估了多种过采样技术（如SMOTE、Borderline SMOTE和ADASYN）以解决机器学习中的类别不平衡问题。该研究采用BERT进行预处理，并分析了支持向量机（SVM）、决策树和逻辑回归等模型。值得注意的是，使用Borderline SMOTE的SVM模型达到了71.9%的准确率和0.53的Matthews相关系数（MCC），显示出模型性能的显著提升。

对过采样技术的分析揭示了机器学习中类别不平衡的见解

近期研究探讨了过采样技术在解决机器学习数据集中的类别不平衡方面的有效性，揭示了模型性能的显著提升。该研究集中于如SMOTE（合成少数类过采样技术）、边界SMOTE和ADASYN（自适应合成采样）等方法，并与支持向量机（SVM）和决策树等多种机器学习算法进行了测试。

主要发现

实验结果显著，特别是在使用边界SMOTE的SVM模型中，达到了71.9%的准确率和0.53的马修斯相关系数（MCC）。这些指标表明，模型在准确分类多数类和少数类实例的能力上有了显著改善。

分享此文章

Twitter Facebook LinkedIn WhatsApp Reddit

针对类别不平衡问题的过采样技术全面分析及其在机器学习模型中的应用

对过采样技术的分析揭示了机器学习中类别不平衡的见解

主要发现

相关主题：

分享此文章