针对类别不平衡问题的过采样技术全面分析及其在机器学习模型中的应用

Gemini AI生成的图像
一项研究评估了多种过采样技术(如SMOTE、Borderline SMOTE和ADASYN)以解决机器学习中的类别不平衡问题。该研究采用BERT进行预处理,并分析了支持向量机(SVM)、决策树和逻辑回归等模型。值得注意的是,使用Borderline SMOTE的SVM模型达到了71.9%的准确率和0.53的Matthews相关系数(MCC),显示出模型性能的显著提升。
对过采样技术的分析揭示了机器学习中类别不平衡的见解
近期研究探讨了过采样技术在解决机器学习数据集中的类别不平衡方面的有效性,揭示了模型性能的显著提升。该研究集中于如SMOTE(合成少数类过采样技术)、边界SMOTE和ADASYN(自适应合成采样)等方法,并与支持向量机(SVM)和决策树等多种机器学习算法进行了测试。
主要发现
实验结果显著,特别是在使用边界SMOTE的SVM模型中,达到了71.9%的准确率和0.53的马修斯相关系数(MCC)。这些指标表明,模型在准确分类多数类和少数类实例的能力上有了显著改善。
相关主题:
类别不平衡过采样技术SMOTE机器学习模型支持向量机
📰 原始来源: https://doi.org/10.2174/0126662558347788241127051934
所有权利和署名均属于原出版商。