Комплексный анализ техник пересэмплинга для решения проблемы дисбаланса классов с использованием моделей машинного обучения

Изображение создано Gemini AI
Исследование оценивает методы увеличения выборки (SMOTE, Borderline SMOTE, ADASYN) для решения проблемы дисбаланса классов в машинном обучении. С применением BERT для предварительной обработки данных анализируются такие модели, как SVM, дерево решений и логистическая регрессия. Особенно примечательно, что SVM с использованием Borderline SMOTE достигла 71,9% точности и коэффициента Мэтьюса (MCC) 0,53, что подчеркивает улучшение производительности модели.
Анализ техник переобучения раскрывает идеи для дисбаланса классов в машинном обучении
Недавние исследования изучили эффективность техник переобучения в решении проблемы дисбаланса классов в наборах данных машинного обучения, выявив значительные улучшения в производительности моделей. Исследование сосредоточилось на методах, таких как SMOTE (Техника синтетического переобучения меньшинств), Borderline SMOTE и ADASYN (Адаптивное синтетическое выборочное), протестированных в сочетании с различными алгоритмами машинного обучения, включая метод опорных векторов (SVM) и деревья решений.
Ключевые результаты
Эксперимент дал замечательные результаты, особенно с моделью SVM, использующей Borderline SMOTE, которая достигла уровня точности 71.9% и коэффициента корреляции Мэттьюса (MCC) 0.53. Эти показатели указывают на значительное улучшение способности модели точно классифицировать экземпляры как в классах большинства, так и в классах меньшинства.
Связанные темы:
📰 Первоисточник: https://doi.org/10.2174/0126662558347788241127051934
Все права и авторство принадлежат первоначальному издателю.