<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">News of the Kabardino-Balkarian Scientific Center of the Russian Academy of Sciences</journal-id><journal-title-group><journal-title xml:lang="en">News of the Kabardino-Balkarian Scientific Center of the Russian Academy of Sciences</journal-title><trans-title-group xml:lang="ru"><trans-title>Известия Кабардино-Балкарского научного центра РАН</trans-title></trans-title-group></journal-title-group><issn publication-format="print">1991-6639</issn><issn publication-format="electronic">2949-1940</issn></journal-meta><article-meta><article-id pub-id-type="publisher-id">351245</article-id><article-id pub-id-type="doi">10.35330/1991-6639-2025-27-5-68-79</article-id><article-id pub-id-type="edn">LPRGUP</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Системный анализ, управление и обработка информации, статистика</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>System analysis, management and information processing, statistics</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Comparative analysis of class imbalance reduction methods in building machine learning models in the financial sector</article-title><trans-title-group xml:lang="ru"><trans-title>Разработка подхода к классификации дефолта заемщика на основе интеграции методов предварительной обработки и методов машинного обучения</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0009-0000-9591-3301</contrib-id><contrib-id contrib-id-type="spin">3088-3121</contrib-id><name-alternatives><name xml:lang="ru"><surname>Константинов</surname><given-names>А. Ф.</given-names></name><name xml:lang="en"><surname>Konstantinov</surname><given-names>A. F.</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="ru"><p> аспирант кафедры информатики </p></bio><bio xml:lang="en"><p> Postgraduate Student, Department of Informatics </p></bio><email>konstantinovaf@gmail.com</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-5229-8070</contrib-id><contrib-id contrib-id-type="spin">2513-8831</contrib-id><name-alternatives><name xml:lang="en"><surname>Dyakonova</surname><given-names>L. P.</given-names></name><name xml:lang="ru"><surname>Дьяконова</surname><given-names>Л. П.</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="ru"><p> канд. физ.-мат. наук, доцент, кафедра информатики </p></bio><bio xml:lang="en"><p>Candidate of Physical and Mathematical Sciences, Associate Professor,Department of Informatics </p></bio><email>Dyakonova.LP@rea.ru</email></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Plekhanov Russian University of Economics</institution></aff><aff><institution xml:lang="ru">Российский экономический университет имени Г. В. Плеханова</institution></aff></aff-alternatives><content-language>ru</content-language><pub-date date-type="pub" iso-8601-date="2025-11-20" publication-format="electronic"><day>20</day><month>11</month><year>2025</year></pub-date><pub-date date-type="collection"><year>2025</year></pub-date><volume>27</volume><issue>5</issue><issue-title xml:lang="ru">№5 (2025)</issue-title><issue-title xml:lang="en">NO5 (2025)</issue-title><fpage>68</fpage><lpage>79</lpage><history><date date-type="received" iso-8601-date="2025-11-13"><day>13</day><month>11</month><year>2025</year></date></history><permissions><copyright-statement xml:lang="ru">Copyright ©; 2025, Константинов А.Ф., Дьяконова Л.П.</copyright-statement><copyright-statement xml:lang="en">Copyright ©; 2025, Konstantinov A.F., Dyakonova L.P.</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="ru">Константинов А.Ф., Дьяконова Л.П.</copyright-holder><copyright-holder xml:lang="en">Konstantinov A.F., Dyakonova L.P.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rcsi.science/1991-6639/article/view/351245">https://journals.rcsi.science/1991-6639/article/view/351245</self-uri><abstract xml:lang="en"><p>Borrower default prediction is a pressing issue that underlies the financial stability of credit institutions.</p> <p>Aim. This study is to develop and evaluate an integrated borrower default prediction method.</p> <p>Materials and methods. The study was conducted by simulating the integrated borrower default prediction method, analyzing and comparing the results with the baseline AI model, and drawing conclusions.</p> <p>Results. Based on the analysis of dependencies, an integrated borrower default prediction methods developed and calculated. It demonstrated a significant improvement in quality metrics (an increase in average accuracy of 0.383, an increase in f1-score of 0.509, and an increase in accuracy of 0.792) relative to the baseline model. This article presents the results of experiments aimed at improving the quality metrics of machine learning models used to predict borrower default.</p> <p>Conclusion. The development of integrated borrower default prediction methods will improve the accuracy and reliability of forecast models, which is of great practical importance.</p></abstract><trans-abstract xml:lang="ru"><p>Задача прогнозирования дефолта заемщиков лежит в основе финансовой стабильности кредитных организаций и является актуальной.</p> <p>Цель исследования - разработка и оценка работы интегрального метода прогнозирования дефолта заемщика.</p> <p>Материалы и методы. Исследование проведено путем моделирования работы интегрального метода прогнозирования дефолта заемщиков, анализа и сравнения полученных результатов с базовой моделью ИИ и формирования выводов.</p> <p>Результаты. По итогам анализа зависимостей разработан и просчитан интегральный метод прогнозирования дефолта заемщика, который показал значительный рост показателей качества (рост средней точности - на 0,383, рост f1-score на - 0,509 и точности - на 0,792) относительно базовой модели. В данной статье приведены результаты экспериментов по улучшению показателей качества моделей машинного обучения, выполняющих прогнозирование дефолта заемщика.</p> <p>Выводы. Разработка интегральных методов прогнозирования дефолта заемщиков позволит повысить точность и надежность прогнозных моделей, что имеет большое практическое значение.</p></trans-abstract><kwd-group xml:lang="en"><kwd>methods for reducing class imbalance</kwd><kwd>methods for isolating anomalies into a separate model</kwd><kwd>bagging method</kwd><kwd>integral method for predicting borrower default</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>методы снижения дисбаланса классов</kwd><kwd>метод выделения аномалий в отдельную модель</kwd><kwd>метод баггинга</kwd><kwd>интегральный метод прогнозирования дефолта заемщика</kwd></kwd-group><funding-group><funding-statement xml:lang="en">The study was performed without external funding.</funding-statement><funding-statement xml:lang="ru">Исследование проведено без спонсорской поддержки.</funding-statement></funding-group></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><mixed-citation>Информационно-аналитический материал о развитии банковского сектора Российской Федерации в декабре 2024. [Электронный ресурс]. Режим доступа: https://www.cbr.ru/collection/collection/file/55056/razv_bs_24_12.pdf (дата обращения: 17.09.2025)</mixed-citation></ref><ref id="B2"><label>2.</label><mixed-citation>Ali A.A., Khedr A.M., El-Bannany M., Kanakkayil S. A powerful predicting model for financial statement fraud based on optimized xgboost ensemble learning technique. Applied Sciences. 2023. Vol. 13. No. 4. P. 2272. DOI: 10.3390/app13042272</mixed-citation></ref><ref id="B3"><label>3.</label><mixed-citation>Константинов А. Ф., Дьяконова Л. П. Сравнительный анализ методов снижения дисбаланса классов при построении моделей машинного обучения в финансовом секторе // Известия Кабардино-Балкарского научного центра РАН. 2025. Т. 27. No 1. C. 143-151. DOI: 10.35330/1991-6639-2025-27-1-143-151</mixed-citation></ref><ref id="B4"><label>4.</label><mixed-citation>Qian H., Zhang S., Wang B. et al. A comparative study on machine learning models combining with outlier detection and balanced sampling methods for credit scoring 2021. [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/2112.13196 (дата обращения: 01.09.2025). DOI: 10.48550/arXiv.2112.13196</mixed-citation></ref><ref id="B5"><label>5.</label><mixed-citation>Dyakonova L., Konstantinov A. Approaches to risk analysis in the financial sector based on machine learning and artificial intelligence methods / MPRA Paper. [Электронный ресурс]. Режим доступа: https://mpra.ub.uni-muenchen.de/122941/ (дата обращения: 17.09.2025)</mixed-citation></ref><ref id="B6"><label>6.</label><mixed-citation>Liu F.T., Ting K.M., Zhou Z.H. Isolation forest. IEEE Xplore. 2008. Pp. 413-422. DOI: 10.1109/ICDM.2008.17</mixed-citation></ref><ref id="B7"><label>7.</label><mixed-citation>Blázquez-García A., Conde A., Mori U., Lozano J.A. A review on outlier/anomaly detection in time series data. [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/2002.04236 (дата обращения: 01.09.2025).</mixed-citation></ref><ref id="B8"><label>8.</label><mixed-citation>Ribeiro M.T., Singh S., Guestrin C. Why should I trust you? Explaining the predictions of any classifier. [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/1602.04938 (дата обращения: 01.09.2025).</mixed-citation></ref><ref id="B9"><label>9.</label><mixed-citation>Breiman L. Bagging predictors. Machine Learning. 1996. Vol. 24. No. 2. Pp. 123-140.</mixed-citation></ref><ref id="B10"><label>10.</label><mixed-citation>Abdoli M., Akbari M., Shahrabi J. Bagging supervised autoencoder classifier for credit scoring. Preprint. DOI: 10.48550/arXiv.2108.078</mixed-citation></ref><ref id="B11"><label>11.</label><mixed-citation>Zou Y., Gao C., Xia M., Pang C. Credit scoring based on a bagging-cascading boosted decision tree. Intelligent Data Analysis. 2022. Vol. 26. No. 6. Pp. 1557-1578. DOI: 10.3233/IDA-216228</mixed-citation></ref></ref-list></back></article>
