<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">News of the Kabardino-Balkarian Scientific Center of the Russian Academy of Sciences</journal-id><journal-title-group><journal-title xml:lang="en">News of the Kabardino-Balkarian Scientific Center of the Russian Academy of Sciences</journal-title><trans-title-group xml:lang="ru"><trans-title>Известия Кабардино-Балкарского научного центра РАН</trans-title></trans-title-group></journal-title-group><issn publication-format="print">1991-6639</issn><issn publication-format="electronic">2949-1940</issn></journal-meta><article-meta><article-id pub-id-type="publisher-id">351950</article-id><article-id pub-id-type="doi">10.35330/1991-6639-2023-2-112-18-29</article-id><article-id pub-id-type="edn">GXEHAC</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Информатика и информационные процессы</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Informatics and information processes</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Educational data mining for predicting the academic performance of university students</article-title><trans-title-group xml:lang="ru"><trans-title>Интеллектуальный анализ образовательных данных для прогноза успеваемости студентов вуза</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-9713-4897</contrib-id><name-alternatives><name xml:lang="en"><surname>Popova</surname><given-names>Nataliya A.</given-names></name><name xml:lang="ru"><surname>Попова</surname><given-names>Наталия Александровна</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="ru"><p>канд. техн. наук, доцент кафедры "Математическое обеспечение и применение ЭВМ"</p></bio><bio xml:lang="en"><p>Candidate of Technical Sciences, Associate Professor of the Department of Mathematical Support and Computer Use</p></bio><email>popov.tasha@yandex.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-0816-0944</contrib-id><name-alternatives><name xml:lang="en"><surname>Egorova</surname><given-names>Ekaterina S.</given-names></name><name xml:lang="ru"><surname>Егорова</surname><given-names>Екатерина Сергеевна</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Candidate of Economic Sciences, Associate Professor of the Department of Applied Informatics</p></bio><bio xml:lang="ru"><p>канд. экон. наук, доцент кафедры "Прикладная информатика"</p></bio><email>katepost@yandex.ru</email><xref ref-type="aff" rid="aff2"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Penza State University</institution></aff><aff><institution xml:lang="ru">Пензенский государственный университет</institution></aff></aff-alternatives><aff-alternatives id="aff2"><aff><institution xml:lang="en">Penza State Technological University</institution></aff><aff><institution xml:lang="ru">Пензенский государственный технологический университет</institution></aff></aff-alternatives><content-language>ru</content-language><pub-date date-type="pub" iso-8601-date="2026-02-04" publication-format="electronic"><day>04</day><month>02</month><year>2026</year></pub-date><pub-date date-type="collection"><year>2023</year></pub-date><issue>2</issue><issue-title xml:lang="en">NO2 (2023)</issue-title><issue-title xml:lang="ru">№2 (2023)</issue-title><fpage>18</fpage><lpage>29</lpage><history><date date-type="received" iso-8601-date="2025-11-18"><day>18</day><month>11</month><year>2025</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2026, Popova N.A., Egorova E.S.</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2026, Попова Н.А., Егорова Е.С.</copyright-statement><copyright-year>2026</copyright-year><copyright-holder xml:lang="en">Popova N.A., Egorova E.S.</copyright-holder><copyright-holder xml:lang="ru">Попова Н.А., Егорова Е.С.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rcsi.science/1991-6639/article/view/351950">https://journals.rcsi.science/1991-6639/article/view/351950</self-uri><abstract xml:lang="en"><p>Progress in the field of data mining makes it possible to use educational data to improve the quality of educational processes. This article examines various methods of analyzing student achievement data. The focus is on two aspects: first, predicting students' academic achievements at the end of a four-year undergraduate curriculum; second, examining typical student progressions and combining them with the prediction results. Approximately 10 classification algorithms were used in the prediction process. An approach to improving the performance of classification methods is proposed where classifier attributes are selected during their training. Two important groups of students were identified: low-achieving and high-achieving students. The results show that by focusing on a small number of courses that are indicators of particularly good or poor performance, it is possible to prevent and support low-achieving students in a timely manner, and to provide advice and opportunities to high-achieving students.</p></abstract><trans-abstract xml:lang="ru"><p>Прогресс в области интеллектуального анализа данных делает возможным использование образовательных данных для повышения качества образовательных процессов. В статье рассмотрены различные методы анализа данных об успеваемости студентов. Основное внимание уделено двум аспектам: во-первых, прогнозирование академических достижений студентов в конце четырехлетней учебной программы по программам бакалавриата; во-вторых, изучение типичных прогрессий учащихся и объединение их с результатами прогнозирования. При прогнозировании было использовано порядка 10 алгоритмов классификации. Предложен подход к улучшению производительности методов классификации, когда атрибуты классификаторов выбираются в процессе их обучения. Определены две важные группы учащихся - с низкими и высокими достижениями. Результаты показывают, что, сосредоточив внимание на небольшом количестве курсов, которые являются показателями особенно хорошей или плохой успеваемости, можно своевременно предупреждать и поддерживать студентов с низкой успеваемостью, а также давать советы и возможности студентам с высокой успеваемостью.</p></trans-abstract><kwd-group xml:lang="en"><kwd>analysis of educational data</kwd><kwd>decision tree</kwd><kwd>clustering</kwd><kwd>forecasting</kwd><kwd>academic performance</kwd><kwd>dissociation</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>анализ образовательных данных</kwd><kwd>дерево решений</kwd><kwd>кластеризация</kwd><kwd>прогнозирование</kwd><kwd>успеваемость</kwd><kwd>дистилляция</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><mixed-citation>Белоножко П. П., Карпенко А. П., Храмов Д. А. Анализ образовательных данных: направления и перспективы применения // Интернет-журнал "Науковедение" Том 9. No 4 (2017). URL: http://naukovedenie.ru/PDF/15TVN417.pdf</mixed-citation></ref><ref id="B2"><label>2.</label><mixed-citation>Мамонтова М. Ю. Качество учебных достижений: оценка и прогноз на основе результатов критериально-ориентированного тестирования // Образование и наука. Известия УрО РАО. 2009. No 3(60). С. 18-26.</mixed-citation></ref><ref id="B3"><label>3.</label><mixed-citation>Русаков С. В., Накарякова Н. Н. Прогнозирование успеваемости студентов первого курса с помощью дерева решений на основе их результатов сдачи ЕГЭ // Наука. Информатизация. Технологии. Образование: Материалы XI международной научно-практической конференции. Екатеринбург: Российский государственный профессионально-педагогический университет, 2018. С. 589-594.</mixed-citation></ref><ref id="B4"><label>4.</label><mixed-citation>Фирстов В. Е. Социометрические и информационные аспекты кластеризации обучаемого контингента при организации и оптимизации группового сотрудничества в учебном процессе в школе и вузе // Известия Саратовского университета. Новая серия. Серия: Философия. Психология. Педагогика. 2014. Т. 14. No 1. С. 110-118.</mixed-citation></ref><ref id="B5"><label>5.</label><mixed-citation>Medvedev D., D'yakonov A. New Properties of the Data Distillation Method When Working with Tabular Data // Conference proceedings "Analysis of Images, Social Networks and Texts". Lecture Notes in Computer Science. Vol. 12602. Springer, Cham. 2021. https://doi.org/ 10.1007/978-3-030-72610-2_29</mixed-citation></ref><ref id="B6"><label>6.</label><mixed-citation>Sucholutsky I., Schonlau M. Soft-Label Dataset Distillation and Text Dataset Distillation // International Joint Conference on Neural Networks, Shenzhen, China, 2021. Pp. 1-8. DOI: 10.1109/IJCNN52387.2021.9533769.</mixed-citation></ref><ref id="B7"><label>7.</label><mixed-citation>Никонорова М. Л. Компьютерная модель решения задач классификации в программной среде Rapid Miner // Медицинское образование и профессиональное развитие. 2017. No 2-3(28-29). С. 24-33.</mixed-citation></ref><ref id="B8"><label>8.</label><mixed-citation>Филяк П. Ю., Виноградов М. А. Применение Rapid miner и открытых сред как инструментов интеллектуального анализа данных для обеспечения безопасности // Информация и безопасность. 2017. Т. 20. No 4. С. 552-555.</mixed-citation></ref><ref id="B9"><label>9.</label><mixed-citation>Maimon O., Rokach L. Data Mining and Knowledge Discovery Handbook. Springer Science, Business Media, 2010. 1285 p. ISBN: 978-0-387-09822-7.</mixed-citation></ref></ref-list></back></article>
