Исследование основных методов автоматической обработки, группировки и аннотирования информации
Д. В. Тихонов
Загрузить полный текст
Аннотация: В статье исследованы основные методы автоматической обработки, группировки и аннотирования информации. Показано, что методы автоматического анализа Data Mining базируются на использовании определенных статистических закономерностей (классификация, регрессия), поиске ключевых слов, однако не используют алгоритмы лингвистической обработки текстов. Таким образом, автоматический анализ текстовой информации, осуществляемый современными средствами аналитической обработки, не способен прорабатывать содержание текстов. Для сравнения двух простых предложений по содержанию был использован метод резолюций. Как показали исследования, при применении алгоритма унификации содержание предложений не учитывается. Поэтому как решение проблемы сравнительного анализа текстовой информации по содержанию были предложены новые алгоритмы работы с логико-лингвистическими моделями. Научная новизна полученных результатов состоит в методе быстрого извлечения набора локальных дескрипторов, описывающих все части изображения, что позволяет существенно ускорить процесс аннотирования и формировать более полный глобальный визуальный дескриптор изображения.
Ключевые слова: методы, автоматическая обработка, группировка, аннотирование, информация, Data Mining, метод резолюций
Для цитирования. Тихонов Д. В. Исследование основных методов автоматической обработки, группировки и аннотирования информации // Известия Кабардино-Балкарского научного центра РАН. 2025. Т. 27. № 1. С. 111–119. DOI: 10.35330/1991-6639-2025-27-1-111-119
Список литературы
- Hammar Å. Automatic Information Processing. In: Seel, N.M. (eds). Encyclopedia of the Sciences of Learning. Springer. Boston, MA. 2012. DOI: 10.1007/978-1-4419-1428-6_494
- Khazaei E., Alimohammadi A. An Automatic User Grouping Model for a Group Recommender System in Location-Based Social Networks. ISPRS Int. J. Geo-Inf. 2018. 7(2):67. DOI: 10.3390/ijgi7020067
- Ячная В. О., Луцив В. Р., Малашин Р. О. Современные технологии автоматического распознавания средств общения на основе визуальных данных // КО. 2023. Т. 47. № 2. С. 287–305. URL: https://cyberleninka.ru/article/n/sovremennye-tehnologii-avtomaticheskogo-raspoznavaniya-sredstv-obscheniya-na-osnove-vizualnyh-dannyh (дата обращения: 18.02.2024)
- Назаров Т. Р., Мамедова Н. А. Автоматизированное решение задачи детектирования промышленных объектов на ортофотоплане с помощью нейронной сети // Программные продукты и системы. 2023. Т. 36. № 1. С. 144–158. URL: https://cyberleninka.ru/ article/n/avtomatizirovannoe-reshenie-zadachi-detektirovaniya-promyshlennyh-obektov-na-ortofotoplane-s-pomoschyu-neyronnoy-seti (дата обращения: 18.02.2024)
- Власов С. О., Гладышев А. И., Богуславский А. А., Соколов С. М. Решение задачи обнаружения объекта с помощью нейросетевых технологий // Препринты ИПМ им. М. В. Келдыша. 2023. № 16. 27 с. DOI: https://doi.org/10.20948/prepr-2023-16
- Гайсин А. Э. Анализ существующих методов автоматического текстового анализа // Вестник науки. 2023. № 6(63). Т. 4. С. 254–258. URL: https://cyberleninka.ru/article/n/analiz-suschestvuyuschih-metodov-avtomaticheskogo-tekstovogo-analiza (дата обращения: 18.02.2024)
- Пригодич Н. Д., Коробко С. С. Применение программных методов для автоматизированной обработки источников личного происхождения // Историческая информатика. 2023. № 1(43). С. 1–9. URL: https://cyberleninka.ru/article/n/primenenie-programmnyh-metodov-dlya-avtomatizirovannoy-obrabotki-istochnikov-lichnogo-proishozhdeniya (дата обращения: 18.02.2024)
- Li H., Yuan D., Ma X., Cui D., Cao L. Genetic algorithm for the optimization of features and neural networks in ECG signals classification // Scientific Reports. 2017. Vol. 7. No. 1. Pp. 1–12. DOI: 10.1038/srep41011
- He X., Zhao K., Chu X. AutoML: A Survey of the State-of-the-Art // Knowledge-Based Systems. 2021. Vol. 212. P. 106622. DOI: 10.1016/j-.knosys.2020.106622
- Jin H., Song Q., Hu X. Auto-keras: An efficient neural architecture search system // Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2019. Pp. 1946–1956. DOI: 10.1145/3292500.3330648
- Real E., Aggarwal A., Huang Y., Le Q. V. Regularized evolution for image classifier architecture search // Proceedings of the AAAI Conference on Artificial Intelligence. 2018. Vol. 33. Pp. 4780–4789. DOI: 10.1609/aaai.v33i01.33014780
Информация об авторе
Тихонов Дмитрий Владимирович, канд. техн. наук, доцент кафедры «Экономика и финансы», Финансовый университет при Правительстве Российской Федерации (Ярославский филиал);
150003, Россия, г. Ярославль, ул. Кооперативная, 12а;
Dtihonov1987@yandex.ru, ORCID: https://orcid.org/0009-0001-2293-6390, SPIN-код: 4195-0317