Основные принципы нейрокогнитивного моделирования сознания агента универсального искусственного интеллекта
Т. К. Нгуен, М. Т. Нгуен
Загрузить полный текст
Аннотация: Статья посвящена задаче обнаружения и распознавания надводных объектов по данным видеонаблюдения в условиях плохой видимости, таких как дождь, снег, туман, сумерки. Наряду с проблемой ухудшения видимости имеются и другие факторы, затрудняющие решение этой задачи: изменение формы и размера изображения при изменении расстояния до объекта наблюдения и угла обзора видеокамеры. Обсуждается один из подходов к проблематике обработки данных видеонаблюдения – он состоит в совместном применении двух технологий: модели глубокого обучения YOLO и дискретного вейвлет-преобразования изображений. Экспериментальные результаты показывают, что предложенный алгоритм достигает высоких показателей точности, что делает его подходящим для применения в системах видеомониторинга беспилотниками.
Ключевые слова: задача обнаружения объектов, YOLO, вейвлет-преобразование, надводные объекты, дроны, условие плохой видимости
Для цитирования. Нгуен Т. K., Нгуен М. Т. Задача обнаружения надводных объектов в условиях плохой видимости // Известия Кабардино-Балкарского научного центра РАН. 2025. Т. 27. № 1. С. 171–180. DOI: 10.35330/1991-6639-2025-27-1-171-180
Список литературы
- Wang Z., Wang G., Yang W. Aircraft detection in remote sensing imagery with lightweight feature pyramid network. MIPPR 2019: Automatic Target Recognition and Navigation. 2020. Vol. 11429. Pp. 365–369. DOI: 10.1117/12.2539372
- Бондаренко В. А., Павлова В. А., Тупиков В. А., Холод Н. Г. Алгоритм нейросетевого распознавания надводных объектов в реальном времени // Известия ТулГУ. Технические науки. 2021. № 1. C. 19–33. EDN: LBWTUH
- Zhang Q., Benveniste A. Wavelet networks. IEEE Transactions on Neural Networks. 1992. Vol. 3. No. 6. Pp. 889–898.
- De Silva D.D.N., Fernando S., Piyatilake I.T.S., Karunarathne A.V.S. Wavelet based edge feature enhancement for convolutional neural networks. Eleventh International Conference on Machine Vision (ICMV 2018). 2019. Vol. 11041. DOI: 10.1117/12.2522849
- Bahdanau D., Cho K., Bengio Y. Neural Machine Translation by Jointly Learning to Align and Translate. International Conference on Learning Representations. ICLR 2015. DOI: 10.48550/arXiv.1409.0473
- Niu Z., Zhong G., Yu H. A review on the attention mechanism of deep learning. Neurocomputing, 2021. Vol. 452. Pp. 48–62. DOI: 10.1016/j.neucom.2021.03.091
- Muhammad Y. What is Yolov8: an in-depth exploration of the Internal features of the next-generation object detector. Computer Vision and Pattern Recognition. August 29, 2024. DOI: 10.48550/arXiv.2408.15857
Информация об авторах
Нгуен Тхань Конг, аспирант кафедры автоматических систем, Российский технологический университет МИРЭА;
119454, Россия, Москва, Проспект Вернадского, 78;
congvietnam@mail.ru, ORCID: https://orcid.org/ 0009-0005-9719-8731
Нгуен Минь Тыонг, канд. техн. наук, доцент кафедры информатики, Российский технологический университет МИРЭА;
119454, Россия, Москва, Проспект Вернадского, 78;
nguen_m@mirea.ru, ORCID: https://orcid.org/0009-0002-7267-1121, SPIN-код: 5480-9970