Анализ целесообразного поведения различных типов автоматов
Д. П. Димитриченко
Загрузить полный текст
Аннотация: Коллективное поведение автоматов является одним из направлений развития методов машинного обучения. Такие автоматы реализуют функцию целенаправленного поведения. Автомат выполняет действие, в ответ на которое окружающая среда подает свой выходной сигнал на вход автомата. Автомат, в соответствии со своей конструкцией, реагирует на этот входной сигнал очередным действием. Таким образом, выстраивается замкнутый контур взаимодействия между некоторой окружающей средой и функционирующим в ней автоматом. Сама эта среда во многих случаях допускает автоматную реализацию. Оценка эффективности автомата определяется как оптимизационная задача максимизации суммы положительных сигналов (поощрений) или минимизации отрицательных сигналов (штрафов), получаемых от окружающей среды за рассматриваемый промежуток времени. Формализация как свойств окружающей среды, так и действий автоматов, а также обработка полученных результатов производятся при помощи аппарата теории игр. В этом случае сигналы от окружающей среды удобно представить, как суммы выигрышей и проигрышей игроков-автоматов. В настоящей работе проведено сравнение автоматов различных конструкций, так как эффективность реакций автоматов определяется не только свойствами окружающей среды, но и такими параметрами, как тип и глубина памяти.
Ключевые слова: автомат, целесообразное поведение, оптимальная стратегия, глубина памяти, теория игр, формализация окружающей среды, динамическая среда
Для цитирования. Димитриченко Д. П. Анализ целесообразного поведения различных типов автоматов // Известия Кабардино-Балкарского научного центра РАН. 2024. Т. 26. № 6. С. 165–174. DOI: 10.35330/1991-6639-2024-26-6-165-174
Список литературы
- Стефанюк В. Л. Локальная организация интеллектуальных систем. М.: ФИЗМАТЛИТ, 328 с.
- Димитриченко Д. П. Оптимизация рекуррентной нейронной сети при помощи автоматов с переменной структурой // Программные системы и вычислительные методы. № 4. С. 30–43. DOI: 10.7256/2454-0714.2023.4.69011
- Поспелов Д. А. Игры и автоматы. М.: Энергия, 1966. 136 с.
- Цетлин М. Л. Исследования по теории автоматов и моделированию биологических систем. М. 1969. 316 с.
- Поспелов Д. А. Вероятностные автоматы. М.: Энергия, 1970. 88 с.
- Варшавский В. И. Коллективное поведение автоматов. М.: Наука, 1973. 408 с.
- Варшавский В. И., Поспелов Д. А. Оркестр играет без дирижера: размышления об эволюции некоторых технических систем и управление ими. М.: Наука, 1984. 208 с.
Информация об авторе
Димитриченко Дмитрий Петрович, канд. техн. наук, ст. науч. сотр., отдел нейроинформатики
и машинного обучения, Институт прикладной математики и автоматизации – филиал Кабардино-
Балкарского научного центра Российской академии наук;
360000, Россия, г. Нальчик, ул. Шортанова, 89 А;
dimdp@rambler.ru, ORCID: https://orcid.org/0000-0003-2399-3538, SPIN-код: 3272-3520