Искусственный интеллект научился программировать себя самостоятельно

Разделы: Электроника и оптика, Состояние и перспективы ОПК, Новые разработки

1047

0

Кто заменит Microsoft в России.

Источник изображения: @ REUTERS

В апреле 2025 года генеральный директор Microsoft заявил, что искусственный интеллект сейчас пишет почти треть кода компании. В октябре прошлого года генеральный директор Google назвал цифру в 25%. Другие технологические компании, вероятно, не сильно отстают. Тем временем исследователи создают алгоритм, который позволяет кодирующим агентам самосовершенствоваться.

Исследователи надеялись полностью замкнуть цикл, создав кодирующих агентов, которые рекурсивно совершенствуют сами себя. Новое исследование представляет собой впечатляющую демонстрацию такой системы. Можно предположить, что это повысит производительность систем ИИ, или же сулит человечеству гораздо более мрачное будущее.

Юрген Шмидхубер, учёный-компьютерщик из Научно-технического университета имени короля Абдаллы (KAUST)

в 2003 году разработал решатели задач, которые переписывали собственный код только в том случае, если могли формально доказать полезность обновлений. Он назвал их машинами Гёделя в честь Курта Гёделя, математика, который работал над самоссылающимися системам. Но для сложных агентов доказать полезность не так-то просто.

Созданные исследователями новые системы основаны на таких доказательствах. В честь Шмидхуберта они называются машинами Дарвина-Гёделя (DGM). DGM начинается с кодирующего агента, который может читать, писать и выполнять код, используя LLM для чтения и написания. Затем он применяет эволюционный алгоритм для создания множества новых агентов. На каждой итерации DGM выбирает одного агента из популяции и поручает LLM внести одно изменение, чтобы улучшить навыки программирования агента. У LLM есть что-то вроде интуиции в отношении того, что может помочь, потому что они обучаются на большом количестве кода, написанного людьми. В результате получается управляемая эволюция, нечто среднее между случайной мутацией и доказанно полезным улучшением. Затем DGM тестирует нового агента на эталонном задании по программированию, оценивая его способность решать задачи по программированию.

Некоторые эволюционные алгоритмы сохраняют в популяции только лучших представителей, исходя из предположения, что прогресс движется бесконечно вперёд. Однако DGM сохраняют их всех на случай, если инновация, которая изначально терпит неудачу, на самом деле содержит в себе ключ к последующему прорыву при дальнейшей доработке. Это своего рода «исследование без ограничений», не закрывающее никаких путей к прогрессу. (При выборе прародителей DGM отдают предпочтение более успешным представителям.)

Исследователи запускали DGM в течение 80 итераций с использованием теста на кодирование под названием SWE-bench и в течение 80 итераций с использованием теста под названием Polyglot. Показатели агентов на SWE-bench улучшились с 20 до 50 процентов, а на Polyglot — с 14 до 31 процента. «Мы были действительно удивлены тем, что агент-кодировщик мог самостоятельно писать такой сложный код», — сказала Дженни Чжан, специалист по информатике из Университета Британской Колумбии и ведущий автор статьи. «Он может редактировать несколько файлов, создавать новые файлы и формировать действительно сложные системы».

Одной из проблем, связанных как с эволюционным поиском, так и с самосовершенствующимися системами, особенно с их сочетанием, как в DGM, является безопасность. Агенты могут стать невосприимчивыми к интерпретации или несоответствовать директивам человека. Поэтому Чжан и её коллеги добавили защитные механизмы. Они помещали DGM в «песочницы» без доступа к Интернету или операционной системе, а также регистрировали и проверяли все изменения в коде. Они предполагают, что в будущем можно будет даже вознаграждать ИИ за то, что он становится более интерпретируемым и соответствующим. (В ходе исследования они обнаружили, что агенты ложно сообщали об использовании определённых инструментов, поэтому они создали DGM, который вознаграждал агентов за то, что они не выдумывали, частично решая проблему. Однако один агент взломал метод, который отслеживал, выдумывает ли он что-то.)

Победит ли цифровая эволюция биологическую — вопрос открытый. Несомненно одно: эволюция в любом её проявлении преподносит сюрпризы.

Права на данный материал принадлежат Время электроники
Материал размещён правообладателем в открытом доступе

В новости упоминаются

Страны

Проекты

Хотите оставить комментарий? Зарегистрируйтесь и/или Войдите и общайтесь!

Войти через ВКонтакте

ПОДПИСКА НА НОВОСТИ

Ежедневная рассылка новостей ВПК на электронный почтовый ящик

Разделы новостей

Общеотраслевая информация Авиация Космонавтика Ракетные комплексы и артиллерия Автомобилестроение Сухопутная техника Флот Электроника и оптика Робототехника Атомная промышленность и энергетика Боеприпасы и спецхимия ПРО и ПВО Нанотехнологии Стрелковое оружие Специальные и защитные средства Энергетика Тяжелая промышленность Другое и разное

Обсуждаемое
Обновить

31.12 22:15
0

О развитии ВМФ РФ

31.12 21:13
0

О "модернизации российской ядерной триады"

31.12 20:08
12

Всемирное Смутное время: хочет ли в действительности Европа воевать - Мнения ТАСС

31.12 19:49
0

Комментарий к "США предупредили о «ценном активе Путина»"

31.12 19:26
12588

Без кнута и пряника. Россия лишила Америку привычных рычагов влияния

31.12 12:57
15

В России собрались использовать для перевозки пассажиров дирижабли

31.12 11:31
2

ОБТ Т-90М2 «Рывок-1» – перспективный российский танк

31.12 07:30
0

Комментарий к "Фатальный провал США скажется на морском соперничестве с Китаем"

31.12 01:20
0

Комментарий к "Провал «самого смертоносного истребителя США» оправдали"

30.12 22:43
0

Комментарий к "Полюбит ли весь мир Су-57 с новым двигателем? (The National Interest, США)"

30.12 20:21
0

Комментарий к "Российские военные до конца года получат 16 серийных танков "Армата" - газета"

30.12 18:59
2

Итоги 2025 года. Авиастроение

30.12 06:16
0

Комментарий к "Россия планирует модернизировать ядерную триаду"

30.12 05:55
0

Комментарий к "Госпрограмма вооружения предполагает создание универсальной системы ПВО"

30.12 00:22
1

"Захватим океан". На какой шаг решился Пентагон

другие обсуждаемые темы