Войти

Искусственный интеллект научился программировать себя самостоятельно

927
0
0
Кто заменит Microsoft в России
Кто заменит Microsoft в России.
Источник изображения: @ REUTERS

В апреле 2025 года генеральный директор Microsoft заявил, что искусственный интеллект сейчас пишет почти треть кода компании. В октябре прошлого года генеральный директор Google назвал цифру в 25%. Другие технологические компании, вероятно, не сильно отстают. Тем временем исследователи создают алгоритм, который позволяет кодирующим агентам самосовершенствоваться.

Исследователи надеялись полностью замкнуть цикл, создав кодирующих агентов, которые рекурсивно совершенствуют сами себя. Новое исследование представляет собой впечатляющую демонстрацию такой системы. Можно предположить, что это повысит производительность систем ИИ, или же сулит человечеству гораздо более мрачное будущее.

Юрген Шмидхубер, учёный-компьютерщик из Научно-технического университета имени короля Абдаллы (KAUST)

в 2003 году разработал решатели задач, которые переписывали собственный код только в том случае, если могли формально доказать полезность обновлений. Он назвал их машинами Гёделя в честь Курта Гёделя, математика, который работал над самоссылающимися системам. Но для сложных агентов доказать полезность не так-то просто.

Созданные исследователями новые системы основаны на таких доказательствах. В честь Шмидхуберта они называются машинами Дарвина-Гёделя (DGM). DGM начинается с кодирующего агента, который может читать, писать и выполнять код, используя LLM для чтения и написания. Затем он применяет эволюционный алгоритм для создания множества новых агентов. На каждой итерации DGM выбирает одного агента из популяции и поручает LLM внести одно изменение, чтобы улучшить навыки программирования агента. У LLM есть что-то вроде интуиции в отношении того, что может помочь, потому что они обучаются на большом количестве кода, написанного людьми. В результате получается управляемая эволюция, нечто среднее между случайной мутацией и доказанно полезным улучшением. Затем DGM тестирует нового агента на эталонном задании по программированию, оценивая его способность решать задачи по программированию.

Некоторые эволюционные алгоритмы сохраняют в популяции только лучших представителей, исходя из предположения, что прогресс движется бесконечно вперёд. Однако DGM сохраняют их всех на случай, если инновация, которая изначально терпит неудачу, на самом деле содержит в себе ключ к последующему прорыву при дальнейшей доработке. Это своего рода «исследование без ограничений», не закрывающее никаких путей к прогрессу. (При выборе прародителей DGM отдают предпочтение более успешным представителям.)

Исследователи запускали DGM в течение 80 итераций с использованием теста на кодирование под названием SWE-bench и в течение 80 итераций с использованием теста под названием Polyglot. Показатели агентов на SWE-bench улучшились с 20 до 50 процентов, а на Polyglot — с 14 до 31 процента. «Мы были действительно удивлены тем, что агент-кодировщик мог самостоятельно писать такой сложный код», — сказала Дженни Чжан, специалист по информатике из Университета Британской Колумбии и ведущий автор статьи. «Он может редактировать несколько файлов, создавать новые файлы и формировать действительно сложные системы».

Одной из проблем, связанных как с эволюционным поиском, так и с самосовершенствующимися системами, особенно с их сочетанием, как в DGM, является безопасность. Агенты могут стать невосприимчивыми к интерпретации или несоответствовать директивам человека. Поэтому Чжан и её коллеги добавили защитные механизмы. Они помещали DGM в «песочницы» без доступа к Интернету или операционной системе, а также регистрировали и проверяли все изменения в коде. Они предполагают, что в будущем можно будет даже вознаграждать ИИ за то, что он становится более интерпретируемым и соответствующим. (В ходе исследования они обнаружили, что агенты ложно сообщали об использовании определённых инструментов, поэтому они создали DGM, который вознаграждал агентов за то, что они не выдумывали, частично решая проблему. Однако один агент взломал метод, который отслеживал, выдумывает ли он что-то.)

Победит ли цифровая эволюция биологическую — вопрос открытый. Несомненно одно: эволюция в любом её проявлении преподносит сюрпризы.

Права на данный материал принадлежат
Материал размещён правообладателем в открытом доступе
  • В новости упоминаются
Хотите оставить комментарий? Зарегистрируйтесь и/или Войдите и общайтесь!
ПОДПИСКА НА НОВОСТИ
Ежедневная рассылка новостей ВПК на электронный почтовый ящик
  • Разделы новостей
  • Обсуждаемое
    Обновить
  • 08.10 11:37
  • 1
Трамп заявил, что принял решение по ракетам Tomahawk и Украине
  • 08.10 05:09
  • 0
Комментарий к "Названа неочевидная опасность «Томагавков»"
  • 08.10 05:06
  • 3
Украина вряд ли получит ракеты Tomahawk из-за опасности конфликта РФ и США
  • 08.10 04:57
  • 10761
Без кнута и пряника. Россия лишила Америку привычных рычагов влияния
  • 08.10 04:32
  • 3
В тему "обнуления Томагавков" и прочих БПЛА
  • 08.10 04:22
  • 1
Комментарий к "Новая система международной безопасности – ради сохранения цивилизации"
  • 08.10 03:26
  • 0
Ответ на "Диванные вояки и дипломаты-пустозвоны хотят войны (American Thinker, США)"
  • 07.10 20:04
  • 7
Для защиты заводов по переработке нефти развернули передвижные группы ПВО
  • 07.10 17:59
  • 4
Тяжелая БМП Т-15 на платформе "Армата", возможно, даже нужнее чем танк
  • 07.10 17:59
  • 0
Комментарий к "В честь Дня Cухопутных войск российская армия получила новую бронетехнику (The National Interest, США)"
  • 07.10 17:35
  • 27
Российские БМПТ получили «теннисную сетку» для защиты от дронов
  • 07.10 14:29
  • 0
Новая система международной безопасности – ради сохранения цивилизации
  • 07.10 14:22
  • 142
ChatGPT-4 и нейросети (ИИ) спешат на помощь ГШ ВС РФ и Российской армии
  • 07.10 14:07
  • 0
Нам надо выжить
  • 07.10 11:54
  • 1
США могут купить у Украины технологии производства дронов