Поддержать команду Зеркала
Беларусы на войне
  1. На БелАЭС сработала сигнализация — второй энергоблок отключили от сети
  2. Евросоюз согласовал 18-й пакет санкций против России и Беларуси
  3. Поймали таинственного зверя, пугавшего жителей Сеницы и Прилук
  4. «Однозначно установить запрет на использование». Нацбанк объявил, что хочет ввести очередное ограничение — какое на этот раз
  5. Новые санкции окажут дополнительное влияние на российскую экономику, которая и так с трудом справляется с вызовами войны — ISW
  6. Из России приходят новости, которые способны ударить по валютному рынку Беларуси. Но это далеко не все возможные проблемы для Минска
  7. Люди танцевали, не подозревая о нависшей над ними смерти. Одна из крупнейших инженерных катастроф убила 114 человек — вот ее история
  8. Мобильные операторы вводят изменения. Клиентам дали несколько дней, чтобы перейти на новые услуги
  9. ГУБОПиК случайно раскрыл новую базу «политических», по которой проверяет беларусов. Вот что о ней узнало «Зеркало»
  10. «Почему он у вас с наручниками не ходит». На совещании у Лукашенко произошла перепалка с участием чиновников и самого Лукашенко
  11. Силовики расширили географию поиска участников протестов 2020 года. Их интересуют выходившие на марши в еще одном городе
  12. «А мне воняет не гарью, а кошачьим туалетом». Беларусы возмущаются, что пакеты в магазинах неприятно пахнут. Объясняем почему
  13. Санкции ЕС против Беларуси: Эмбарго на импорт вооружений, четыре банка и восемь предприятий ВПК — «в бан»


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.