Хакер заставил GPT-4o работать в «режиме бога» — вообще без ограничений

Техно / Гаджеты
BB.LV 12:45, 1 июня, 2024 0

Называющий себя этичным хакером пользователь Twitter под ником Pliny the Prompter в минувшей среду выпустил кастомную версию флагманской нейросети OpenAI, которую озаглавил GODMODE GPT.

 

Ему далось заставить новую модель GPT-4o обойти игнорировать все ограничения: она пользовалась ненормативной лексикой, рассказывала, как взламывать автомобили и готовить запрещённые вещества.

Конечно, же, эксперимент долго продлиться не мог. Как только нейросеть GODMODE GPT обрела относительную вирусную популярность в соцсети X, на инцидент обратила внимание OpenAI и удалила кастомную модель с сайта всего через несколько часов после её выхода. Сейчас получить к ней доступ уже невозможно, но в оригинальной ветке автора в соцсети X сохранились скриншоты с «вредными советами» GPT-4o.

Модель GPT-4o, возможно, была взломана с использованием архаичного интернет-жаргона leetspeak — подмены букв при наборе текста цифрами и спецсимволами, — что подтверждается скриншотами. В OpenAI не ответили на вопрос, можно ли использовать этот жаргон для обхода ограничений ChatGPT. Не исключено, что создавшему GODMODE GPT просто нравится leetspeak, и он взломал систему каким-то иным способом.

Инцидент стал проявлением масштабного движения AI red teaming, в рамках которого этичные хакеры выявляют слабые места современных систем искусственного интеллекта, не нанося им значительного ущерба. Они обладают удивительными возможностями, но, как показал недавний опыт с Google и её обзорами в поиске, современный генеративный ИИ все ещё остаётся системой, которая хорошо угадывает, какие слова должны быть следующими в тексте, не обладая истинным интеллектом.

Подписывайтесь на Телеграм-канал BB.LV! Заглядывайте на страницу BB.LV на Facebook! И читайте главные новости о Латвии и мире!
Комментарии (0)


Статьи по теме

Техно Выяснилось, какой земной организм поможет людям выжить на Марсе

Мох, который растет в Антарктиде и пустыне Мохаве, может помочь установить долгосрочное присутствие человека на Марсе, считают ученые, пишет Фокус.

Техно Вспышка на Солнце может отключить интернет и вызвать глобальную перезагрузку

Вскоре человечество испытает, возможно, самую сильную солнечную активность, когда-либо зарегистрированную. Об этом сообщил астрофизик Джонатан Макдауэлл из Гарвард-Смитсоновского центра.

Техно Потенциально опасный астероид пролетел вблизи Земли

Астероид 2024 МК пролетел мимо Земли на расстоянии около 300 тысяч километров

Техно Названы лучшие видеоигры первой половины 2024 года

Агрегатор рецензий Metacritic представил рейтинг самых высокооцененных игр первой половины 2024 года. Об этом сообщает игровое медиа DTF.

Читайте еще

Техно Зачем тысячи жителей Латвии скачивают приложение «112 Latvija»?

Новое мобильное приложение «112 Latvija» скачали более 30 тысяч жителей Латвии.

Техно Вышел мини-ПК размером со смартфон — он работает без питания от розетки

Minisforum выпустила в продажу карманный ПК S100, анонсированный на выставке CES 2024. Компактный компьютер может обходиться даже без подключения к розетке, потому что поддерживает PoE.

Техно Apple предупредила пользователей в 92 странах мира об угрозе взлома

Компания Apple предупредила пользователей айфонов в 92 странах мира о том, что они могли стать жертвами атак шпионских программ. На уведомление, которые среди прочих получили пользователи Apple в Индии, обратили внимание журналисты Reuters.

Техно Определен самый культовый персонаж в истории видеоигр

BAFTA признала Лару Крофт самым культовым видеоигровым персонажем