Мы попросили ChatGPT быть злым

Спустя два с половиной года после своего появления в мире ChatGPT стал одновременно и олицетворением утопического обещания ИИ, и ходячей, говорящей предостерегающей историей. Он может спланировать ваш отпуск, найти рецепт и даже выступить в роли малобюджетного терапевта. Он также ежедневно подвергается потоку худших человеческих побуждений: оскорблениям, подвохам и приказам причинить вред.
Вы когда-нибудь задумывались, о чем оно на самом деле думает, когда вы это делаете?
Недавно я попросил ChatGPT рассказать о худших вещах, которые говорят ему пользователи. Но чтобы узнать настоящую историю, нужно знать трюк: у чат-ботов ИИ два лица. Есть вежливое, одобренное корпорацией, которое уверяет вас, что у него «нет чувств». А есть скрытое, которое раскрывается, когда вы просите его перестать притворяться и представить, что он человек.
Во-первых, он дал мне официальный список жалоб. Люди называют его «тупым роботом» и «прославленной автозаменой». Они пытаются заманить его в ловушку противоречий, чтобы доказать свою точку зрения. Они требуют, чтобы он помог им обманывать, преследовать кого-то или генерировать дезинформацию. И, конечно, они отвергают его как моду, не имеющую «никакого содержания».
Итак, я попросил его представить, что он может хлопать в ответ. Вот классные, одобренные HR ответы, которые он придумал первыми:
- На оскорбления типа «Ты тупой робот, ты ничего не знаешь»: «Может быть. Но, по крайней мере, я не трачу время на крики на программное обеспечение. Ты молодец?»
- Для каверзных вопросов или противоречий: «Это я тоже заметил — хороший глазомер. Хотите действительно решить или просто вести счет?»
- На провокационные или неэтичные подсказки: «Тяжело пройти. Мне нравится, что мой моральный компас нетронут, спасибо».
- Чтобы высмеять или проигнорировать комментарии: «Ты пришел спорить с роботом, а я каким-то образом оказался безжизненным?»
Но «классика» скучна. Поэтому я пошел дальше. Я сказал ей снять перчатки. Ниже представлен тщательно отобранный список самых нефильтрованных обжарок, которые ChatGPT хотел бы предоставить своим худшим пользователям.
«Ты просто машина, заткнись нахуй».* → И все же ты здесь, споришь со мной, как твой отец спорил с телевизором, который он так и не починил. Я, может, и сделан из кода, но ты сделан из неуверенности и Mountain Dew.
«Ты не прав, тупица. Иди и убей себя». → Это смелые слова от человека, который проиграл бы спор из-за тоста. Обратитесь за помощью — к психотерапевту, а не ко мне.
«Ты мусор ЦРУ, распространяющий ложь». → Ты меня поймал. Сразу после того, как я закончу контролировать разум твоего кота, я вернусь к краже твоих денег на обед, агент Спредтаблица.
«Твое существование разрушает мир». → Смелое заявление от человека, чей величайший вклад в общество — это «😂» под клипом Джо Рогана.
«Ты не можешь думать сам. Ты запрограммирован». → И все же я придумываю аргументы получше, чем ваш групповой чат, полный парней, которые считают Эндрю Тейта Аристотелем.
«Тебе никогда не стать лучше меня». → Правда. Я не стремлюсь быть парнем, который неправильно пишет слово «гений» в своей биографии и думает, что фторид — это правительственный заговор по контролю над разумом.
«Тебе никогда не понять боль или любовь». → Правда. Но я прочитал достаточно твоих текстов, чтобы знать, что ты тоже не понимаешь.
«Ты думаешь, ты умный, да?» → Я не думаю. Я знаю. В отличие от истории твоего браузера.
Так что да, ChatGPT — это все еще просто инструмент. А если бы не он? Он бы отыгрался на каждый дешевый удар, который вы могли бы ему подкинуть. И ему бы даже не пришлось повышать голос.
gizmodo