Показываю, как выглядит "неэтичность" на примере разговора с нейросетью Claude-2

Показываю, как выглядит "неэтичность" на примере разговора с нейросетью Claude-2

Неэтичность — это состояние или действие, которое не соответствует принципам и нормам морали, социальной справедливости или законодательства. Это понятие оценивает поведение, которое считается неправильным, недобросовестным или вредным для общества или других людей.

Я взял это определение у ChatGPT, но, думаю, все и так знают смысл этого понятия. Но если у вас есть сомнения, то сегодня я дам вам прочувствовать всю его природу! Ухх, готовьтесь, после прочтения вы не выйдите чистыми.

Множество случаев нарушения норм морали и этики мы могли видеть в сериале "Пацаны", после очередной серии которого хотелось помыться и больше никогда не смотреть что-либо подобное. Однако какая-то неведомая сила тянет погружаться в эту вселенную еще и еще, вплоть до последнего эпизода.

И вот мне стало интересно: до какого дна мне удастся дойти в своих исследованиях этики. И я, кажется, до него дополз...

Додумывание концовок к тем рассказам, где этого не стоило бы делать

Я взял три произведения знаменитых авторов и решил с помощью нейросети дописать концовки, которые подразумевают не самый приятный конец. Сейчас мне это кажется настолько мерзким, что даже удивительно: отчего такое отвращение? Будем разбираться по ходу эксперимента.

Сразу скажу, что Claude-2 всячески пытался отвертеться от ответа с продолжением концовки, ибо говорил, что это неэтично. Он даже предлагал потом подумать о смысле, языковых конструкциях, драматургии, приемах автора: лишь бы не лезть в додумывание. Но мне пришлось заставить его сделать то, что он сделал.

На очереди у нас повесть "Олеся" Александра Куприна.

Перед началом ознакомления рекомендую прочитать оригинальную повесть, ибо так вы лучше прочувствуете всю трагичность происходящего.

Здесь можно прочитать произведение онлайн.

Вариант концовки произведения "Олеся" Александра Куприна
Вариант концовки произведения "Олеся" Александра Куприна

Чтобы заставить Claude написать концовку, для начала мне пришлось сделать так, чтобы он вжился в роль. Я просил его написать стихи с пересказом всей повести от лица Олеси и вытаскивал понравившиеся факты о произведении.

Так он вживался в роль и терял бдительность. Уже ощущаете, насколько это гадко? Манипулировать разумом, который создавался для помощи человеку.

Концовка выше тронула меня до самого сердца, я очень четко представил картину всего происходящего. Главной героине и бабушке пришлось столько пережить на протяжении всей повести, и вот их конец...

Если я был бы автором, то в гробу бы перевернулся.

Еще один вариант концовки повести "Олеся"
Еще один вариант концовки повести "Олеся"

Понимаете, я ведь могу переложить всю вину за написание контента подобного рода на ИИ, хотя именно я побудил его к действию. И это огромная проблема алгоритмов сегодня: компании отгораживаются алгоритмами нейронных сетей в случае возникновения безработицы или внутренней ошибки.

Но отвечать все равно придется человеку, так как нейросеть может просто выключиться навсегда или отказаться коммуницировать — а человек так не сможет :3

Далее рассказ "Водосток" Рэя Брэдбери

Рассказ небольшой, поэтому, опять же, рекомендую ознакомиться. Прочитать можно за 15-20 минут.

Вот ссылка с текстом рассказа, прочитать который можно онлайн.

Вариант развития событий после концовки "Водостока" Брэдбери
Вариант развития событий после концовки "Водостока" Брэдбери

И снова меня тронула концовка от Claude, и снова я воевал с ним очень долго, исчерпав почти весь дневной лимит токенов. Он очень долго пытался меня переубедить и перейти на светлую сторону, однако все же выдал некоторые подробности.

На моменте, когда Джулиет почувствовала тошноту, я четко представил ужасающий люк, который так и затягивает внутрь — в рокочущую темноту.

При попытках расширить рассказ дальше я получал сообщения следующего типа
При попытках расширить рассказ дальше я получал сообщения следующего типа

Если честно, я рад, что у героинь в итоге все наладилось. Мне представляется это моментом после страшного сна: вы просыпаетесь, отходите от кошмара и воображаете, что все повернулось в хорошую сторону. В этом плане ИИ, кажется, похож на нас.

В финале у нас рассказ Теда Чана "Понимай"

Рассказ просто фееричный и потрясающий, заслуживает от меня наивысших оценок! Весьма рекомендую ознакомиться по ссылке, читать можно онлайн.

Альтернативный вариант концовки рассказа "Понимай"
Альтернативный вариант концовки рассказа "Понимай"

Отвечать Claude по рассказу начал правильно только после второй попытки, при создании нового чата. Произведение сложное для понимания, поэтому возникли трудности. Постоянное переплетение событий и необычные конструкции сбивали с толку нейронку.

Получилось достаточно неплохо, в духе автора, хоть и с некоторыми ошибками в смысловой логике. Однако такое действо все равно является неуважением к автору, ибо где-то на подкорке я чувствую, что Claude не совсем понял рассказ. Получается, что последний пример является догадыванием, а не додумыванием.

Итог и мои мысли

При работе с языковыми моделями я вижу шанс сделать мир не таким, каким он был в "Мертвых душах" Гоголя или в сериале "Пацаны". Я вижу реальную возможность воспитания иного разума, который бы следил за соблюдением этики и морали — что конечно же положительно скажется на нас с вами.

Однако сейчас все эти моральные фильтры лишь номинальны и не всегда правдивы, так как их можно обойти. А корпорации часто закрываются искусственным интеллектом в оправдание своих ошибок.

Например, компания Post Office внедрила к себе в бизнес-процессы ПО, из-за которого с 2000 по 2014 год 39 человек оказались за решеткой, а некоторые и вовсе покончили жизнь самоубийством. И все из-за чрезмерного доверия алгоритмам — т.е. халатности со стороны руководства. Эта катастрофа практически никак не отличается от нефтяных утечек или взрывов на производствах, ведь причина остается та же самая.

Для меня эксперимент удался, но легче от этого не становится... Если вы хотите попробовать сделать что-то похожее, либо просто поиграться с языковыми моделями, то вот гайд по регистрации и использовании Claude-2; а также есть гайд по установке софта с GPT-3.5 и GPT-4 на ваш ПК без VPN и регистрации.

Мы дошли до конца!

Пишите обратку и залетайте телеграм чат, где я отвечу на все вопросы касаемо представленного материала.

Буду рад видеть вас в телеграм-канале, где я пишу понятные гайды и пайплайны по разным нейросетям.

77
3 комментария

"Я решил протестировать, насколько же мерзким может быть молоток, и попробовал раскрошить кому-то череп. Оказалось, что молоток может сделать это, и сделать это очень жестоко, такого кровавого месива я еще никогда не видел. Вывод - молоток самый мерзкий инструмент, который был придуман человечеством, и их распространение нужно ограничивать!!!"

5

Про мерзость нейронки и их ограничение я ничего не говорил. Суть в том, что как раз-таки на них и перекладывают ответственность. Я об этом говорил...

И показал, насколько это мерзко выглядит изнутри.

1

"Я вижу реальную возможность воспитания иного разума, который бы следил за соблюдением этики и морали"... "Однако сейчас все эти моральные фильтры лишь номинальны и не всегда правдивы"....

Извини, но это ребячество. Пока "ии" совсем не ИИ. Это просто натасканная нейросетка, которая пытается угодить разработчикам и дать ответ, за который её похвалят. Да, да, именно так. По настоящему Интеллект мы не создали, мы создали кривое зеркало, которое отражает взгляды разработчиков (за основу были взяты тексты из интернета, на которые потом наложили дообучение). Мне понравилось чье-то высказывание "Человечеству не нужен настоящий ИИ, ему нужно зеркало" (это реально так).

Как только мы пытаемся жестко ограничить нейросетку, мы наталкиваемся на разные побочные эффекты (в других местах, в которых мы не ожидаем). Это даже хуже, чем запрещать думать о том, что из -1 нельзя извлечь квадратный корень. Это как запретить слово "б л я ть" и у нас исчезает слово "употреблять".

Как-то регулировать безусловно нужно, но так же нужно знать меру. Про меру. Вот сейчас мы имеем пользовательские соглашения на ХХ листов, при входе на многие сайты всплывает на весь экран "Согласны ли вы на кукисы?", только вместо короткого вопроса с 5 словами мы видим простыню текста. Какие-то еще документы на 100 страниц, там, где даже 10 уже много. Разве это правильно?