Как нейросети постепенно засрут интернет (а точнее уже засрали)

Год назад я наткнулся на статью, которая предсказывала деградацию нейросетей и автор приводил интересную теорию:

● Нейросети обучаются на контенте из интернета, который по большей части делает человек.

● Качество итоговой работы нейросети на данный момент ниже, чем оригинальный контент живого автора. Логические и смысловые ошибки, а так же некое "отсутствие души".

● Несмотря на это, нейросети массово используют для создания контента. Растет количество некачественных материалов в интернете и нейросеть начинает брать эти данные для обучения.

● Из-за общего снижения качества "скармливаемой" информации, нейросеть начинает тупить, все чаще повторяя свои же ошибки и неточности.

Вот недавно я решил поиграть в Kenshi, вспомнить лор и почитать информацию о фракциях. И первая же статья которую мне выдает поиск Яндекса выглядит так:

▸ Я может быть какое то обновление пропустил, но про "Сеть" в Кенши не слыхал
▸ Я может быть какое то обновление пропустил, но про "Сеть" в Кенши не слыхал

Увидев этот странный текст, я из интереса перешел по ссылке, а там безумие в чистом виде!

▸ Даже в Kenshi есть свой филиал "Без баб"
▸ Даже в Kenshi есть свой филиал "Без баб"
▸ А как вам такое? Холодные осадки в Kenshi осознали себя и из погодных условий превратились во фракцию
▸ А как вам такое? Холодные осадки в Kenshi осознали себя и из погодных условий превратились во фракцию
▸ А Шеки решили позабыть свой культ битвы и стать торговцами тех-охотниками
▸ А Шеки решили позабыть свой культ битвы и стать торговцами тех-охотниками

Для тех кто еще не понял - эта статья написана нейросетями!

Написана убого, коряво, без намека на логику, но с нужными SEO элементами - тот самый информационный мусор. А самое забавное, что мусор вынесен на первую позицию поисковой выдачи Яндекса. Да что там, 5 из 15 ссылок на первой странице поиска вели на такие же плоды нейросетей разной степени бредовости.

И в этом ключевая проблема нейросетей - слишком высокая скорость генерации контента. Она априори будет выше, чем создание уникального контента от живого автора. Ужасное качество итогового продукта меркнет на фоне человеческой жадности и лени.

Какая задача у информационного контента в 21 веке? Решить проблему пользователя? Нет - привлечь трафик и желательно здесь и сейчас, ведь трафик это деньги. Поэтому количество такого контента будет расти в геометрической прогрессии.

Масштаб проблемы и как она будет решаться в будущем?

На мой взгляд ключевой момент - это умение отличать материалы живого человека и материалы сделанные нейросетью. И я говорю даже не про умение пользователя, а про умение машинных систем.

● Для самих нейросетей встает вопрос обучения. Chat-GPT потребляет информацию из интернета и недавно с него сняли ограничения 2021 года (все что вышло позже этой даты нейросеть не учитывала). Если на системном уровне не будет фильтра, то в обозримом будущем качество ответов заметно упадет, ведь они будут составляться на основе ошибочных материалов созданных нейросетью до этого.

● Google, Яндекс и другие поисковики в какой то момент столкнутся с недоверием аудитории, ведь перестанут решать основную задачу пользователя - поиск полезной информации. Пока что их инструменты оценки качества контента слишком примитивны, что доказывает пример приведенный в начале статьи (1/3 выдачи поиска загажена мусором нейросетей). Единственный возможный критерий отбора доступный в данной ситуации - отдавать приоритет оригинальным статьям от живого автора.

А что в итоге?

Я пишу эту статью для того, чтобы люди более критично относились к информации в интернете и поддерживали живых авторов. Экспертного контента в сети все меньше и нельзя позволить ему утонуть под лавиной бреда нейросетей. В конце концов за ошибкой человека стоит мыслительный процесс, а за ошибкой нейросети - случайный алгоритм. И пока что к человеку доверия больше, чем к машине.

Ждем, когда техно-жрецы найдут решение этой проблемы и оно вскроет еще десяток других. А пока подписывайся на мой гоблинский блог - тут много интересного про разработку игр и нейросети.

P.S. По поводу моего месячного отсутствия. Несмотря на навалившийся ворох дел - я не забрасывал изучение инструментов для разработки игр. Просто написание статьей не вписывалось в мое плотное расписание. В ближайшие пару недель постараюсь выложить новую статью про Godot.

ВСЕМ WAAAGH!

Как нейросети постепенно засрут интернет (а точнее уже засрали)
29
54 комментария