Объясняем ИИ бабушке на фотографиях в WhatsApp

Бабушка пытается разглядеть детали на фотографии в вотсапе.
Бабушка пытается разглядеть детали на фотографии в вотсапе.

Звоним бабушке

- Юрочка, я сегодня слушала передачу про искусственный интеллект!

- Бабушка, в слове "искусственный интеллект" есть две ошибки. Первая - искусственный, вторая - интеллект...

Мой сегодняшний разгон бабушке 77 лет от роду (здоровья ей крепкого) про отличия ИИ от LLM.

Отделям мух от котлет

Упомянем, что никакого ИИ человечество ещё не изобрело.

Маркетологи продают нам LLM (Large language model, то есть большие языковые модели), построенные на архитектуре трансформеров и MCP (Model context protocol - поставщики данных, ходилки в Интернет и интерпретаторы Python) в качестве нового чуда советского ракетостроения - целого Искусственного Интеллекта, обладающего агентностью и захватывающего мир уже с понедельника, ну или давайте уже после майских.

Конторы с переднего края прогресса вроде OpenAI и Anthropic даже изобрели отдельный маркетинговый термин для тру-ИИ - AGI (Artificial general intelligence), к которому они стремятся, и постулируют они его двумя путями:

- С цифрами - AGI должен заработать хотя бы 100 миллиардов долларов.

- И без цифр - AGI должен быть лучше человека в большинстве экономически значимых задач.

Дядя Сэм пяткой в грудь себя бьёт, мол знаем, как его построить.
Дядя Сэм пяткой в грудь себя бьёт, мол знаем, как его построить.

"Planning for AGI and beyond" от OpenAI:

Cрываем покровы на ***чих шакалах

А теперь объясняем наконец, что такое этот ваш LLM и почему верить ему нельзя (но ни мы, ни бабушка никуда не денемся).

Показываем бабушке свою фотку в WhatsApp и зумим какую-нибудь деталь на фоне. Видим кашу из пикселей. Следом открываем оригинал фотки, зумим и прекрасно разглядываем искомую деталь. Киваем.

Вот оно. Сжатие с потерями.

Человечество давно научилось сжимать отдельные виды данных. Изображения и музыку. Таким образом, что даже на ужатой в шакалов картинке внука видно, и в целом даже в 128 Кб/с Пугачева поёт вполне сносно.

Но с текстом поначалу не пошло.

Мужчины с 5.2 по коэффициенту Вайсмана что-то знают об этом.
Мужчины с 5.2 по коэффициенту Вайсмана что-то знают об этом.

Тексты до недавнего времени мы умели сжимать только без потерь, а у такого сжатия есть физический лимит размера. 3 Мб текста Войны и мира превращаются в 1 Мб. Но не в 100 Кб. Нельзя выбросить все сноски с переводом французского из книги, её же читать будет невозможно.

LLM по сути своей - это способ исполнить давнюю мечту - сохранить Интернет у себя дома. Взять все страницы и тексты, до которых дотянемся, и сжать ещё больше. Как-то умно выбросить из них шелуху, сохранив главное.

Морфеус пророчит. 
Морфеус пророчит. 

Для бабушки. ИИ в новостях - это LLM, в нём нет никакого интеллекта. А LLM - это просто сжатый с потерями Интернет.

Только хуже.

LLM прекрасно обучаются на паттерны - она запомнит формат, в котором нужно писать номер законодательного акта, но может не запомнить сам номер. И когда бабушка спросит ChatGPT, по какому закону сосед по СНТ не имеет права отрезать 4 квадратных метра чужого огорода, ChatGPT не скажет "я не знаю", ChatGPT ответит твёрдо и чётко - случайным и правдоподобно выглядящим набором чисел вроде N 228-ФЗ.

А теперь представьте вопрос от бабушки к "ИИ" вроде "лекарство от сердца при высоком давлении" при реальной необходимости и взвесьте цену ошибки.

Проблема в том, что текущие модели настолько большие, и галлюцинации настолько серьёзно побороли, что LLM отвечает на вопрос верно слишком часто. Пока не ошибется.

LLM просто выдает следующее слово на текущую последовательность. Она не "думает" (даже когда модель "думающая"). И сколько к ней не прикручивай доливалок данных в запрос из результатов первой страницы в Яндексе и дергалок за ручки, мышки и клавиатуры пользователя - интеллектом это не становится. Она мимикрирует под него ровно так же, как разговаривает попугай по-человечьи.

Заключение

Дамы и господа, не давайте бабушке лекарства у Алисы спрашивать.

Всем бобра!

P.S. Выдающиеся 3 часа и 30 минут от Андрея Карпаты для искателей интеллекта:

Deep Dive into LLMs like ChatGPT

Реокмендасьон.

29
5
1
1
1
62 комментария