GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный интеллект подошел к черте его безопасного применения?

Грег Брокман пытался убедить зрителей <a href="https://api.dtf.ru/v2.8/redirect?to=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DoutcGtbnMuQ&postId=1696445" rel="nofollow noreferrer noopener" target="_blank">лайв-стрима</a> с презентацией GPT-4, что новая модель нейросети – это в первую очередь круто, а не страшно
1.1K

У меня есть вопросики вот к этой части статьи:

"То есть, 32 тысячи токенов – это примерно 24-25 тысяч английских слов, или 50 страниц текста (сравните с 12 страницами, которые раньше составляли максимальный лимит подачи промпта на вход модели). Получается, теперь в модель можно за раз подать, например, всю документацию проекта, или целиком главу учебника, и потом задавать по ним вопросы – а модель будет «читать» сложный и длинный комплексный текст, и отвечать по материалу (с учетом всех взаимосвязей между разными частями текста)."

Я уже пару дней пытаюсь скормить GPT4 расшифровку (субтитры) к лекции, чтобы задать вопрос по теме. Ну русском она может скушать хорошо если 3-4 минуты. А на английском даже 10 не получается.

Опыт провожу так:
1. Беру рандомное видео (50 минут) https://youtu.be/ik9t96SMtB0?list=PL8YZyma552VcePhq86dEkohvoTpWPuauk
2. Скачиваю и английские и русские субтитры (SRT) с помощью https://downsub.com/
3. Начинаю новый чат, выбираю версию 4. Скармливаю кусок английского текста, задаю вопрос (по английски) по теме лекции.
4. Размер текст проверяю тут https://wordmeter.ru/ Параметры конкретного текста: ЗНАКОВ БЕЗ ПРОБЕЛОВ 63575
ЗНАКОВ С ПРОБЕЛАМИ 76131
СЛОВ 8076
ПРЕДЛОЖЕНИЙ 3192

Что я делаю не так?

Стандартная версия - только до 8к токенов (хотя и это аж в 4 раза больше, чем было у предыдущей версии).
32к отдельная версия за дополнительную плату (запросы к ней в несколько раз дороже стоят)

1

ЗНАКОВ БЕЗ ПРОБЕЛОВ 63575если это русские символы, то тут больше 70 тыщ токенов - а окно в диалоговом режиме 8к токенов.