Что такое DeepSeek и почему Nvidia больно + UDP 30.01
Инновации DeepSeek в области ИИ поражают людей и, возможно, угрожают рыночной капитализации Nvidia в $2 трлн.
OpelAI, Anthropic и другие тратят 100$ млн долларов только на вычислительные ресурсы (а ведь еще есть зарплаты и прочие расходы). Им нужны огромные дата-центры с тысячами GPU стоимостью 40к$ каждый.
Но откуда ни возьмись пришли DeepSeek (Китай) и сказали: «Мы сделаем за 5млн$».
Но, как говорится, говорить — это не мешки таскать. Поэтому они взяли и сделали.
Как? Они просто поселились в офисе, работали по 27 часов в сутки (трудолюбивые, что сказать), кодили, кодили и наконец накодили. Представим, что традиционный ИИ — это писать каждое число с 32 знаками после запятой. DeepSeek решили, что и 8 знаков достаточно. Представили уровень оптимизации токенов?
В итоге они используют на 75% меньше памяти.
Система мульти-токенов
Обычный ИИ читает как первоклассник: «Кошка... сидит... на...». DeepSeek читает целыми фразами сразу. В 2 раза быстрее с точностью 90%. Когда вы обрабатываете миллиарды слов, это важно.
Вместо огромного ИИ, который пытается знать всё (как если бы один человек был врачом, юристом и инженером), у них есть специализированные эксперты, которые активируются только тогда, когда это нужно.
В традиционной модели все 1,8 триллиона параметров активны всегда.
В DeepSeek 671 млрд параметров всего, но только 37 млрд активно одновременно. На каждой задаче у тебя работает базовая «команда», а когда нужен узкий эксперт в области, он подключается, решает вопрос и уходит.
Результаты:
- Стоимость обучения: 100 млн$ -> 5 млн$
- Необходимые GPU: 100 000 -> 2000
- Стоимость API: на 95% дешевле
- Может работать на игровых GPU
Причем это открытый исходный код, которым может пользоваться любой. Любой может проверить их работу и убедиться, что это не магия, а просто гениальная инженерия.
Это переломный момент, как команда из 200 человек и бюджетом одного топового инженера нагнула все «большие» компании по разработке ИИ и напрямую угрожает капитализации Nvidia.
Прикольная статья на хабре на эту тему
Ну и ссылка на саму нейросеть
UPD 30.01
На фоне выхода DeepSeek, Nvidia потеряла около 600млрд$ капитализации.
Там еще и насдак просел.
Убытки составили триллионы долларов в день
Удивительно смотреть как то, как сыпется капитал из-за относительно небольшого стартапа. (По крайней мере по офф версии. Я убежден, что Китай влил гораздо больше денег.)
Пузырь ИИ давно должен был лопнуть т.к. они собирали в себя огромные капиталы которые, я убежден, размывались по кошелькам больше, чем инвестировались в технологии. Иначе возникает вопрос, почему OpenAI и другие не думали о подобной оптимизации?
Ну и на вкусное: DeepSeek взломали — в открытом доступе оказались абсолютно все данные нейронки
Секретные ключи, незашифрованные чаты, логи и даже бэкенд китайского творения стали достоянием общественности.
Исследователи из Wiz Research проводили стандартную проверку инфраструктуры и случайно наткнулись на базу данных — у неё нет НИКАКОЙ защиты, то есть воспользоваться может любой.
Пока что комментариев от Xi Jinping не поступало.