Что такое DeepSeek и почему Nvidia больно + UDP 30.01

Что такое DeepSeek и почему Nvidia больно + UDP 30.01

Инновации DeepSeek в области ИИ поражают людей и, возможно, угрожают рыночной капитализации Nvidia в $2 трлн.

OpelAI, Anthropic и другие тратят 100$ млн долларов только на вычислительные ресурсы (а ведь еще есть зарплаты и прочие расходы). Им нужны огромные дата-центры с тысячами GPU стоимостью 40к$ каждый.

Но откуда ни возьмись пришли DeepSeek (Китай) и сказали: «Мы сделаем за 5млн$».

Но, как говорится, говорить — это не мешки таскать. Поэтому они взяли и сделали.

Как? Они просто поселились в офисе, работали по 27 часов в сутки (трудолюбивые, что сказать), кодили, кодили и наконец накодили. Представим, что традиционный ИИ — это писать каждое число с 32 знаками после запятой. DeepSeek решили, что и 8 знаков достаточно. Представили уровень оптимизации токенов?

В итоге они используют на 75% меньше памяти.

Система мульти-токенов

Обычный ИИ читает как первоклассник: «Кошка... сидит... на...». DeepSeek читает целыми фразами сразу. В 2 раза быстрее с точностью 90%. Когда вы обрабатываете миллиарды слов, это важно.

Вместо огромного ИИ, который пытается знать всё (как если бы один человек был врачом, юристом и инженером), у них есть специализированные эксперты, которые активируются только тогда, когда это нужно.

В традиционной модели все 1,8 триллиона параметров активны всегда.

В DeepSeek 671 млрд параметров всего, но только 37 млрд активно одновременно. На каждой задаче у тебя работает базовая «команда», а когда нужен узкий эксперт в области, он подключается, решает вопрос и уходит.

Результаты:

- Стоимость обучения: 100 млн$ -> 5 млн$

- Необходимые GPU: 100 000 -> 2000

- Стоимость API: на 95% дешевле

- Может работать на игровых GPU

Причем это открытый исходный код, которым может пользоваться любой. Любой может проверить их работу и убедиться, что это не магия, а просто гениальная инженерия.

Это переломный момент, как команда из 200 человек и бюджетом одного топового инженера нагнула все «большие» компании по разработке ИИ и напрямую угрожает капитализации Nvidia.

Прикольная статья на хабре на эту тему

Ну и ссылка на саму нейросеть

UPD 30.01

Акции <b>NVIDIA</b> 30.01.2025
Акции NVIDIA 30.01.2025

На фоне выхода DeepSeek, Nvidia потеряла около 600млрд$ капитализации.

Nasdaq
Nasdaq

Там еще и насдак просел.

Реакция мирового капитала.
Реакция мирового капитала.

Убытки составили триллионы долларов в день

А че такое?
А че такое?

Удивительно смотреть как то, как сыпется капитал из-за относительно небольшого стартапа. (По крайней мере по офф версии. Я убежден, что Китай влил гораздо больше денег.)

Пузырь ИИ давно должен был лопнуть т.к. они собирали в себя огромные капиталы которые, я убежден, размывались по кошелькам больше, чем инвестировались в технологии. Иначе возникает вопрос, почему OpenAI и другие не думали о подобной оптимизации?

Ну и на вкусное: DeepSeek взломали — в открытом доступе оказались абсолютно все данные нейронки

Что такое DeepSeek и почему Nvidia больно + UDP 30.01

Секретные ключи, незашифрованные чаты, логи и даже бэкенд китайского творения стали достоянием общественности.
Исследователи из Wiz Research проводили стандартную проверку инфраструктуры и случайно наткнулись на базу данных — у неё нет НИКАКОЙ защиты, то есть воспользоваться может любой.
Пока что комментариев от Xi Jinping не поступало.

7
99
11
163 комментария

Вы там все у китайцев на зп сидите что-ли? Куча однотипных постов плодите на тему синего кита (запрещён в РФ). :)

53
7
1

Так блядь по факту же, нейронка, с мощностью 4о и о1 со своим р1 стоит дешевле оных многократно. Об этом пишут все дрочеры нейронок, кому не лень. Если конкретно ты сидишь лишь на дтф и из нейронок знаком только чатом гпт и чем то ещё для картинок, то это не значит что в мире нейросетей происходит тотальный пиздец, с одной стороны одни обещают мега ии с дата центрами в пол триллиона, другие вкладывают сотни миллиардов и обещают столетие научных открытии за несколько десятилетии и аги к 30 годам, третьи, как китайцы, из-за ограничения в железе пытаются вывозить за счёт алгоритмов и кода. Это же ахуенно, максимальная конкуренция, при котором в итоге выиграет наиболее эффективные, так в конце ещё и объеденит в себе все лучшие решения

32
1

Запрещён в РФ, а где сотрудничество с Китаем и тёплые отношения? Опять Путин писдит?

3
2

Да нет, просто нейронка правда вроде неплохая и конкурентноспособная, вот народу и интересно. Особенно в России где платный GPT считай недоступен, как и многие другие модели, а отечественные, скажем так до того же GPT недотягивают. А тут им подгон от китайцев такой.

2

Мда, а когда весь дтф засрали постами про пожары в калафорнии все норма было?

Ну Alipay у меня есть