«Они смогли в тысячу раз дешевле сделать все то, что казалось очень дорогим, — обучение нейросети. Как они это сделали — отдельный вопрос», — говорят эксперты «БИЗНЕС Online» о прорыве китайской компании DeepSeek, которая выпустила новую ИИ-модель R1, чем обрушила капитализацию крупнейших американских гигантов. То, на что OpenAI, создавшая ChatGPT, тратит десятки миллиардов долларов, китайцы сделали всего за $6 миллионов. Это ставит под сомнения необходимость огромных денежных вливаний в инфраструктуру ИИ и, возможно, ударит по бизнес-модели производителей чипов. Подробнее — в материале «БИЗНЕС Online».
DeepSeek выпустила бесплатную большую языковую модель, на создание которой, по словам представителей компании, ушло не больше $6 миллионов
Как китайцы хакнули систему
Что бы ты ни делал хорошо, всегда найдется азиат, который сделает это лучше. Такой шуткой можно кратко описать причину нынешней шумихи на американском ИИ-рынке. На прошлой неделе китайская компания DeepSeek выпустила свою передовую размышляющую ИИ-модель R1. По многим параметрам она обошла модель о1 от американской компании OpenAI — разработчика известного во всем мире чат-бота ChatGPT. Примечательно, что китайская ИИ-модель имеет открытый исходный код, абсолютно бесплатна и работает в России без каких-либо ограничений.
Но главное — китайцам удалось сделать все это за гораздо меньшие деньги, чем OpenAI. И такое на фоне новостей о том, что в США три компании — OpenAI, SoftBank и Oracle — запустят совместное предприятие Stargate, которое инвестирует в развитие искусственного интеллекта рекордные $500 миллиардов. Об этом объявил новый президент Соединенных Штатов Дональд Трамп. Stargate называют новым «Манхэттенским проектом». К слову, реальный Манхэттенский проект стоил дешевле — примерно $30 млрд в пересчете на нынешние деньги.
R1 — новейшая рассуждающая модель от китайской ИИ-лаборатории DeepSeek. Имеет открытый исходный код, т. е. любой разработчик может взять базовую кодовую базу, адаптировать ее и даже доработать под свои нужды. Количество параметров в модели DeepSeek R-1 может варьироваться от 5 млрд до 671 миллиарда.
Это рассуждающая модель, т. е. чат-бот перед основным ответом показывает цепочку своих рассуждений. Модель демонстрирует высокие результаты в тестах на математическое рассуждение — способна решать сложные задачи, требующие не только вычислений, но и понимания контекста. Также она умеет писать код, хорошо справляется с вопросами, связанными с физикой, химией и другими науками. Доступна для локального запуска — ее можно использовать без подключения к интернету.
И тут DeepSeek выпускает бесплатную большую языковую модель, на создание которой, по словам представителей компании, ушло не больше $6 миллионов. При этом американцы ограничивают Китай в поставках передовых ИИ-чипов. Для своей модели DeepSeek использовала чипы NVIDIA H800 c урезанными возможностями. Зарубежные СМИ ранее писали, что OpenAI потратила около $7 млрд на обучение языковых моделей и еще $1,5 млрд на персонал, а ее операционные убытки могут достигать $5 миллиардов.
Акции американского производителя графических ускорителей NVIDIA подешевели почти на 14%, ценные бумаги Microsoft потеряли 4,4%
Как американский рынок отреагировал на прорыв китайцев
Рынок отреагировал на прорыв китайцев бурно. Успех китайского стартапа в сфере ИИ вызвал у инвесторов сомнения в суммах, потраченных американскими технологическими гигантами на производителей чипов, пишут западные СМИ и эксперты. Американский производитель графических ускорителей NVIDIA, которого называют монополистом на рынке GPU, потерял почти $500 млрд капитализации. Акции компании подешевели практически на 14%.
Падают и акции других технологических компаний: ценные бумаги Microsoft потеряли 4,4% на премаркете, тайваньской TSMC — 8,3%, производителя чипов ARM — 8,2%, Qualcomm — 2,4%, японского производителя чипов Advantest — на 8,6% к закрытию торгов 27 января, Tokyo Electron — на 4,9%.
«Новая модель DeepSeek очень впечатляет с точки зрения того, насколько эффективно они создали модель с открытым исходным кодом, которая выполняет вычисления во время логического вывода и является высокоэффективной, — отметил генеральный директор Microsoft Сатья Наделла на Всемирном экономическом форуме в Давосе. — Мы должны очень серьезно относиться к разработкам в Китае».
В Сан-Франциско руководители и сотрудники OpenAI в срочном порядке изучают технологию DeepSeek, пишет Bloomberg. «По словам людей, знакомых с ситуацией, которые говорили на условиях анонимности, чтобы обсудить личные вопросы, некоторые сотрудники OpenAI пытаются понять, как именно DeepSeek смогла выпустить такую модель. Другой человек поделился, что в компании есть ощущение, что OpenAI нужно очень серьезно относиться к разработкам китайских компаний, поскольку это дает возможность внедрять инновации и улучшать существующие модели. Генеральный директор OpenAI Сэм Альтман недавно сказал сотрудникам, что данный релиз знаменует собой серьезный сдвиг в развитии стартапа, сообщил один из источников», — отмечает издание.
Тем временем мобильное приложение DeepSeek вышло в топ AppStore в США. Глава DeepSeek Лян Вэньфэн даже был замечен на встрече с премьер-министром Китая Ли Цяном. Накануне компания сообщила о кибератаке на свои ресурсы. В результате регистрацию новых пользователей в приложении ограничили. Сегодня стало известно, что китайская организация представила семейство мультимодальных моделей искусственного интеллекта Janus Pro. Разработчики уверяют, что алгоритмы способны анализировать и генерировать изображения лучше, чем модель DALL-E 3 от OpenAI.
В Сан-Франциско руководители и сотрудники OpenAI в срочном порядке изучают технологию DeepSeek (на фото генеральный директор OpenAI Сэм Альтман)
«Когда на рынок выходит конкурент, который не просит денег за свое решение, это очень сильно ударяет по рынку»
«Во-первых, DeepSeek работает на графических процессорах общего назначения, а не на специализированных. Во-вторых, она требует значительно меньше вычислительных мощностей для обучения. В-третьих, она „опенсорсная“. Это три составляющие успеха. Ее можно запускать на большом количестве обычных компьютеров, а не строить дата-центры. Также этих компьютеров нужно гораздо меньше», — объясняет суть прорыва китайской компании директор Института искусственного интеллекта, робототехники и системной инженерии КФУ Дмитрий Чикрин.
По его словам, не совсем корректно сравнивать R1 c моделями от OpenAI, т. к. они предназначены для разных целей. «Но, скажем так, она находится на уровне текущих топовых моделей и от OpenAI, и от Anthropic», — отмечает эксперт.
«DeepSeek уже ударила по NVIDIA и другим производителям чипов. Это было абсолютно предсказуемо. Когда на рынок выходит „опенсорсный“ конкурент, который не просит денег за свое решение, причем молодой стартап, то это очень сильно ударяет по рынку. Потому, в частности, OpenAI уже стала радикально снижать стоимость на услуги своей новейшей модели о3, — добавляет Чикрин. — Конечно, такое усиливает позиции КНР. Ребята просто молодцы, они достаточно давно этим занимаются, с 2016 года. Всему миру повезло, наверное».
«Они смогли в тысячу раз дешевле сделать все то, что казалось очень дорогим, — обучение нейросети. Как они это сделали — отдельный вопрос. Ну а по своей результативности она сравнима со всеми другими моделями», — объясняет вице-президент Академии наук РТ в области развития искусственного интеллекта и информационных технологий Айрат Хасьянов.
И если другие американские компании, которые получили миллиарды от инвестиций, с какого-то момента перестали публиковать сначала обучающий набор, а потом исходный код, то китайская организация вышла с открытым исходным кодом, напоминает он. «Вроде OpenAI означает „открытый искусственный интеллект“, а по факту они стали противоположны собственному названию, — говорит Хасьянов. — Это такая победа прогресса над сегрегацией человечества. Создатели DeepSeek потратили 5 миллионов долларов против миллиардов, которые израсходовала OpenAI. Это огромный разрыв».
Эксперт обращает внимание на еще один парадокс: человеческий мозг имеет мощность 20 Вт, а дата-центр, который строят сейчас в США, — 1,5 гигаватта. «При этом предполагается, что дата-центр по ряду возможностей будет превосходить то, что может человек. Тем не менее человеческий мозг, употребляя эти несчастные 20 ватт, вполне справляется с задачами обучения, даже более чем. У нас еще есть физический интеллект, который обеспечивает ориентацию в пространстве, управление мышцами. Так что нам есть к чему стремиться в плане эффективности. Я думаю, что DeepSeek — это не последний результат, будут еще прорывы в области специализированных нейронных сетей, которые станут потреблять намного меньше, решая какие-то задачи быстрее».
Правда, Хасьянов считает, что нанести ущерб этим бизнесу NVIDIA не получится, а вот ударить по бизнесу OpenAI — вполне. «Это хорошо, потому что, когда генеральный директор компании Сэм Альтман начал говорить о том, что сейчас в США происходит революция в области ИИ, сравнимая с Манхэттенским проектом, честно говоря, меня такое немножечко напрягает. Когда кто-то пытается получить абсолютно доминирование на планете, это не очень хорошо», — говорит он.
«Инвесторы вкладывали в компанию NVIDIA, потому что всем до недавнего времени было очевидно, что нужно вкладываться в инфраструктуру: это и есть путь развития искусственного интеллекта. А китайцы показали, что нет, не так. Это все переворачивает, — отмечает и уполномоченный по ИИ в РТ Булат Замалиев. — Есть обоснованное мнение, что DeepSeek — такой хитрый ход от компании Meta*. Марк Цукерберг строит так стратегию по конкуренции с OpenAI, с закрытыми моделями».
По его словам, произошедшее — очень хороший знак для индустрии, потому что это фактически дает возможность для создания различных foundation models — базовых моделей, которые открывают доступ для многих компаний по разработке и обучению собственных моделей. «Раньше это был удел мегакорпораций, у которых сотни тысяч видеокарт самых современных. Требовалась инфраструктура на миллиарды долларов. Сейчас же фактически тренд на то, чтобы снижать порог входа. Это очень интересно и особенно важно, например, для госуправления», — заключает Замалиев.
* запрещенная в России экстремистская организация
Внимание!
Комментирование временно доступно только для зарегистрированных пользователей.
Подробнее
Комментарии 101
Редакция оставляет за собой право отказать в публикации вашего комментария.
Правила модерирования.