Китайският стартъп DeepSeek започна да пускан най-новите си модели за изкуствен интелект (AI), които според компанията са на същото ниво или по-добри от водещите в индустрията модели в САЩ, но срещу малка част от цената. Това заплашва да разклати световния технологичен ред, пише Дневник.

Компанията привлече вниманието в глобалните AI кръгове, след като написа в статия миналия месец, че обучението на DeepSeek-V3 изисква изчислителна мощност на стойност по-малко от $6 милиона и чипове Nvidia H800.

AI Assistant на DeepSeek, захранван от DeepSeek-V3, изпревари конкурента си ChatGPT и стана най-високо оцененото безплатно приложение, достъпно в App Store на Apple в САЩ.

Това повдигна съмнения относно мотивите зад решението на някои американски технологични компании да обещаят милиарди долари инвестиции в изкуствен интелект и акциите на няколко големи технологични играчи, включително Nvidia, бяха ударени тежко от инвеститорите.

Защо DeepSeek предизвика толкова вълнение

Пускането от OpenAI' на ChatGPT в края на 2022 г. накара китайските технологични фирми да се втурнат да създават свои собствени чатботове, захранвани от изкуствен интелект.

Но след пускането на първия китайски еквивалент на ChatGPT, създаден от гиганта зад водещата в страната търсачка Baidu, в Китай имаше масово разочарование от разликата в AI способностите между американските и китайските фирми.

Качеството и ефективността на разходите на моделите на DeepSeek обърнаха тово разбиране с главата надолу. Двата модела, които бяха обсипани с похвали както от ръководителите на Силициевата долина, така и от инженерите на американските технологични компании, DeepSeek-V3 и DeepSeek-R1, са наравно с най-модерните модели на OpenAI и Meta, каза китайският стартъп.

Освен това са по-евтини за използване. DeepSeek-R1, пуснат миналата седмица, е - в зависимост от задачата - 20 до 50 пъти по-евтин за използване от модела OpenAI o1, според публикация в официалния профил на DeepSeek в мрежата за съобщения WeChat.

Но някои публично изразиха скептицизъм за историята на успеха на DeepSeek.

Главният изпълнителен директор на Scale AI Александър Уанг каза по време на интервю за CNBC в четвъртък, без да предоставя доказателства, че DeepSeek има 50 хил. чипа Nvidia H100, за които той твърди, че няма да бъдат публично разкрити, защото това би нарушило експортния контрол на Вашингтон. САЩ забраняват такива усъвършенствани AI чипове да се продават на китайски компании.

Анализаторите от Bernstein подчертаха в понеделник в съобщение за това какво са установили, че общите разходи за обучение на DeepSeek за неговия модел V3 са неизвестни, но са много по-високи от 5.58 милиона долара, които стартъпът каза, че е използвал за изчислителна мощност. Анализаторите също така казаха, че разходите за обучение на също толкова аплодирания модел R1 не са оповестени.

Кой стои зад DeepSeek

DeepSeek е базиран в Ханджоу стартъп, чийто акционер с контролни правомощия е Лян Уънфън, съосновател на хедж фонда High-Flyer, сочат китайски корпоративни документи.

Фондът на Лян обяви през март 2023 г. в официалния си акаунт в WeChat, че "започва отново", надхвърляйки търговията, за да концентрира ресурси върху създаването на "нова и независима изследователска група, която да изследва същността на AGI" (Изкуствен общ интелект). DeepSeek е създаден по-късно същата година.

В OpenAI (създателите на ChatGPT) определят AGI като автономни системи, които превъзхождат хората в повечето икономически значими задачи.

Не е ясно колко High-Flyer е инвестирал в DeepSeek. Фондът има офис, разположен в същата сграда като DeepSeek, и също така притежава патенти, свързани с клъстери от чипове, използвани за обучение на AI модели, според китайските корпоративни документи.

Отделът за изкуствен интелект на High-Flyer заяви в официалния си акаунт в WeChat през юли 2022 г., че притежава и управлява клъстер от 10 хил. чипа A100.

Как Пекин гледа на DeepSeek

Успехът на DeepSeek вече е забелязан във висшите политически кръгове на Китай. На 20 януари, деня, в който DeepSeek-R1 беше пуснат за обществеността, основателят Лян присъства на симпозиум при закрити врати за бизнесмени и експерти. Домакин е била китайския премиер Ли Цян, според държавната информационна агенция Синхуа.

Присъствието на Лян на срещата е потенциален знак, че успехът на DeepSeek може да бъде важен за политическата цел на Пекин за преодоляване контрола на Вашингтон върху износа и постигане на самодостатъчност в стратегически индустрии като AI.

Подобен симпозиум миналата година беше посетен от изпълнителния директор на Baidu Робин Ли.