
Tento start-up svým tvrzením, že dosáhl srovnatelného výkonu s vedoucími americkými AI modely, avšak za zlomek ceny, zesměšnil americké technologické giganty, jejichž akcie se nyní propadají.
Navíc tento pokrok Číňanů nyní zpochybňuje všeobecný konsensus, že USA jsou asi v šestiměsíčním vedení oproti Číně ve vývoji AI. Například akcie Nvidia a ASML spadly o 11 procent, akcie dalších gigantů, jako je Meta, Tesla či Google se propadají o střední jednotky procent.
Evropské akcie se propadají ještě více, akcie společnosti Siemens Energy, která dodává elektrický hardware pro infrastrukturu AI, klesly o 19 procent. Akcie společnosti Schneider Electric se propadly o 8,7 procenta.
Společnost DeepSeek, kterou založil manažer hedgeového fondu Liang Wenfeng, minulý týden zveřejnila podrobný dokument vysvětlující, jak vytvořit rozsáhlý jazykový model, který by se mohl automaticky učit a zdokonalovat.
DeepSeek přitahuje stále větší pozornost investorů od chvíle, kdy společnost minulý týden zveřejnila svůj nejnovější model AI, který vykazuje srovnatelný výkon s nejlepšími modely amerických konkurentů OpenAI, Meta či Google.
Čínský start-up tvrdí, že dosáhl pokroku v trénování modelů s použitím mnohem menšího počtu čipů Nvidia než američtí konkurenti, což vyvolává otázky ohledně velmi drahých nákupů hardwaru souvisejícího s umělou inteligencí v Silicon Valley a také ohledně návratnosti těchto investic.
DeepSeek se tak o víkendu vyšplhal na první místo v žebříčku stažených aplikací v App Store společnosti Apple v USA. Nedávné zveřejnění nového modelu R1 čínskou společností DeepSeek vyvolalo v Silicon Valley bouřlivou debatu o tom, zda lépe vybavené americké společnosti zabývající se touto problematikou mohou obhájit svůj domělý technologický náskok. Liang se tak stal v Číně ústřední postavou v technologickém světě.
V roce 2021 začal Liang nakupovat tisíce grafických procesorů Nvidia pro svůj vedlejší projekt AI, zatímco provozoval svůj fond věnující se kvantovému obchodování High-Flyer. Lidé z oboru ho považovali za výstředního miliardáře, který si hledá nového koníčka.
Obecně se má za to, že vytvářet výkonné AI modely dokážou jen giganti, jako Google, Microsoft, či jejich čínští konkurenti ByteDance a Alibaba. Ve společnosti High-Flyer Liang vybudoval jmění pomocí AI a algoritmů k identifikaci vzorců, které by mohly ovlivnit ceny akcií.
Jeho tým se zdokonalil v používání čipů Nvidia v procesu vydělávání peněz z obchodování s akciemi. V roce 2023 ale spustil společnost DeepSeek a oznámil svůj záměr vyvinout umělou inteligenci na úrovni člověka.
Liang vybudoval výjimečný tým specialistů a pozval do DeepSeek své nejlepší lidi z hedgeového fondu (speciální investiční fond, pozn. red.) High-Flyer. Liang údajně používá výnosy ze svého obchodování s hedgeovými fondy na vyplácení velmi vysokých platů pro nejlepší talenty v oblasti umělé inteligence.
Spolu s firmou ByteDance, která vlastní TikTok, je společnost DeepSeek známá tím, že poskytuje nejvyšší odměny dostupné inženýrům AI v Číně. Liang označil DeepSeek za jedinečnou „místní“ společnost, ve které pracují doktorandi z nejlepších čínských škol, univerzit v Pekingu a Beihangu a městu Čching-chua, nikoli odborníci z amerických institucí.
Poté, co Washington zakázal společnosti Nvidia vyvážet její nejvýkonnější čipy do Číny, byly místní společnosti zabývající se umělou inteligencí nuceny hledat inovativní způsoby, jak maximalizovat výpočetní výkon za omezeného počtu čipů – což je problém, který Liangův tým již uměl vyřešit.
Zdá se, že inženýři společnosti DeepSeek vědí, jak využít potenciál těchto grafických procesorů, i když nejsou nejmodernější. DeepSeek dosud nezískala peníze z externích fondů ani neučinila žádné významné kroky ke zpeněžení svých modelů a zaměřuje se čistě na výzkum a inženýring.
Někteří analytici ale varují, že reakce trhu byla přehnaná a že pokroky společnosti DeepSeek budou nakonec pro výrobce čipů s umělou inteligencí, jako je Nvidia, pozitivní. Snížení nákladů na trénink a provoz modelů umělé inteligence v dlouhodobém horizontu usnadní a zlevní zavádění aplikací AI pro podniky a spotřebitele.
Pokroky v efektivitě trénování tak umožňují další škálování a šíření Al. Američtí konkurenti ale taktéž nestojí na místě. Budují mega „clustery“ (seskupení spolupracujících počítačů) čipů Blackwell nové generace od společnosti Nvidia, čímž vytvářejí výpočetní výkon, který hrozí opět vytvořit výkonnostní rozdíl oproti čínským rivalům.
Minulý týden společnost OpenAI oznámila, že vytváří společný podnik s japonskou SoftBank, nazvaný Stargate, s plány utratit nejméně 500 miliard dolarů za infrastrukturu umělé inteligence v USA.
Společnost xAI Elona Muska masivně rozšiřuje svůj superpočítač Colossus, který bude obsahovat více než jeden milion grafických procesorů, aby pomohl trénovat její modely umělé inteligence Grok.
Zatímco tedy DeepSeek má jedno z největších pokročilých výpočetních center v Číně, tento náskok se kvůli zákazu vývozu nejmodernějších čipů může časem zmenšit.
I když společnost DeepSeek vykázala působivé výsledky s omezenými zdroji, zůstává otevřenou otázkou, zda může být i nadále konkurenceschopná s tím, jak se bude odvětví nadále rapidně vyvíjet.
Autor je analytik společnosti BH Securities
(Redakčně upraveno)
Ilustrační foto: Depositphotos.com