Přináší DeepSeek novou éru efektivity v umělé inteligenci?
Čínský startup DeepSeek představil experimentální verzi svého modelu umělé inteligence DeepSeek-V3.2-Exp. Firma slibuje výrazně nižší provozní náklady a lepší zpracování rozsáhlých dat, ale experti upozorňují i na možná rizika.
DeepSeek vyvolal pozornost už loni, když ukázal, že je možné rychle trénovat velké jazykové modely na méně výkonných čipech. Nová verze V3.2-Exp staví na architektuře V3.1-Terminus a zavádí funkci zvanou sparse attention (úsporná pozornost). Díky ní model dokáže efektivněji filtrovat nepodstatná data, čímž snižuje náklady a zrychluje zpracování.
Podle Adiny Yakefu z platformy Hugging Face nové řešení umožňuje snížit provozní náklady až na polovinu a usnadňuje běh modelů na čínských čipech Ascend či Cambricon bez nutnosti složitých úprav. Nick Patience z analytické společnosti The Futurum Group označil tento přístup za krok, který může zpřístupnit výkonnou AI menším firmám a vývojářům a otevřít cestu k širšímu využití.
Část odborníků ale varuje, že úsporná pozornost může vést ke ztrátě nuancí a snížení spolehlivosti výsledků. Ekaterina Almasque z BlankPage Capital upozornila, že technologie není patentovatelná a konkurenční výhoda DeepSeek tak spočívá spíše ve způsobu, jakým firma určuje, která data zahrnout.
DeepSeek přitom zveřejnil kód i nástroje potřebné pro práci s modelem. Podle vedení společnosti jde o mezikrok na cestě k nové generaci architektury. I proto zůstává otázkou, zda se startupu podaří proměnit technologický průlom v dlouhodobě udržitelnou výhodu.
Zdroj: CNBC
Aktuality
