В най-новия си доклад независимата изследователска компания SemiAnalysis обръща внимание на DeepSeek – изгряващ играч в сферата на изкуствения интелект.
SemiAnalysis оспорва някои от преобладаващите разкази за разходите на DeepSeek и ги сравнява с конкурентните технологии на пазара. Едно от най-известните твърдения в обращение е, че DeepSeek V3 има разходи за обучение в размер на около 6 млн. долара.
В доклада на SemiAnalysis обаче тази цифра се оспорва, като се посочва, че тя не отчита няколко критични фактора.
Митът за 6-те милиона долара
Оценката от 6 млн. долара отчита предимно разходите на GPU преди обучението, като пренебрегва значителните инвестиции в научноизследователска и развойна дейност, инфраструктура и други съществени разходи, които се начисляват на компанията.
В доклада се подчертава, че общите капиталови разходи за сървъри (CapEx) на DeepSeek възлизат на изумителните 1,3 млрд. долара. Голяма част от този финансов ангажимент е насочен към експлоатацията и поддръжката на обширните клъстери с графични процесори, които са гръбнакът на неговата изчислителна мощ.
Съобщава се, че DeepSeek има достъп до около 50 000 графични процесора Hopper, което води до някои погрешни схващания в индустрията.
SemiAnalysis уточнява, че това не се равнява на наличието на 50 000 H100, както някои предполагаха по-рано. Вместо това запасите от графични процесори се състоят от комбинация от модели, включително H800, H100 и специфичните за страната H20, произведени от NVIDIA в отговор на ограниченията за износ в САЩ.
Това нюансирано разбиране на техния хардуерен инвентар подчертава стратегическите решения в областта на снабдяването и оперативната ефективност в DeepSeek.
Забележителен аспект на доклада е отражението му върху организационната структура на DeepSeek.
За разлика от някои от по-големите AI лаборатории, DeepSeek управлява своите центрове за данни и използва рационализиран модел, който помага за неговата гъвкавост и ефективност.
Тъй като AI пейзажът става все по-конкурентен, тази способност за бързо адаптиране се превръща в жизненоважен актив.
По-добри способности за разсъждение
Що се отнася до производителността, анализът показва, че моделът R1 на DeepSeek демонстрира сравними способности за разсъждение с o1 на OpenAI.
Въпреки това, той не посочва DeepSeek като безспорен лидер във всеки показател за ефективност. Въпреки че стратегията за ценообразуване на DeepSeek привлича вниманието и похвалите, има едно важно предупреждение: Gemini Flash 2.0 на Google, който е с подобни възможности, се оказва дори по-икономичен, когато е достъпен чрез API услуги.
Това поставя DeepSeek на кръстопът, където балансирането на производителност и цена е ключът към бъдещия му успех. Технологията Multi-Head Latent Attention (MLA) е новаторска иновация, подчертана в доклада.
Този авангарден подход значително намалява разходите за изводи с впечатляващите 93,3% чрез намалено използване на кеширане на ключ-стойност (KV), което представлява голям скок към рентабилни AI решения.
Експертите предполагат, че иновациите, възникнали от DeepSeek, вероятно ще бъдат бързо възприети от западните AI лаборатории, които искат да останат конкурентоспособни.
Въпреки че има оптимизъм за потенциални подобрения и повишаване на ефективността, SemiAnalysis предупреждава за външни предизвикателства.
В доклада се спекулира, че оперативните разходи може да паднат още пет пъти до края на годината, водени от способността на DeepSeek да се адаптира бързо в сравнение с по-големите си, по-бюрократични аналози.
Въпреки това увеличаването на операциите в условията на затягане на контрола върху износа от страна на САЩ представлява значително препятствие, което DeepSeek трябва да преодолее внимателно.
В заключение, SemiAnalysis представя сложна картина на сегашното положение на DeepSeek в сферата на изкуствения интелект.
Разкритията, свързани със структурата на разходите, използването на графични процесори и иновативните възможности, определят DeepSeek като сериозен играч.
Тъй като фирмата продължава да се развива, индустрията я наблюдава отблизо, чакайки с нетърпение да види как ще отговори на възникващите предизвикателства и възможности в един постоянно променящ се пейзаж.
Източник: InterestingEngineering

































