國信證券(002736)發(fā)布研報(bào)稱,密切關(guān)注國產(chǎn)模型和國產(chǎn)芯片。Deepseek的進(jìn)一步在架構(gòu)設(shè)計(jì)層面“降本增效”,推動(dòng)國產(chǎn)模型更普惠實(shí)現(xiàn)百萬上下文長度,密切關(guān)注國產(chǎn)模型廠商進(jìn)展。寒武紀(jì)(688256)(688256.SH)、華為昇騰(886058)的Day 0適配表明,表明國產(chǎn)芯片在已達(dá)到商業(yè)可用的成熟度,密切關(guān)注國產(chǎn)算力進(jìn)展。
國信證券(002736)主要觀點(diǎn)如下:
事項(xiàng)
4月24日,DeepseekV4發(fā)布。根據(jù)DeepSeek的官方介紹,V4系列包含兩個(gè)MoE模型:DeepSeek-V4-Pro總參數(shù)1.6T、激活參數(shù)49B,DeepSeek-V4-Flash總參數(shù)284B、激活參數(shù)13B,兩者均原生支持100萬token上下文。
Agent能力大幅提升,處于國內(nèi)第一梯隊(duì),性能比肩全球頂級(jí)閉源模型
根據(jù)公司官方,在Agentic Coding評(píng)測中,V4 Pro已達(dá)到當(dāng)前開源模型最佳水平。目前DeepSeek V4已成為公司內(nèi)部員工使用的AgenticCoding模型,據(jù)評(píng)測反饋使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式,但仍與Opus4.6思考模式存在一定差距。從第三方評(píng)測來看,Arena.ai在X上將V4 Pro定性為"相較DeepSeek V3.2的重大飛躍",在代碼開源模型榜單中位列第3位、綜合第14位。另一家測評(píng)方Vals AI表示,V4在其Vibe Code Benchmark(BHE)中是開源模型榜首。
Deepseek通過注意力層改進(jìn),推動(dòng)百萬上下文進(jìn)入普惠時(shí)代
DeepSeek V4開創(chuàng)了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力,實(shí)現(xiàn)了全球領(lǐng)先的長上下文能力,并且相比于傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。在1M上下文設(shè)置下,DeepSeek V4 Pro的單token推理FLOPs只有V3.2的27%,KVCache只有10%;V4-Flash更極端,分別壓到10%和7%。價(jià)格方面,Deepseek實(shí)現(xiàn)了高性價(jià)比。
DeepSeek-V4-Pro輸入/輸出百萬Token價(jià)格12元/24元;對(duì)比國內(nèi)1T模型,比如小米(K81810)輸入/輸出百萬Token價(jià)格$1/ $3 (小于256K上下文);$2/ $6(1M上下文)。Deepseek-V4-Flash價(jià)格更低,為輸入/輸出百萬Token價(jià)格1元/2元。
Deepseek與國產(chǎn)芯片進(jìn)行適配,包括華為、寒武紀(jì)等
V4在技術(shù)報(bào)中表示,在英偉達(dá)(NVDA)GPU和華為昇騰(886058)NPU兩個(gè)平臺(tái)上均驗(yàn)證了細(xì)粒度EP(專家并行)方案。根據(jù)官網(wǎng),下半年昇騰950超節(jié)點(diǎn)批量上市有望繼續(xù)推動(dòng)V4 Pro降價(jià)。根據(jù)華為云官方,昇騰一直同步支持DeepSeek系列模型,本次通過雙方芯模技術(shù)緊密協(xié)同,實(shí)現(xiàn)昇騰超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型。昇騰950通過融合kernel和多流并行技術(shù)降低Attention計(jì)算和訪存開銷,大幅提升推理性能,結(jié)合多種量化算法,實(shí)現(xiàn)了高吞吐、低時(shí)延的DeepSeekV4模型推理部署。昇騰A3超節(jié)點(diǎn)系列產(chǎn)品也全面適配,同時(shí)為便于用戶快速微調(diào),提供了基于昇騰A3超節(jié)點(diǎn)的訓(xùn)練參考實(shí)現(xiàn)。寒武紀(jì)(688256)Day 0適配DeepSeek-V4。寒武紀(jì)(688256)已基于vLLM推理框架完成285BDeepSeek-V4-flash和1.6TDeepSeek-V4-pro的Day 0適配,適配代碼已開源到GitHub社區(qū)。這一成果得益于寒武紀(jì)(688256)長期積累的自研NeuWare軟件生態(tài)與芯片設(shè)計(jì)技術(shù),也是寒武紀(jì)(688256)對(duì)芯片與算法聯(lián)合創(chuàng)新持續(xù)投入的延續(xù)。
風(fēng)險(xiǎn)提示:宏觀經(jīng)濟(jì)波動(dòng)風(fēng)險(xiǎn)、下游需求不及預(yù)期風(fēng)險(xiǎn)、核心技術(shù)水平升級(jí)不及預(yù)期的風(fēng)險(xiǎn)、AI快速迭代平權(quán)化下競爭加劇等。
