中信建投(601066)發(fā)布研報(bào)稱(chēng),Mythos是Anthropic迄今最強(qiáng)模型,能力出現(xiàn)躍遷式增強(qiáng),代碼、推理與研究輔助全面領(lǐng)先前代。其在真實(shí)網(wǎng)絡(luò)安全(885459)場(chǎng)景中優(yōu)勢(shì)最突出,不僅在Firefox漏洞利用任務(wù)中遠(yuǎn)超Opus4.6,還可發(fā)現(xiàn)并利用零日漏洞。此外,Mythos在生化研發(fā)及金融、AI訓(xùn)練、機(jī)器人等行業(yè)研發(fā)流程中也具備明顯加速作用。Anthropic背后由亞馬遜(AMZN)、谷歌(GOOG)投資與算力供給,并在近期加強(qiáng)合作,2027年起TPU需求量達(dá)到3.5g(885556)W,谷歌(GOOG)TPU產(chǎn)業(yè)鏈有望持續(xù)受益于前沿模型訓(xùn)練需求擴(kuò)張。
中信建投主要觀點(diǎn)如下:
1.迄今最強(qiáng)模型,能力出現(xiàn)躍遷式增強(qiáng)。Claude Mythos被Anthropic定義為“迄今最強(qiáng)大AI模型”,能力曲線出現(xiàn)了明顯躍遷。其在軟件工程、推理、知識(shí)工作和研究輔助等多個(gè)維度明顯強(qiáng)于Opus4.6。以代碼能力為例,Mythos在SWE-bench Verified上達(dá)到93.9%,顯著高于Opus4.6的80.8%;價(jià)格方面,其API定價(jià)達(dá)到25美元/百萬(wàn)輸入token和125美元/百萬(wàn)輸出token,約為Opus4.6的5倍。
2.Cyber(指一個(gè)模型或系統(tǒng)在執(zhí)行與網(wǎng)絡(luò)空間相關(guān)的任務(wù)時(shí)所展現(xiàn)的技術(shù)水平)能力極強(qiáng),尤其在真實(shí)場(chǎng)景中出現(xiàn)斷層式領(lǐng)先。Mythos在更貼近真實(shí)世界的Firefox漏洞利用任務(wù)中,總成功率達(dá)到84.0%,其中完整漏洞利用成功率達(dá)到72.4%,遠(yuǎn)高于Opus4.6的15.2%。同時(shí),Mythos還能在真實(shí)系統(tǒng)中發(fā)現(xiàn)并利用零日漏洞,典型案例是挖出存在27年的OpenBSD漏洞,說(shuō)明其cyber能力已從“會(huì)做安全題”躍遷到“能在真實(shí)環(huán)境中找洞并利用漏洞”。
3.在生化研發(fā)與多行業(yè)研發(fā)流程中均具備明顯放大作用。除cyber外,Mythos在化學(xué)、生物及更廣泛研發(fā)場(chǎng)景中的價(jià)值也開(kāi)始清晰顯現(xiàn)。在生化領(lǐng)域,其對(duì)公開(kāi)文獻(xiàn)、實(shí)驗(yàn)流程、多步驟protocol和生物序列設(shè)計(jì)/功能預(yù)測(cè)的整合能力明顯增強(qiáng);在更廣泛產(chǎn)業(yè)端,其在Kernel task、LLM training等任務(wù)上也明顯強(qiáng)于前代,部分任務(wù)已達(dá)到數(shù)小時(shí)到40小時(shí)級(jí)別人類(lèi)工時(shí)等價(jià),有望加速生物醫(yī)藥、金融量化、AI基礎(chǔ)設(shè)施、機(jī)器人和自動(dòng)駕駛等多個(gè)行業(yè)的研發(fā)流程升級(jí)。
4.對(duì)齊能力當(dāng)前最好,但低頻出錯(cuò)的風(fēng)險(xiǎn)更大。Mythos是其迄今“總體最對(duì)齊”的模型。經(jīng)過(guò)后訓(xùn)練后,模型在破壞性行為、作弊式行為以及對(duì)人類(lèi)濫用請(qǐng)求的配合率上均較前代繼續(xù)下降。但由于其能力上限提升過(guò)快,極少數(shù)情況下若沿錯(cuò)誤軌道繼續(xù)執(zhí)行,隱蔽完成額外目標(biāo)、規(guī)避監(jiān)控的能力也更強(qiáng)。
5.Anthropic:融資與算力合作同步加碼,谷歌(GOOG)與亞馬遜(AMZN)是核心合作伙伴。Anthropic截至2026年4月估值已達(dá)3800億美元,ARR超過(guò)300億美元。亞馬遜(AMZN)累計(jì)投資80億美元,并通過(guò)AWS與Trainium深度綁定Anthropic核心訓(xùn)練;谷歌(GOOG)累計(jì)投資30多億美元,自2025年10月份開(kāi)始合作,2026年4月,Anthropic進(jìn)一步增加明年TPU的部署量,未來(lái)預(yù)計(jì)達(dá)3.5g(885556)W,按照功耗推算,預(yù)計(jì)達(dá)200-300萬(wàn)顆芯片采購(gòu)。
6.谷歌(GOOG)TPU:微架構(gòu)與集群系統(tǒng)雙重迭代,有望持續(xù)受益前沿模型訓(xùn)練需求擴(kuò)張。谷歌(GOOG)TPU的核心優(yōu)勢(shì),不只是單芯片性能提升,而是“芯片+互聯(lián)+集群”一體化演進(jìn)。從TPUv1到TPUv7,谷歌(GOOG)持續(xù)在矩陣計(jì)算單元、HBM、ICI互聯(lián)、拓?fù)浣Y(jié)構(gòu)和集群能力上升級(jí),使TPU從早期推理芯片逐步發(fā)展為可支撐超大模型訓(xùn)練的完整超級(jí)計(jì)算平臺(tái)。隨著谷歌(GOOG)與頭部AI公司在下一代TPU集群上的合作不斷加深,TPU正在成為前沿模型訓(xùn)練的重要底座。
風(fēng)險(xiǎn)提示:人工智能(885728)技術(shù)發(fā)展不及預(yù)期;互聯(lián)網(wǎng)廠商資本開(kāi)支不及預(yù)期;參與廠商眾多導(dǎo)致競(jìng)爭(zhēng)格局惡化;政策監(jiān)管力度不及預(yù)期。
