上證報(bào)中國(guó)證券網(wǎng)訊(記者 楊翔菲)4月20日,阿里(BABA)發(fā)布Qwen3.6-Max-Preview。權(quán)威三方評(píng)測(cè)榜單Artificial Analysis顯示,Qwen3.6-Max-Preview性能表現(xiàn)超過(guò)GLM5.1、MiniMax-M2.7等模型,登頂最佳國(guó)產(chǎn)模型。
該模型是新一代千問(wèn)旗艦?zāi)P偷脑缙陬A(yù)覽版,擁有更強(qiáng)的世界知識(shí)和指令遵循能力,并在智能體編程任務(wù)中性能顯著提升。
旗艦?zāi)P蚎wen-Max是千問(wèn)系列性能最強(qiáng)的大模型。相較于近期推出的Qwen3.6-Plus,此次發(fā)布的預(yù)覽版Qwen3.6-Max-Preview模型,在智能體編程、世界知識(shí)和指令遵循方面均顯著提升:在SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode等六項(xiàng)主要編程基準(zhǔn)上,預(yù)覽模型取得最佳表現(xiàn);同時(shí)在世界知識(shí)(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也斬獲新高。
在真實(shí)場(chǎng)景中,Qwen3.6-Max-Preview表現(xiàn)出更好的智能體能力和知識(shí)可靠性,可解決更復(fù)雜、更長(zhǎng)程的任務(wù)。目前,用戶(hù)可在Qwen Studio免費(fèi)體驗(yàn)Qwen3.6-Max-Preview,企業(yè)和開(kāi)發(fā)者也可通過(guò)阿里(BABA)云百煉獲取API服務(wù)。
據(jù)悉,千問(wèn)3.6系列已推出Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash,并開(kāi)源Qwen3.6-35B-A3B。其中,Qwen3.6-Plus登頂全球最大的三方API調(diào)用平臺(tái)OpenRouter的日榜、周榜、趨勢(shì)榜冠軍,Qwen3.6-35B-A3B則登頂HuggingFace全球開(kāi)源大模型榜單冠軍,千問(wèn)3.6成為當(dāng)下最受企業(yè)和開(kāi)發(fā)者歡迎的大模型。
