IT之家 4 月 20 日消息,4 月 20 日(今天)下午,阿里(BABA)宣布 Qwen3.6-Max-Preview 正式發(fā)布。據(jù)介紹,該模型是 Qwen 系列新一代旗艦?zāi)P偷脑缙陬A(yù)覽版,用戶可以在 Qwen Studio 進(jìn)行交互對話,并且即將通過阿里(BABA)云百煉 API 以 qwen3.6-max-preview 的名稱調(diào)用。
該預(yù)覽版帶來了更強(qiáng)的世界知識和指令遵循能力,以及在多項(xiàng)基準(zhǔn)上顯著提升的智能體編程表現(xiàn)。作為預(yù)覽版,模型仍在積極迭代中,后續(xù)版本將持續(xù)優(yōu)化。
據(jù)IT之家了解,Qwen3.6-Max-Preview 主要特性包括:
相比 Qwen3.6-Plus 顯著提升的智能體編程能力
更強(qiáng)的世界知識和指令遵循
更優(yōu)的真實(shí)場景智能體與知識可靠性表現(xiàn)
相比 Qwen3.6-Plus,預(yù)覽版在智能體編程方面取得顯著提升(如 SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8),世界知識更強(qiáng)(SuperGPQA +2.3、QwenChineseBench +5.3),指令遵循也更優(yōu)(ToolcallFormatIFBench +2.8)。
該模型在智能體編程、世界知識和指令遵循方面相比 Qwen3.6-Plus 均有顯著提升,并在六項(xiàng)主要編程基準(zhǔn)上取得最高分 ——SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode,且相比前代有大幅進(jìn)步。同時(shí),其在知識(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表現(xiàn)更優(yōu)。
阿里(BABA)方面表示,作為預(yù)覽版,Qwen3.6-Max-Preview 仍在積極開發(fā)中。
