4月29日消息(九九)今日凌晨,阿里巴巴開源新一代通義千問模型Qwen3(簡稱“千問3”)。
千問3采用混合專家(MoE)架構(gòu),總參數(shù)量235B,激活僅需22B。千問3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強,創(chuàng)下所有國產(chǎn)模型及全球開源模型的性能新高。與此同時,千問3的部署成本還大幅下降,僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。
千問3性能圖
千問3還提供了豐富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斬獲同尺寸開源模型SOTA(最佳性能):千問3的30B參數(shù)MoE模型實現(xiàn)了10倍以上的模型性能杠桿提升,僅激活3B就能媲美上代Qwen2.5-32B模型性能。
并且,所有千問3模型都是混合推理模型,API可按需設置“思考預算”(即預期最大深度思考的tokens數(shù)量),進行不同程度的思考,靈活滿足AI應用和不同場景對性能和成本的多樣需求。比如,4B模型是手機端的絕佳尺寸,8B可在電腦和汽車端側(cè)絲滑部署應用,32B最受企業(yè)大規(guī)模部署歡迎,有條件的開發(fā)者也可輕松上手。
Qwen3開源模型家族
千問3為即將到來的智能體Agent和大模型應用爆發(fā)提供了更好的支持。在評估模型Agent能力的BFCL評測中,千問3創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,將大幅降低Agent調(diào)用工具的門檻。同時,千問3原生支持MCP協(xié)議,并具備強大的工具調(diào)用(function calling)能力,結(jié)合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent 框架,將大大降低編碼復雜性,實現(xiàn)高效的手機及電腦Agent操作等任務。
據(jù)悉,千問3系列模型依舊采用寬松的Apache2.0協(xié)議開源,并首次支持119多種語言,全球開發(fā)者、研究機構(gòu)和企業(yè)均可免費在魔搭社區(qū)、HuggingFace等平臺下載模型并商用,個人用戶也可以立即通過通義APP直接體驗千問3。
據(jù)了解,阿里通義已開源200余個模型,全球下載量超3億次,千問衍生模型數(shù)超10萬個,已超越美國Llama,成為全球第一開源模型。
- 通用人工智能備受矚目,但工業(yè)人工智能將發(fā)揮巨大作用|觀察
- 到2029年,交通管理市場預計將達到757.4億美元
- 為什么核能可能是滿足人工智能日益增長的電力需求的關鍵
- 到2030年,全球智能家居市場預計將達到5372.7億美元
- 為何“脫碳”成了全球關注的焦點?
- AI和AaaS如何助力企業(yè)IT轉(zhuǎn)型
- 聚焦“智聯(lián)、智艙、智城”,中國移動發(fā)布“AI CAR”服務體系
- 中國電信柯瑞文:適度超前開展智算建設,進一步強化云智一體能力
- 打造可持續(xù)的未來:智能建筑的凈零排放路徑 | 專家視點
- USGBC正式發(fā)布 LEED v5 標準,加速建筑脫碳進程
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。