極客網(wǎng)·人工智能4月30日 近日,阿里正式推出全新開源模型Qwen3(千問3)。作為中國首個(gè)混合推理模型,其將“快思考”與“慢思考”集成于一體。面對簡單需求時(shí),它能實(shí)現(xiàn)秒級(jí)響應(yīng);處理復(fù)雜問題時(shí),可通過多步深度思考抽絲剝繭。這種創(chuàng)新設(shè)計(jì)能有效節(jié)省算力資源,為人工智能的應(yīng)用落地開辟新路徑。
從技術(shù)架構(gòu)來看,千問3是混合專家模型(MoE,Mixture of experts),它將多個(gè)專業(yè)模型有機(jī)整合。在模型運(yùn)行過程中,會(huì)根據(jù)任務(wù)需求智能激活相關(guān)模型,實(shí)現(xiàn)“按需調(diào)用”,這種靈活機(jī)制極大提升了運(yùn)行效率。
數(shù)據(jù)顯示,在嚴(yán)苛的ArenaHard評(píng)測中,千問3預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)36T,總參數(shù)量達(dá)235B,但實(shí)際激活僅需22B。憑借強(qiáng)大的“硬實(shí)力”,千問3成功超越DeepSeek R1和OpenA Io1,與谷歌最新的Gemini 2.5-Pro性能處于同一梯隊(duì)。
更令人驚喜的是,千問3在性能飛躍的同時(shí)大幅降低了部署成本。以往需要大量高端硬件才能實(shí)現(xiàn)的效果,如今僅需4張H20顯卡就能部署滿血版,顯存占用僅為同類模型的三分之一。
此次千問3模型家族陣容強(qiáng)大,一次性推出8款“混合推理”模型,涵蓋30B和235B兩款混合專家(MoE)模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,可滿足不同場景下的多樣化需求。
目前,用戶可通過Hugging Face、ModelScope、Kaggle和GitHub等平臺(tái)獲取模型并部署安裝,也能直接通過chat.qwen.ai網(wǎng)站或App體驗(yàn)千問3的強(qiáng)大功能。
性能與全球化特征突出,阿里千問3引起全球熱議
Venturebeat評(píng)價(jià)稱:“簡短試用Qwen Chat網(wǎng)站后,發(fā)現(xiàn)新模型可以以相對快的速度生成圖片,在遵循提示方面表現(xiàn)尚可,難能可貴的是模型能夠直接將文本融入圖像中,而且還能保持風(fēng)格一致?!?/p>
全球化能力是千問3的另一張王牌,它支持119種語言及方言,極具應(yīng)用潛力。其預(yù)訓(xùn)練數(shù)據(jù)達(dá)到36T,數(shù)據(jù)來源包括網(wǎng)絡(luò)抓取、類PDF文檔提取、前幾代千問模型合成的內(nèi)容(主要是數(shù)學(xué)編程內(nèi)容)。
再看部署靈活性,0.6B-32B密集模型可直接在筆記本電腦運(yùn)行,個(gè)人開發(fā)者與大型團(tuán)隊(duì)都能輕松駕馭。
橫向?qū)Ρ龋?性能足以對標(biāo)DeepSeek、OpenAI等國內(nèi)外頭部模型。相較Meta開源模型,其遵循Apache 2.0協(xié)議,完全開放商業(yè)使用權(quán)限,而Meta模型有諸多限制。
這一次千問3的進(jìn)步非常大,它的目標(biāo)直指AGI、ASI,也就是比人類還聰明的AI。未來,千問計(jì)劃進(jìn)一步拓展模型規(guī)模,增加文本處理長度,拓寬對多種模式的支持范圍,并借助環(huán)境反饋機(jī)制提升自身的強(qiáng)化學(xué)習(xí)能力,持續(xù)進(jìn)化。
AI專家向CNBC透露,千問3的誕生意義重大,對阿里巴巴在中國的AI競爭對手而言是巨大威脅。同樣,美國同行們也感受到更大壓力。
市場咨詢公司Counterpoint Research的AI分析師Wei Sun高度評(píng)價(jià)千問3,認(rèn)為它是一款具有里程碑意義的突破性產(chǎn)品。其性能超越同類產(chǎn)品,在模型特性上也展現(xiàn)出巨大的應(yīng)用潛力,混合思考模式、支持119種語言和方言,以及開源特性,都為其加分不少。
華盛頓專注于中美經(jīng)濟(jì)和科技競爭的分析師Ray Wang表示:“阿里巴巴千問3系列產(chǎn)品的推出,再次證明中國實(shí)驗(yàn)室具備強(qiáng)大的競爭力與創(chuàng)新力。即便美國實(shí)施出口管制,也無法阻擋中國在AI領(lǐng)域穩(wěn)步向前,開發(fā)出媲美國際頂尖水平的開源模型?!?nbsp;
數(shù)據(jù)顯示,千問已成為全球最流行的開源模型之一,全球下載量超3億次,在Hugging Face上衍生模型數(shù)量突破10萬個(gè)。
分析師Ray Wang認(rèn)為,千問3將延續(xù)阿里模型的熱度與影響力,其性能有望問鼎全球最佳開源模型,僅略遜于OpenAI的專有模型o3和o4-mini。他還說,當(dāng)前中美在人工智能領(lǐng)域的差距已大幅縮小,可能僅剩幾個(gè)月、甚至幾周的差距。(小刀)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )