阿里巴巴發(fā)布新一代開源模型Qwen3,通義千問再升級
4月29日凌晨,阿里巴巴開源新一代通義千問模型Qwen3(簡稱千問3),參數(shù)量為DeepSeek-R1的1/3,成本大幅下降。千問3是“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,對簡單需求可低算力“秒回”答案,對復(fù)雜問題可多步驟“深度思考”,節(jié)省算力消耗。
千問3總參數(shù)量235B,激活僅需22B。阿里稱僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。
千問3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需設(shè)置“思考預(yù)算”(即預(yù)期**深度思考的tokens數(shù)量),進行不同程度的思考,滿足AI應(yīng)用和不同場景對性能和成本的多樣需求。比如,4B模型面向手機端,8B可在電腦和汽車端側(cè)部署應(yīng)用等。
本文 軟文網(wǎng) 原創(chuàng),轉(zhuǎn)載保留鏈接!網(wǎng)址:/news/73871.html
1.本站遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;2.本站的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和來源,不尊重原創(chuàng)的行為我們將追究責(zé)任;3.作者投稿可能會經(jīng)我們編輯修改或補充。







