阿里云開源通義千問Qweb2 支持128K上下文 在測(cè)試中表現(xiàn)不俗 – 藍(lán)點(diǎn)網(wǎng)
阿里云今天推出了通義千問人工智能模型的藍(lán)點(diǎn)重大升級(jí)版本:Qwen2,該模型提供 5 個(gè)不同的阿里尺寸、上下文長度最高支持 128K tokens,云開源通義千并且在各項(xiàng)測(cè)試中表現(xiàn)不俗。問Q文測(cè)網(wǎng)
Qwen2 的上下試中所有尺寸版本均已同步在 GitHub、HuggingFace 和 ModelScope 上開源,表現(xiàn)不俗有興趣的藍(lán)點(diǎn)開發(fā)者可以立即獲取模型進(jìn)行測(cè)試。

此次發(fā)布的阿里新版本亮點(diǎn)包括:
- 能力較此前版本有較大幅度提升,在開源模型測(cè)試中名列前茅
- 提供 5 個(gè)預(yù)訓(xùn)練和指令微調(diào)模型,云開源通義千包括 Qwen2-0.5B、問Q文測(cè)網(wǎng)廣州花都區(qū)外圍(外圍資源)(薇WhatsApp+365-*2895)提供全國外圍女上門、伴游,空姐,網(wǎng)紅,明星,學(xué)生上門預(yù)約服務(wù) 同城30分鐘內(nèi)到達(dá) 面到付款Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B
- 在編程領(lǐng)域和數(shù)學(xué)方面的能力顯著提高
- 增加上下文長度,現(xiàn)在最高支持 128K tokens
- 在中文和英語的基礎(chǔ)上,增加 27 種語言相關(guān)的數(shù)據(jù)進(jìn)行訓(xùn)練

在 Qwen1.5 系列模型中只有 32B 和 110B 版使用 GQA,而在 Qwen2 中所有模型都使用 Qwen2,使用 GQA 后有助于提升推理能力和降低顯存的占用。
同時(shí)諸如 Qwen2-0.5B 和 1.5B 版可以在性能更低的設(shè)備上運(yùn)行,例如在智能手機(jī)本地運(yùn)行 Qwen2-0.5B 而不需要云端處理,這種也是未來的趨勢(shì),未來可能所有智能設(shè)備都會(huì)支持 AI,這就需要更小的模型為本地運(yùn)行提供支持。
模型評(píng)估顯示 Qwen2 能力超過 Llama3:
目前人工智能開源 / 開放社區(qū)中最重要的兩個(gè)貢獻(xiàn)者就是 Meta 和阿里云,Meta 主要就是 Llama 系列模型最新版本為 Llama3。
在開源 / 開放模型能力評(píng)測(cè)中,Qwen2-72B 版在各方面超過 Llama3-70B,也超過了 Mixtral-8x22B,所以現(xiàn)在壓力給到了 Meta,不知道 Meta 什么時(shí)候發(fā)布新版本。



阿里云 AI 團(tuán)隊(duì)表示:
大規(guī)模預(yù)訓(xùn)練后,我們對(duì)模型進(jìn)行精細(xì)的微調(diào),以提升其智能水平,讓其表現(xiàn)更接近人類。這個(gè)過程進(jìn)一步提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。此外,模型學(xué)會(huì)對(duì)齊人類價(jià)值觀,它也隨之變得更加對(duì)人類有幫助、誠實(shí)以及安全。我們的微調(diào)過程遵循的原則是使訓(xùn)練盡可能規(guī)模化的同時(shí)并且盡可能減少人工標(biāo)注。我們探索了如何采用多種自動(dòng)方法以獲取高質(zhì)量、可靠、有創(chuàng)造力的指令和偏好數(shù)據(jù),其中包括針對(duì)數(shù)學(xué)的拒絕采樣、針對(duì)代碼和指令遵循的代碼執(zhí)行反饋、針對(duì)創(chuàng)意寫作的回譯、針對(duì)角色扮演的 scalable oversight、等等。在訓(xùn)練方面,我們結(jié)合了有監(jiān)督微調(diào)、反饋模型訓(xùn)練以及在線 DPO 等方法。我們還采用了在線模型合并的方法減少對(duì)齊稅。這些做法都大幅提升了模型的基礎(chǔ)能力以及模型的智能水平。
限時(shí)活動(dòng)推薦:軟購618多款正版軟件2折購、QQ超會(huì)15月108元、B站大會(huì)員88元、騰訊視頻128元、愛奇藝138元。
相關(guān)文章
國產(chǎn)游戲《魔女黏糊筆記》上線Steam商店頁面2024-07-29 09:59:35編輯:柒柒 該游戲由墨元素工作室開發(fā),2025-12-12
喜迎周年慶典 《俠客風(fēng)云傳OL》豪俠閣開門停業(yè)
正值《俠客風(fēng)云傳OL》周年慶,齊部逍遠(yuǎn)谷好沒有熱烈。6月27日,萬眾等候的豪俠閣也開門停業(yè),豪俠閣開啟后,俠客散市主界里會(huì)呈現(xiàn)淺顯炊水、初級(jí)炊水的開釋按鍵,開釋后會(huì)燃放更富麗的炊水哦! 【進(jìn)進(jìn)專區(qū)2025-12-12
索僧很早之前公布的一款3D投影眼鏡 HMZ-T1終究上個(gè)月尾正式出售了。那款眼鏡中沒有雅設(shè)念便非常前衛(wèi),內(nèi)置2片OLED里板,別離為每只眼睛供應(yīng)1280×720像素的辯白率,帶給用戶最好的3D視覺體驗(yàn)2025-12-12
LG OLED隱現(xiàn)器32GS95UE 4月上市 賣價(jià)將超1萬元
正在客歲圣誕節(jié)前,LG公布了2024款UltraGear OLED游戲隱現(xiàn)器的預(yù)報(bào)。新的產(chǎn)品線覆蓋32英寸至45英寸,觸及多款產(chǎn)品,而那些新品皆正在隨后的CES 2024大年夜展上表態(tài)。此中的拳頭產(chǎn)品2025-12-12《勇者斗惡龍 VR》預(yù)告視頻公布 4月27日發(fā)售
最近萬代公布了勇者斗惡龍VR發(fā)售的消息,這款游戲?qū)⒃?月底上線,很多玩家也是非常期待,游戲向玩家展示了什么樣的玩法特色了,一起來看看下面視頻介紹吧。今天,萬代南夢(mèng)宮正式公布了Square Enix的《2025-12-12
神仙居風(fēng)景區(qū)是一處天然景沒有雅戰(zhàn)人文元素皆非常給力的特性之天,正在那里能夠感受到唯好的天然景沒有雅微風(fēng)采,統(tǒng)統(tǒng)皆隱得令人溫馨戰(zhàn)迷離,開適旅客挨卡參沒有雅,感受大年夜天然的終究魅力。景區(qū)大要那個(gè)景區(qū)名叫2025-12-12
