大模型領(lǐng)域,開(kāi)源與閉源之爭一直是技術(shù)和產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。阿里云通義千問(wèn)最新發(fā)布的Qwen2系列模型,為這場(chǎng)爭論提供了最新的答案。
6月7日,通義千問(wèn)推出開(kāi)源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整體性能相比Qwen1.5-110B大幅提升!一舉超越了美國最強的開(kāi)源模型Llama3-70B,更是將文心4.0等中國眾多閉源模型甩在身后,登上最強開(kāi)源大模型的寶座。
此前存在一種觀(guān)點(diǎn)認為在大模型的開(kāi)發(fā)上,閉源模型因為其龐大的投資和資源積累,相較開(kāi)源模型具有不可比擬的優(yōu)勢,導致了一種看似共識的觀(guān)念:開(kāi)源模型難以追趕閉源模型的步伐。
單一的公司的閉源模型,如果有大量資金和資源投入,的確可以在短期內推動(dòng)技術(shù)的發(fā)展,這一點(diǎn)在OpenAI上已經(jīng)得到了驗證。而且不可否認,選擇閉源的OpenAI在性能上仍然是業(yè)界最強。
而這次阿里云Qwen2的發(fā)布,表明開(kāi)源模型同樣能夠達到甚至超越閉源模型的高性能。這不僅讓開(kāi)源模型落后閉源模型的論調不攻自破,也再次證明了開(kāi)源大模型不僅不會(huì )越來(lái)越落后,在技術(shù)上更是有著(zhù)無(wú)限的可能。開(kāi)源大模型能夠做到足夠強,并且會(huì )越來(lái)越強。
同時(shí)這也是對開(kāi)源價(jià)值的再一次闡釋?zhuān)琎wen系列的開(kāi)源模型除了為技術(shù)社區貢獻了一項重要的資源,也鼓勵了全球性的創(chuàng )新合作,進(jìn)一步強化了開(kāi)源大模型生態(tài)系統的活力和包容性。
值得一提的是,阿里云在1個(gè)月前剛剛發(fā)布中文場(chǎng)景性能超過(guò)GPT-4的閉源模型——通義千問(wèn)2.5,從這個(gè)角度來(lái)看開(kāi)閉源的路線(xiàn)選擇,阿里云實(shí)際上是兩條腿走路。既利用開(kāi)源的優(yōu)勢進(jìn)行廣泛的技術(shù)傳播和創(chuàng )新,又通過(guò)閉源的方式保障關(guān)鍵技術(shù)的領(lǐng)先和商業(yè)應用的穩定。這種類(lèi)似于雙軌制的策略,使得阿里云能夠在技術(shù)創(chuàng )新和商業(yè)化應用中取得平衡,實(shí)現技術(shù)價(jià)值的最大化。
所以,開(kāi)源與閉源并不矛盾,而是在不同的場(chǎng)景和需求下扮演著(zhù)各自獨特的角色,這并不是一道非此即彼的選擇題,也是時(shí)候為兩者的路線(xiàn)之爭畫(huà)下休止符了。
事實(shí)上,過(guò)去10個(gè)月里,這樣的場(chǎng)景并不是阿里云開(kāi)源大模型僅有的高光時(shí)刻。據了解,Qwen系列模型總下載量已突破1600萬(wàn)次。在全球開(kāi)源社區出現了超過(guò)1500款基于Qwen二次開(kāi)發(fā)的模型,Qwen系列的72B、110B模型多次登頂HuggingFace 的Open LLM Leaderboard開(kāi)源模型榜單,其國際社會(huì )認可度及開(kāi)發(fā)者好感度可見(jiàn)一斑。
大洋彼岸的Meta試圖用Llama系列一統開(kāi)源天下,而阿里的通義千問(wèn)的出現為全球開(kāi)發(fā)者提供了另一項選擇,也讓我們看到了“國外一開(kāi)源,國內就自主”說(shuō)法的偏頗。市場(chǎng)會(huì )用腳投票,以Qwen為代表的國內開(kāi)源模型所作出的貢獻被長(cháng)期忽視的現狀,一定會(huì )隨著(zhù)更多全球企業(yè)和開(kāi)發(fā)者的認可,逐漸扭轉過(guò)來(lái)。
開(kāi)源的Qwen,開(kāi)放的阿里云
開(kāi)源與互聯(lián)網(wǎng)的發(fā)展緊密相連,自1970年代Unix和互聯(lián)網(wǎng)問(wèn)世之初,開(kāi)源就隨之出現。如果不是開(kāi)源運動(dòng)的推進(jìn),許多技術(shù)仍可能被少數巨頭企業(yè)所壟斷,阻礙科技普惠程度,我們所見(jiàn)證的科技創(chuàng )新浪潮也將不復存在。
對于大模型行業(yè)來(lái)說(shuō),有了更好的開(kāi)源模型,才能夠吸引更多人才參與到相關(guān)技術(shù)創(chuàng )新研究中。有了更好的開(kāi)源模型,更多中小企業(yè)才能真正用上大模型,才會(huì )有更多對大模型產(chǎn)品應用的探索。
阿里云對開(kāi)源的堅持,本質(zhì)上是相信開(kāi)放的力量,也就是阿里云CTO周靖人所說(shuō),“堅持開(kāi)源開(kāi)放是阿里云的重要策略,我們希望打造一朵AI時(shí)代最開(kāi)放的云,讓算力更普惠、讓AI更普及?!边@種堅定的開(kāi)源策略,不僅為技術(shù)創(chuàng )新提供了土壤,也為全球開(kāi)發(fā)者提供了平臺。
開(kāi)放是為了服務(wù)好客戶(hù),阿里云百煉集成了國內外主流優(yōu)質(zhì)大模型,提供模型選型、微調訓練、安全套件、模型部署等服務(wù)和全鏈路的應用開(kāi)發(fā)工具。
開(kāi)放也是為了生態(tài)的繁榮,把餅做大,才能更好的分餅。在阿里云魔搭社區上,匯聚了大量開(kāi)源模型,成為國內開(kāi)發(fā)者最活躍的AI社區。
選擇開(kāi)源還是閉源,不僅是企業(yè)的戰略決策,更會(huì )影響商業(yè)模式。不可否認的是大模型的開(kāi)源存在商業(yè)模式不明朗的問(wèn)題,比如扎克伯格也一直在評估自身能否從云服務(wù)廠(chǎng)商使用Llama相關(guān)收入中進(jìn)行分成,畢竟Meta不太可能為了Llama去開(kāi)辟云計算業(yè)務(wù)。
而對阿里云這樣一家提供基礎設施的云廠(chǎng)商來(lái)說(shuō),商業(yè)邏輯就十分清晰了。在大模型技術(shù)帶動(dòng)云計算增量需求,幾乎是一個(gè)確定性趨勢的背景下,Qwen的開(kāi)源不需要帶來(lái)直接的商業(yè)化收益,而是吸引更多的廠(chǎng)商和開(kāi)發(fā)者,來(lái)使用阿里云打造的基礎設施,以及包括閉源模型在內的相關(guān)服務(wù),從底層的算力基座,到大模型應用的構建,再到開(kāi)放的AI生態(tài),從而形成完整的商業(yè)模式。
通過(guò)親自下場(chǎng)打造并開(kāi)源Qwen系列模型,同時(shí)為大模型的落地提供完善的工具和平臺,阿里云走出一條與Meta、微軟、AWS等頂級玩家不同的道路,這種云+AI的示范效應,已成為一種行業(yè)標準,對客戶(hù)選擇阿里云來(lái)探索大模型提供了一種天然的說(shuō)服力。
這在全球大模型廠(chǎng)商中也是獨一份。
Qwen是阿里AGI愿景的重要拼圖
在A(yíng)GI成為科技巨頭們新戰場(chǎng)的當下,阿里巴巴清晰地表明了其在這一領(lǐng)域的堅定信心和戰略布局。在阿里發(fā)布的2024財年致股東信中,明確提出電商和云計算是阿里的兩大核心業(yè)務(wù),并將通過(guò)持續投資保持基礎技術(shù)的領(lǐng)先地位,包括人工智能在內的創(chuàng )新。
從技術(shù)發(fā)展的角度來(lái)看,AI的進(jìn)步經(jīng)歷了數次重要的飛躍,已經(jīng)深刻改變了各個(gè)行業(yè)的面貌。云計算的普及進(jìn)一步加速了AI的發(fā)展,使得大規模數據處理和復雜模型訓練成為可能。在這一歷史背景下,阿里云通過(guò)其云計算基礎設施和持續的技術(shù)創(chuàng )新,推動(dòng)了AI技術(shù)的前沿探索,Qwen的領(lǐng)先以及在全球范圍獲得了認可,正是阿里云計算與AI結合戰略的產(chǎn)物。
從商業(yè)發(fā)展的角度,技術(shù)創(chuàng )新一直是企業(yè)競爭力的核心驅動(dòng)力。阿里云通過(guò)將AI與云計算的深度融合,不僅開(kāi)辟了在A(yíng)I時(shí)代的商業(yè)模式,也獲得了持續增長(cháng)的路徑。
在近期與摩根大通的對話(huà)中,阿里巴巴副主席蔡崇信再次表示AI和云計算的結合至關(guān)重要,并強調了阿里對AGI愿景的堅定信念?,F在來(lái)看,阿里云已然為這一愿景打造了一塊關(guān)鍵拼圖