來(lái)源:北大青鳥(niǎo)總部 2025年04月19日 15:00
AI大模型出現(xiàn)的頻率是越來(lái)越高。不論是ChatGPT的迅猛爆火,還是百度、阿里、華為、訊飛等國(guó)產(chǎn)廠商接連推出的自研大模型,“AI大模型”已經(jīng)不再是遙不可及的前沿技術(shù),而是悄悄滲透到我們?nèi)粘I畹母鱾€(gè)角落。
那么,AI大模型究竟有哪些?
它們之間有什么區(qū)別?
一、什么是AI大模型?先厘清概念別被帶跑偏
說(shuō)到“AI大模型”,有時(shí)候人們會(huì)自動(dòng)把它和“AI”劃等號(hào)。其實(shí),大模型只是AI的一個(gè)分支。AI的范圍非常廣,大模型主要是指參數(shù)量巨大、訓(xùn)練語(yǔ)料豐富、具有強(qiáng)泛化能力的人工智能模型。這些模型往往以深度學(xué)習(xí)為核心,通過(guò)海量數(shù)據(jù)訓(xùn)練,獲得驚人的語(yǔ)言理解與生成能力,部分還具備多模態(tài)處理能力(圖像、視頻、聲音等)。
通俗點(diǎn)說(shuō),如果把AI比作一個(gè)學(xué)校,那大模型就像是那些學(xué)霸——不僅學(xué)得多,還特別會(huì)舉一反三。
二、國(guó)外主流AI大模型盤(pán)點(diǎn):OpenAI、Google、Anthropic……
目前,國(guó)際AI大模型的代表玩家主要集中在美國(guó)硅谷一帶,尤其是幾個(gè)科技巨頭和新銳AI公司,爭(zhēng)相推出自己的“超大腦”。下面我們來(lái)逐個(gè)了解。
1. GPT系列(OpenAI)
OpenAI 的 GPT 系列可能是目前最廣為人知的大模型產(chǎn)品。自從 GPT-3 開(kāi)始進(jìn)入大眾視野,再到 GPT-4 爆發(fā)式應(yīng)用,OpenAI 已經(jīng)不再是那個(gè)“非營(yíng)利科研組織”,而是微軟重金支持下的超級(jí)科技公司。
GPT-3:2020年發(fā)布,參數(shù)量達(dá)1750億,標(biāo)志著“語(yǔ)言生成”能力的質(zhì)變。
GPT-4:加入多模態(tài)能力,不僅能看圖說(shuō)話,理解復(fù)雜指令,還強(qiáng)化了推理能力。
GPT-4 Turbo:OpenAI在2023年底推出的優(yōu)化版本,既便宜又快。
GPT模型背后的訓(xùn)練成本高達(dá)數(shù)億美元,數(shù)據(jù)涉及大量英文網(wǎng)頁(yè)、代碼、書(shū)籍等等,英語(yǔ)領(lǐng)域表現(xiàn)極其優(yōu)異。
2. Gemini系列(Google DeepMind)
Google 也不甘落后,在 Bard 之后推出 Gemini 系列,旨在全方位對(duì)抗 GPT。Gemini 一開(kāi)始就強(qiáng)調(diào)多模態(tài)、工具調(diào)用能力、數(shù)學(xué)推理等方面,是 DeepMind 和 Google Brain 聯(lián)合打造的結(jié)晶。
Gemini 1.5 已于2024年上線,并公開(kāi)支持圖像+代碼+視頻+音頻輸入,力求實(shí)現(xiàn)“通用人工智能”的一環(huán)。
3. Claude系列(Anthropic)
Anthropic 是由 OpenAI 前員工創(chuàng)辦的初創(chuàng)公司,得到了亞馬遜和Google投資。他們的 Claude 模型以“安全、可控”著稱(chēng),尤其是在合規(guī)性方面下了很大功夫。
Claude 2 和 Claude 3 的語(yǔ)氣更溫和,適合企業(yè)場(chǎng)景,擅長(zhǎng)結(jié)構(gòu)化輸出、摘要、文檔理解等任務(wù)。
4. LLaMA系列(Meta)
Meta(Facebook 母公司)推出的 LLaMA(大規(guī)模語(yǔ)言模型)系列雖然在公眾視野中的熱度不如 GPT,但卻在科研和開(kāi)源圈影響深遠(yuǎn),很多開(kāi)源大模型都以其為基礎(chǔ)改造。
三、國(guó)產(chǎn)AI大模型強(qiáng)勢(shì)崛起,不容小覷
說(shuō)到國(guó)產(chǎn)AI大模型,這一年來(lái)真的可以說(shuō)是“百模大戰(zhàn)”,但其中也確實(shí)出現(xiàn)了不少亮眼的選手,不僅在中文處理上更勝一籌,也在開(kāi)放性和行業(yè)落地方面加快了步伐。
1. 文心一言(百度)
文心一言屬于百度“文心大模型”家族,是國(guó)內(nèi)最早推出公開(kāi)對(duì)話產(chǎn)品的大模型之一,目前已經(jīng)進(jìn)化到文心大模型4.0.
特點(diǎn):
中文能力強(qiáng)
接入百度搜索、地圖等生態(tài)服務(wù)
已在金融、政務(wù)、教育等多個(gè)場(chǎng)景中部署
2. 通義千問(wèn)(阿里)
阿里的“通義千問(wèn)”大模型也已對(duì)公眾開(kāi)放,并支持企業(yè)定制開(kāi)發(fā),是阿里云智能生態(tài)的一部分。
強(qiáng)調(diào)代碼生成、文案創(chuàng)作、電商運(yùn)營(yíng)等場(chǎng)景
與釘釘、淘寶等產(chǎn)品打通
3. 訊飛星火(科大訊飛)
被稱(chēng)為“教育場(chǎng)景殺手锏”,科大訊飛的星火認(rèn)知大模型特別適合在中文理解、知識(shí)問(wèn)答、作文批改等細(xì)分領(lǐng)域發(fā)力。
深耕中文教育
應(yīng)用于課堂教學(xué)、知識(shí)庫(kù)、語(yǔ)音轉(zhuǎn)寫(xiě)等系統(tǒng)
4. 百川智能、月之暗面、智譜AI等新銳力量
除了傳統(tǒng)大廠,2023年涌現(xiàn)出一大批創(chuàng)業(yè)公司,比如“月之暗面(Moonshot)”、“百川智能”、“智譜清言(GLM系列)”,都在語(yǔ)言生成、搜索增強(qiáng)、代碼理解等領(lǐng)域展開(kāi)探索。
四、多模態(tài)大模型:下一場(chǎng)競(jìng)賽的焦點(diǎn)
除了語(yǔ)言模型,未來(lái)的大模型更看重“多模態(tài)融合”能力。比如,能讓 AI 同時(shí)處理圖像、語(yǔ)音、文字等信息,具備更強(qiáng)的感知、理解和創(chuàng)造力。
例如:
GPT-4 支持圖像輸入,可以識(shí)別照片、解釋圖表。
Gemini 支持音視頻輸入,具備更自然的人機(jī)交互能力。
百度、華為也都在開(kāi)發(fā)能生成視頻的模型。
這些能力將會(huì)廣泛應(yīng)用在AI助理、虛擬主播、自動(dòng)視頻剪輯、智能客服、醫(yī)學(xué)影像分析等新興領(lǐng)域。
五、AI大模型的“冷知識(shí)”:你可能不知道的事
訓(xùn)練成本極高:GPT-4 的訓(xùn)練可能耗資超過(guò)1億美元,光電費(fèi)和芯片資源就讓不少小公司望而卻步。
數(shù)據(jù)來(lái)源復(fù)雜:為了訓(xùn)練模型,許多公司抓取了海量網(wǎng)頁(yè)、書(shū)籍、代碼庫(kù),但也因此面臨版權(quán)爭(zhēng)議。
并非越大越好:參數(shù)量大固然強(qiáng),但“小而精”的專(zhuān)用模型也逐漸成為主流,如醫(yī)療領(lǐng)域的小模型。
模型偏見(jiàn)問(wèn)題仍待解決:即便再智能,大模型也會(huì)有“偏見(jiàn)”,尤其是種族、性別、政治傾向方面的問(wèn)題。
六、普通人該如何看待大模型的發(fā)展?
我們不需要每個(gè)人都去研究 Transformer 結(jié)構(gòu),但可以從以下幾個(gè)方面與大模型共處:
善用工具:寫(xiě)稿、翻譯、做表格、寫(xiě)代碼……你完全可以把大模型當(dāng)作你的“超級(jí)助手”。
注意隱私:在使用 AI 工具時(shí),盡量別輸入敏感信息,保護(hù)自己的數(shù)據(jù)安全。
持續(xù)學(xué)習(xí):AI 不會(huì)讓人失業(yè),但會(huì)讓不懂 AI 的人更容易被替代。哪怕只是會(huì)提問(wèn),也比什么都不懂強(qiáng)。
總結(jié)
回頭看看這幾年來(lái)AI大模型的發(fā)展,從 GPT-2 到 GPT-4.從文心一言到通義千問(wèn),從代碼生成到多模態(tài)理解,人類(lèi)在人工智能的探索上,邁出了實(shí)實(shí)在在的一大步。但這場(chǎng)旅程,還遠(yuǎn)遠(yuǎn)沒(méi)有結(jié)束。