·GPT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機器人,也就是具身智能。
·全世界對大模型強大的生成能力、遷移能力、交互能力感到驚訝卻無法解釋,只能歸結為“涌現(xiàn)”。為了人工智能產業(yè)的健康發(fā)展,必須將科學研究、技術創(chuàng)新、產業(yè)發(fā)展結合起來。要發(fā)展第三代人工智能,必須建立可解釋和魯棒的人工智能理論與方法,否則AI技術永遠難以令人相信。
“通向通用人工智能的道路雖然依然艱難,但大語言模型為AI產業(yè)的發(fā)展打開了一條通向通用AI的寬廣道路。”中國科學院院士、清華大學人工智能研究院院長、清華大學計算機系教授張鈸公開表示,大模型提供了發(fā)展通用硬件和軟件的機會。
傳統(tǒng)AI范式利用特定的算法和規(guī)則完成特定任務,生成式AI范式是基于一種稱為基礎模型的通用模型,通過廣泛文本數(shù)據的訓練,在開領域(open domain,開域)內可以生成類似人類水平的高質量文本、圖像和其他內容,通過微調等方式適配于廣泛的下游任務。生成式AI已經向通用AI邁出一步,第二步是AI智能體,第三步則是具身智能。“GPT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機器人,也就是具身智能?!睆堚撜f,“具身智能的提出有助于構造完整的智能體,讓智能體既有感知,又有思考。不一定要做人形機器人,因為很多時候只要用手或腳就可以了,不需要把硬件搞得非常復雜。”他主張以一定的硬件為基礎進行強化學習研究。
張鈸表示,生成式AI大模型具備三大能力和一大缺點,即強大的生成能力、強大的遷移(推廣)能力、強大的交互能力和幻覺。強大的語言生成能力可基于上下文和過去的對話,在開領域生成多樣性類似人類的連貫文本。強大的遷移能力可以在代理任務上訓練一個模型,通過細調適配到感興趣的下游任務。強大的交互能力包括與人類的交互(人機交互)、機器之間的交互(多智能體)、與環(huán)境的交互(具身智能),通過交互在不同專業(yè)和科學的測試基準上表現(xiàn)出人類水平的智能。而針對幻覺,大模型有時會生成看似合理的編造或無意義的答案。
在工作替代性方面,張鈸表示,人工智能有助于推動經濟增長,建筑、維護、安裝等行業(yè)難以被自動化和智能化,但行政管理等白領工作或可以被AI替代。AI可以提高大多數(shù)人類工作的質量和效率,但被AI完全替代的工作仍是少數(shù)。之所以AI還不能替代大多數(shù)工作,是因為大模型還存在難以逾越的天花板。張鈸表示,大模型的所有工作都是外部提示而非主動,并且在外部提示的情況下利用概率預測完成任務,而人類的工作依靠內部意圖驅動。大語言模型生成語言與人類語言生成只是有行為上的相似性,其內在機制根本不同,大語言模型存在不自知、質量不可控、不可信、不魯棒(魯棒性,指系統(tǒng)對異常情況的適應能力)等天花板,給出不同的提示詞,大模型會輸出不同的回答?!安还苣P投嗝创?,幻覺這個缺點一直存在?!睆堚撜f。
張鈸提出,要發(fā)展第三代人工智能,必須建立可解釋和魯棒的人工智能理論與方法,發(fā)展安全、可控、可信、可靠、可擴展的AI技術,推動AI的創(chuàng)新應用和產業(yè)化。如果不能建立可解釋和魯棒的人工智能理論,AI技術是不可靠的,AI技術永遠難以令人相信?!暗浆F(xiàn)在為止,這個理論還沒有建立起來,這也是人工智能發(fā)展緩慢和曲折的原因。理論建立不起來,是因為受到三個特定限制,過去只能在特定領域利用特定模型解決特定任務,這不利于建立通用理論,而大模型的出現(xiàn)為建立這個理論提供了可能性?!?/p>
張鈸表示,大模型為我們提供了發(fā)展通用硬件和軟件機會。人工智能正進入穩(wěn)步發(fā)展階段,對各行各業(yè)有巨大影響,必須抓住機遇發(fā)展人工智能產業(yè)。但仍有大量不確定性,因為AI不可預測、不可控。全世界對大模型強大的生成能力、遷移能力、交互能力感到驚訝,卻無法解釋,只能歸結為“涌現(xiàn)”。所以為了人工智能產業(yè)的健康發(fā)展,必須將科學研究、技術創(chuàng)新、產業(yè)發(fā)展結合起來。