「中國的大模型很多,但是基於大模型開發出來的AI原生應用卻非常少。」11月15日,在深圳2023西麗湖論壇上,百度創始人、董事長兼首席執行官李彥宏談及國內AI行業現狀時如是說。當天,他分享了關於AI原生時代的兩個「冷思考」和三個「熱驅動」。
李彥宏在兩個「冷思考」中指出,截至10月份,國內已經發布238個大模型,大模型太多,而模型之上開發的AI原生應用太少。他同時表示,許多行業、企業、甚至城市都想從頭訓練自己的專用大模型,但專用大模型沒有智能湧現能力,價值非常有限。
談及「熱驅動」時,李彥宏表示,強大的基礎大模型能驅動AI原生應用爆發,當前,最好的AI原生應用還沒出現,「AI原生時代一定會有優秀的AI原生應用,是基於這些大模型開發出來的。與之相對,AI原生應用也會驅動模型、芯片等AI技術棧的發展。只有通過更多的場景落地應用,才能夠形成更大的數據飛輪,才能夠讓芯片做到夠用和好用。」
他特別指出,擁抱AI時代需要一把手驅動,「因為只有CEO,才會關心新技術對自己業務的關鍵指標是不是產生了正向作用。」
具備智能湧現能力才是關鍵
「我們需要100萬量級的AI原生應用,但是不需要100個大模型。」李彥宏指出,在全球市場上,AI原生應用正在成為主要趨勢。他提及,截至10月份,國內已經發布了238個大模型,相較於6月份的79個,在四個月內增長三倍,但相較於國外的幾十基礎大模型和上千個AI原生應用來看,國內AI原生應用數量卻很少。
李彥宏表示,「不斷地重複開發基礎大模型是對社會資源的極大浪費」,李彥宏回顧PC時代和移動互聯網時代表示,各種PC軟件都基於Windows系統開發,移動時代的操作系統也僅有安卓和iOS兩家,大模型類似操作系統,那麼最終開發者只會依賴為數不多的大模型開發AI原生應用。
「由於沒有智能湧現能力,專用大模型的價值非常有限。」李彥宏分析說,很多行業、企業甚至城市都在買卡、囤芯片,建智算中心,想從頭訓練自己的專用大模型,殊不知這樣煉出來的大模型是沒有智能湧現能力的。
「智能湧現」即為大模型觸類旁通的能力,也就是沒有教過的東西,大模型也會,「只有當你的模型的參數規模足夠大,訓練數據量足夠多並且能夠不斷投入,進行迭代,才能夠產生智能湧現。」
李彥宏認為,「大模型的產業化模式,應該是把基礎模型的通用能力和行業領域的專有知識相結合。」也就是說,大模型套小模型,專用小模型反應快、成本低,大模型更智能,可以用來兜底。他直言,「國內有200多個大模型,上了這個榜單、進了那個排名,但其實調用量是很小的。文心大模型一家的調用量比這200多家大模型的調用量加起來還要多。」
AI是一把手工程
「我見到很多企業,上上下下都非常重視這次機會,但是對問題的本質理解不深,」李彥宏提及當前行業現象說,CEO把任務交給IT負責人,以為「自己搞個基礎模型,或者按照網上傳播的評測方法來挑選一款評分高的大模型,」就是擁抱AI時代了,這其實是對公司和社會資源的極大浪費。
「為什麼需要一把手來驅動?因為只有CEO才會關心新技術對自己業務的關鍵指標是不是產生了正向作用。」李彥宏說,大模型有沒有對互聯網公司的DAU、時長、用戶留存這些指標產生正向影響,有沒有對企業的收入、利潤、成本產生影響,才是問題的本質。
他以百度文庫舉例,經過AI原生化重構後的百度文庫,能夠在1分鐘內生成一個20幾頁的PPT,包括圖表生成、格式美化等,而且幾乎是零成本,實現了從內容工具到生產力工具的轉變。因為這一改造,「文庫的付費率有了明顯的提升,這就是我說的AI對業務關鍵指標的促進作用。」
「在百度,我們堅決地對旗下各產品線進行了AI原生化重構,」李彥宏提及,AI原生的概念,肯定會先被C端用戶和創業公司接受,其次是中小企業,最後才是大企業。大公司分工明確,需要CEO主動引領變革。
文心4.0四大核心能力有明顯提升
在李彥宏看來,強大的基礎大模型會驅動AI原生應用的爆發,「中國有領先的基礎大模型,這是AI原生應用發展的堅實基礎,是底層的能力。」
他介紹說,自3月16日基於文心大模型3.0的文心一言發布後,文心大模型持續迭代,在上個月升級至4.0版本,在文心一言的網站和APP上叫做專業版。在理解、生成、邏輯和記憶四大能力上,文心4.0都有明顯提升。自8月31日文心一言向全社會開放以來,文心大模型的API調用量,呈現指數級的增長。
「而AI原生應用,就是基於大模型智能湧現後產生的理解、生成、邏輯和記憶能力而開發出來的應用。這些能力是過去的時代所不具備的,因而才能打開無限的創新空間。」
與之相對,李彥宏表示,模型、芯片等AI時代的技術棧,也需要AI原生應用的驅動。「好的應用會帶動市場,倒逼市場變化。他以新能源汽車產業作類比表示,新能源減免購置稅、上路不限號不限行等措施,有效拉動了新能源汽車產業的快速增長,AI產業也是需求驅動,應該在需求側、應用側發力,鼓勵企業調用大模型來開發AI原生應用,用市場推動產業發展。「只有通過更多的場景落地應用,才可以形成更大的數據飛輪,才能讓芯片做到夠用、好用」。李彥宏說。(記者 朱輝豪 )