綜合報道,當地時間周三,美國科技巨頭谷歌宣布推出其認為規模最大、功能最強大的人工智能模型Gemini,這種技術能夠處理視頻、音頻和文本等不同內容形式的信息。
谷歌還發布了其最強大的人工智能晶片Cloud TPU v5p,它是在之前的版本基礎上進行的改進。根據谷歌的說法,與TPU v4相比,TPU v5p的浮點運算性能提升了兩倍,它訓練大語言模型的速度比TPU v4快2.8倍。
谷歌表示,該公司備受期待的人工智能模型名為Gemini,對比之前的技術,能夠進行更複雜的推理,理解更加細微的信息。它通過閱讀、過濾和理解信息,可以從數十萬份文件中提取要點,將有助於在從科學到金融的許多領域實現新的突破。
谷歌行政總裁桑達爾·皮查伊在一篇博文中寫道:「這個新模型代表了我們作為一家科技公司所做的最大的科學和工程努力之一,它也是一個多模態基礎模型,可以概括和理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻。」
自OpenAI一年前推出ChatGPT以來,創造了當前人工智能熱潮背後大部分基礎技術的谷歌措手不及,一直在努力開發能夠與這家公司相抗衡的人工智能軟件。谷歌聲稱,已經在其人工智能助手Bard上添加了部分Gemini模型的技術,並表示計劃在明年年初將最先進的Gemini模型完全融入到Bard中。
Gemini Pro表現優於GPT-3.5
谷歌高管們認為,Gemini Pro的表現優於GPT-3.5,但迴避了與GPT-4相比如何的問題。而在今年3月,OpenAI推出了GPT-4。
谷歌DeepMind行政總裁、Gemini團隊代表德米斯·哈薩比斯(Demis Hassabis)在發布會上正面談及GPT-4與Gemini的對比,「我們對系統進行了非常徹底的分析,並進行了基準測試。谷歌運行了32個完善的基準測試來比較這兩個模型,從廣泛的整體測試(如多任務語言理解基準測試)到比較兩個模型生成Python代碼的能力。」哈薩比斯略帶微笑地表示,「我認為我們在32項基準中的30項中大幅領先。」
從發布日起,Gemini可開始應用於Bard和Pixel 8 Pro智能手機,並將很快與谷歌服務中的其他產品集成,包括Chrome、搜索和廣告等。
將發布三大版本
谷歌公司表示,將發布三種版本的Gemini,分別為Gemini Ultra、Gemini Pro和Gemini Nano。每個版本具有不同的信息處理能力,功能最強大的Gemini Ultra版本是為在數據中心運行而設計的,最弱的Gemini Nano版本將在流動裝置上高效運行。
從12月13日開始,開發者和企業客戶可以通過Google AI Studio或Google Cloud Vertex AI中的Gemini API訪問Gemini Pro。Android開發者也可以使用Gemini Nano進行軟件開發。
DeepMind負責產品的副總裁Eli Collins聲稱,Gemini是谷歌DeepMind人工智能部門幫助創造的最強大的人工智能模型,但與該公司之前的大模型相比,它為用戶提供的服務「明顯」更加便宜。
Collins補充說:「因此,Gemini不僅功能更強,效率也高得多。最新的模型仍然需要大量的計算能力來訓練,谷歌正在快速推進這一過程。」