Google早就明確表示,今年的I/O大會(huì)將圍繞著AI展開。然而在大會(huì)開始的前一天,OpenAI帶著GPT-4o截胡,似乎打亂了Google原有的陣腳。
I/O大會(huì)開幕式期間,Google CEO皮查伊與高管總共提到121次“AI”。此刻的Google必須在兩個(gè)小時(shí)以內(nèi),祭出自己多年積累的產(chǎn)品服務(wù)和軟硬件優(yōu)勢(shì),與OpenAI爭(zhēng)奪AI領(lǐng)域的最高峰。

圖源谷歌
Gemini 的進(jìn)展:
?
在?I/O 大會(huì)上,谷歌一口氣提了上百次AI,火力全開的發(fā)布了Gemini 1.5 Pro并推出了多種AI工具。 首先Gemini大模型更新,其中Gemini 1.5 Flash可以做到100萬token;Gemini Pro可以做到200萬token。相比之下,GPT-4 Turbo是12.8萬,Claude 3只有20萬。
?
?從上下文的角度,Gemini超過目前所有的大模型。 谷歌表示升級(jí)之后,Gemini 1.5 Pro 能夠同時(shí)處理 2 小時(shí)的視頻、22 小時(shí)的音頻、6 萬多行代碼或 140 多萬字。 谷歌還稱這不是終點(diǎn),未來的目標(biāo)是無限上下文。
此外,在 Google 辦公套件中,Gemini 也將更深度整合,提供自動(dòng)整理郵件和生成數(shù)據(jù)分析表格等功能。

與此同時(shí),令人驚喜的是,Google也推出了對(duì)標(biāo)sora視頻模型的產(chǎn)品-- Veo,可以生成長度超過 1 分鐘,分辨率最高 1080P 的“高質(zhì)量”視頻,并具有多種視覺和電影風(fēng)格。

根據(jù)谷歌官方新聞稿,Veo 具備對(duì)自然語言有先進(jìn)的理解能力,能夠理解“延時(shí)攝影”、“航拍風(fēng)景”等電影術(shù)語。用戶可以使用文本、圖像或視頻提示來指導(dǎo)他們所需的輸出,谷歌表示,這樣產(chǎn)生的視頻“更加連貫一致”,在整個(gè)鏡頭中人物、動(dòng)物和物體的動(dòng)作也更加逼真。
AI搜索全面升級(jí):多輪推理、視頻搜索、AI概覽
谷歌宣布,到今年年底,谷歌搜索的AI概覽將超過10億人。這意味著,谷歌搜索將更加智能,能夠?yàn)橛脩籼峁└鼫?zhǔn)確、更相關(guān)的信息。此外,谷歌搜索還將很快推出多輪推理能力,可將復(fù)雜問題分解處理,并將原本需要幾分鐘甚至幾個(gè)小時(shí)的研究壓縮到在幾秒鐘內(nèi)完成。
在視頻搜索方面,谷歌將支持用戶通過拍攝視頻來進(jìn)行搜索。例如,用戶可以通過拍攝電唱機(jī),來獲取故障排除相關(guān)的AI搜索概述。

Gemini 在 Android 上的整合:Gemini賦能安卓,打造最強(qiáng)AI手機(jī)
谷歌將Gemini大模型嵌入到安卓操作系統(tǒng)中,打造了首個(gè)內(nèi)置端側(cè)AI的移動(dòng)操作系統(tǒng)。這意味著,安卓手機(jī)用戶將能夠享受到更智能、更便捷的AI體驗(yàn)。

具體來說,谷歌在安卓系統(tǒng)中增加了以下AI功能:
- 畫圈即搜:用戶可以直接在手機(jī)屏幕上圈出不懂的問題,Gemini就會(huì)給用戶一步步的問題解答。
- Gemini Live:用戶可以通過文本、語音或影像多種方式進(jìn)行交互,直接與大模型進(jìn)行對(duì)話。
- AI虛擬員工:用戶可以創(chuàng)建一個(gè)AI虛擬員工,將其放入各個(gè)工作群組中,它可以在各個(gè)群聊中提取信息,找到關(guān)鍵信息。
AI Teammate:
- Google 推出了 AI Teammate,將 Gemini 的功能包裝成一個(gè) AI 員工,幫助用戶在工作中整理信息、提取關(guān)鍵信息并進(jìn)行智能反饋。AI Teammate 在辦公套件中的應(yīng)用尤為突出,如在 Gmail 中生成會(huì)議紀(jì)要、在郵件中提取表格文件等。
Notebook LM:
- Google 進(jìn)一步發(fā)展了去年推出的 Notebook LM,作為教育應(yīng)用的探索項(xiàng)目。它能模擬教師身份,講述物理課程,并在用戶提問時(shí)提供準(zhǔn)確的回答,使用戶更好地掌握知識(shí)。
DeepMind 的項(xiàng)目:
- DeepMind 創(chuàng)始人哈薩比斯首次在 Google I/O 上亮相,介紹了新項(xiàng)目 Project Astra。這個(gè)項(xiàng)目旨在探索通用人工智能如何為我們的日常生活提供幫助。通過演示視頻展示了 Astra 的功能,展示了其強(qiáng)大的通用語言與環(huán)境理解能力。
新一代 TPU 硬件 Trilium:
- Google 發(fā)布了代號(hào)為 Trilium 的第六代 TPU 硬件,計(jì)算能力提升 4.7 倍,預(yù)計(jì)將在 2024 年年底面向用戶推出。Trilium 的發(fā)布為 Google AI 技術(shù)的發(fā)展提供了更強(qiáng)大的硬件支持。
Android 15 中的 AI 功能更新:
- Android 15 也加入了多項(xiàng) AI 功能更新,尤其是 Gemini 在 Android 中的更深度整合,使其能夠更好地應(yīng)用于用戶的日常生活中。
今年的 Google I/O 大會(huì)在人工智能領(lǐng)域展示了 Google 在 Gemini、AI Teammate、Notebook LM、DeepMind 項(xiàng)目、新一代 TPU 硬件和 Android 15 中的 AI 功能更新等方面的重要進(jìn)展,顯示了 Google 在 AI 領(lǐng)域的持續(xù)領(lǐng)先地位和創(chuàng)新能力。
谷歌I/O 2024大會(huì)的召開,標(biāo)志著谷歌在AI領(lǐng)域的又一次重大突破。憑借著Gemini大模型的強(qiáng)大實(shí)力,谷歌在AI搜索、操作系統(tǒng)、視頻生成等多個(gè)領(lǐng)域都取得了領(lǐng)先地位。
然而,在AI大模型的競(jìng)爭(zhēng)中,谷歌并非孤軍奮戰(zhàn)。OpenAI、微軟等公司也在不斷加大投入,研發(fā)各自的AI大模型。未來的AI大模型戰(zhàn)火將更加激烈,誰將最終勝出,還有待觀察。