Gemini Live 是什麼

August 16, 2024

什麼是 Gemini Live

Gemini Live 是一種對話式體驗,可讓您與數位助理進行自由流暢的對話。除了文字輸入之外,Gemini Live 還可以免持輸入。此外,助手會在後台工作,甚至在手機鎖定時也能工作。Gemini Live 開始向 Android 手機(包括部分 Pixel 和三星裝置)上的 Gemini Advanced 訂閱者推出英文版本,並將在未來幾週內擴展到 iOS 和更多語言。

Gemini Live 如何運作

Gemini Live 的介紹提示標題為“與 Gemini 一起直播”,詳細介紹了點擊直播按鈕可啟動麥克風。用戶可以點擊「保持」或「結束」按鈕或說「停止」來關閉麥克風。該提示還指出,某些功能(例如擴充功能)在 Live 中尚不可用。聊天記錄保存在 Gemini 應用程式活動中。 Gemini Extensions 預計稍後將添加,讓用戶可以透過語音控製手機並存取其他應用程式。9to5Google 報告稱,Gemini UI 很乾淨,用戶可以退出應用程式繼續使用手機或在通話時鎖定螢幕。透過鎖定畫面使用 Gemini Live 時,會出現「與 Gemini 一起直播」通知,表示麥克風已開啟並提供結束直播模式按鈕。互動結束後,「最近」歷史清單中會產生一份文字記錄,顯示文字提示和 Gemini 回覆。使用者可以透過點擊螢幕一角的「即時」按鈕來重新啟動對話。

Gemini Live 與新聲音在 Pixel、三星上推出

影像]

正如 Google 在 Made by Google 2024 期間宣布的那樣,Gemini Live 即將推出,我們今天可以在 Pixel 和其他 Android 手機上看到更廣泛的可用性。

Gemini Live 圖示是一個帶有閃光標誌的波形,出現在 Gemini 覆蓋層和全螢幕應用程式的右下角。

嗨,我是Gemini。我們即將上線,您只需透過交談即可探索複雜的主題或想法。

介紹性提示解釋如何使用底部的大按鈕「保持」或「結束」對話,或說「停止」。 Google一開始就表示,Gemini Extensions 尚未在 Live 中提供,但稍後會推出,讓您可以透過語音控製手機並存取其他應用程式(Gmail、YouTube 等)。

全螢幕 Gemini Live 使用者介面非常乾淨,但您可以退出應用程式以繼續使用手機或鎖定/關閉螢幕以繼續通話。在這種情況下,您會收到「與 Gemini 一起直播」通知,其中註明「麥克風已開啟」以及「結束直播模式」按鈕。

結束對話後,將出現顯示您的提示和 Gemini 回應的文字記錄。它像其他文字聊天一樣出現在「最近」歷史記錄清單中。您可以透過點擊角落的「即時」按鈕來重新啟動對話。

在 Gemini 設定中,您可以使用新的“中斷即時回應”開關(Google特別自豪讓用戶插話)和“Gemini聲音”,可以從 10 個適合明星和太空主題的選項中進行選擇(感謝 Omega192) 。這種新聲音也可以在 Live 之外使用。

  • Nova:平靜•中頻聲音
  • Ursa:參與 • 中頻聲音
  • Vega:明亮•更高的聲音
  • Pegasus:參與 • 聲音低沉
  • 曲目:精力充沛•聲音低沉
  • 天琴座:明亮•聲音更高
  • Orion:明亮·聲音低沉
  • Dipper:投入 • 聲音低沉
  • Eclipse:充滿活力 • 中頻聲音
  • 無伴奏合唱:英國口音 • 聲音較高

到目前為止,我們已經在 Pixel 和 Samsung 設備上看到了這一點。 Gemini Live 正在廣泛推廣到 Android 平台。它需要 Gemini Advanced 訂閱,並且可以在全球範圍內使用英語。

影像]

多年來,我們一直依靠數位助理來設定計時器、播放音樂或控制我們的智慧家庭。這項技術讓工作變得更加容易,並且每天節省了寶貴的時間。

現在,借助生成式人工智慧,我們可以為複雜任務提供全新類型的幫助,從而節省您的時間。透過 Gemini,我們正在重新構想私人助理真正提供幫助的含義。 Gemini 正在不斷發展,以提供人工智慧驅動的行動協助,將提供新水平的幫助,同時更加自然、對話式和直觀。

了解有關新 Gemini 功能的更多信息,該功能將在 Android 和 iOS 上提供。

影像]

ChoozMo是台灣領先的生成式AI應用公司,為台灣各大電視台提供AI新聞主播服務,包括SET iNews、CTS、Hakka TV。為台北101開發基於LLM的AI客服,支援中文、英文、日文、韓文。此外,他們正在開發 ESG 領域的法學碩士。

Google今天在 Pixel 9 活動上宣布,將為 Gemini 推出新的語音聊天模式,名為 Gemini Live。 Gemini Advanced 訂閱者可以使用,它的工作原理很像 ChatGPT 的語音聊天功能,有多種聲音可供選擇,並且能夠進行對話式交談,甚至無需點擊按鈕即可打斷。

谷歌表示,與 Gemini Live 的對話可以“自由流動”,因此你可以做一些事情,例如在句子中打斷答案或暫停對話並稍後再返回。 Gemini Live 也可以在背景或當您的手機鎖定時運作。谷歌在今年稍早的 I/O 開發者大會上首次宣布 Gemini Live 即將推出,並表示 Gemini Live 將能夠即時解釋影片。

Gemini Live 為 Google 的 AI 助理添加了語音聊天功能。動圖:Google

谷歌還提供了 10 個新的 Gemini 聲音供用戶選擇,名字包括 Ursa 和 Dipper。該功能已於今天開始針對 Android 裝置推出,僅提供英文版本。該公司表示,它將在「未來幾週內」登陸 iOS 並提供更多語言。

除了 Gemini Live 之外,Google還宣布了其 AI 助理的其他功能,包括稍後推出的 Keep、Tasks、Utilities 和 YouTube Music 等應用程式的新擴充功能。 Gemini 也獲得了對螢幕環境的感知,類似於蘋果今年在 WWDC 上宣布的人工智慧功能。谷歌表示,當用戶點擊“詢問此屏幕”或“詢問此視頻”後,Gemini 可以為您提供信息,包括從旅行視頻中提取目的地等詳細信息以添加到谷歌地圖中。

影像]

這是不可避免的。隨著 Gemini 在 Google 生態系統的各個部分逐漸形成,Android 顯然最終也會效仿。除了新的Pixel 硬體系列之外,Google還宣布將加倍兌現其人工智慧承諾,推出一些支援Gemini 的新功能,其中包括Gemini Live,它可以讓你與它聊天,就像它就在你耳邊一樣。谷歌稱其為新重建的“Gemini 助理體驗”。

Android 用戶將獲得新的 Gemini 覆蓋層。與之前的 Assistant 一樣,Gemini 可以在您需要時隨時長按電源按鈕彈出,並提供有關螢幕上內容的上下文。這可以以不同的方式與多個不同的應用程式配合使用。 Google 的範例包括詢問有關您在 YouTube 影片上觀看的內容的更多資訊。或者,使用它在 Google Messages 等應用程式中生成圖像。 Circle to Search 在大多數 Android 裝置上也有一個小功能提升。您可以在與之互動時選擇並分享材料。

然後,還有今天推出的 Gemini Live。這種體驗感覺最像獨立低俗時代的電影《Her》,但採用的是 Google 方式,而且沒有 ScarJo 的問題。你可以「自然地」與Gemini說話,就像你與另一個人交談一樣,就像華金·菲尼克斯對耳機所做的那樣。是的,新款 Pixel Buds Pro 2 將啟用此功能。谷歌表示,新的 Gemini Live 可以理解意圖,遵循思路,並完成智慧助理以前無法完成的複雜任務。 Gemini Live 甚至可以讓您與它談論生活並追蹤您可能有的任何想法。該公司建議使用它來「集思廣益」適合您技能的潛在工作。讓機器幫你找出你在機器中的位置。

Gemini 將成為 Google 最廣泛使用的人工智慧助手,就像 Google Assistant 一樣。在某種程度上,它仍然存在於 Nest 生態系統中,但 Gemini 取代了曾經的 Google Assistant,成為了得心應手的幫手。唯一的區別是您輸入的方式。Gemini更依賴圖像和直接提示,而這不是我們與 Google Assistant 交談的方式。一旦我們意識到數位助理並不像我們希望的那樣進行“隨意對話”,我們就會訓練自己調低提示音。也許 Gemini 就是 Android 的那個。

谷歌承諾 Gemini 是私有的。該功能需要您的許可才能訪問生態系統中您生活的所有部分,然後它將與您的電子郵件和文件進行交互,並充當其標稱的助手。 Gemini 的一些 Android 功能是在雲端處理的,而大多數「敏感用例」則透過 Gemini Nano 保留在裝置上。

如果您按照 Google 的預期使用 Gemini,Gemini Live 等功能將開始向 Gemini Advanced 訂閱者推出。如果您購買 Pixel 9 或 Pixel 9 Pro,Google 將贈送一年的 Google One AI Premium Plan,其中包括一年免費使用 Gemini Advanced。

影像]

Kerry Wan/ZDNET

生成式人工智慧最有用(也是最需要的)應用之一是增強語音助手,多年來它相對保持不變。現在,Google在 Gemini 的幫助下對其語音助理體驗進行了多項升級。

在周二舉行的谷歌製造活動上,谷歌將Gemini 設為默認語音助手,用更智能的替代品取代了Google Assistant,它可以被打斷,能夠識別你的谷歌應用程序,甚至可以幫助回答有關屏幕內容的問題。

另外:Google憑藉 Gemini Live 和 Pixel 的人工智慧功能在指數中名列前茅

可以說,Gemini 最大的公告是 Google 在 Google I/O 大會上宣布 Gemini Live 三個月後推出。

Gemini Live 是一款高級語音助手,可就複雜話題進行類人的多輪(或交流)口頭對話,甚至為您提供建議。例如,與助理說話時,您可以中途打斷,助理仍然能聽懂您的意思。您還可以選擇多種聲音來增強您的對話體驗。

然而,有一個問題:只有 Android 裝置上的 Gemini Advanced 訂閱者才能存取它。該功能已在三星和 Pixel 設備上推出。

作為獎勵,Pixel Pro 9 用戶可以訪問 Google One AI Premium 計劃,其中包括訪問 Gemini Advanced - 以及 Gemini Live - 第一年無需額外付費。但對於所有其他 Android 用戶來說,很難說 Gemini Live 是否值得每月支付 20 美元購買 Google One AI Premium Plan。如果您想了解該計劃是否值得,可以透過一個月的試用免費試用。

另外:如何免費試用 Google 新推出的 Gemini Live AI 助手

當在 Google I/O 大會上宣佈時,Gemini Live 還具有多模式功能,使其能夠使用相機查看周圍的世界,並將其作為答案的背景。不過,該功能尚未發布。

Gemini Live 是 GPT-4o 全新改進的語音模式的直接競爭對手,後者俱有相同的對話和多模式功能。與Google一樣,OpenAI 尚未提供影片和螢幕分享功能。


< 回到列表