什麼是 Gemini Live
Gemini Live 是一種對話式體驗,可讓您與數位助理進行自由流暢的對話。除了文字輸入之外,Gemini Live 還可以免持輸入。此外,助手會在後台工作,甚至在手機鎖定時也能工作。Gemini Live 開始向 Android 手機(包括部分 Pixel 和三星裝置)上的 Gemini Advanced 訂閱者推出英文版本,並將在未來幾週內擴展到 iOS 和更多語言。
Gemini Live 如何運作
Gemini Live 的介紹提示標題為“與 Gemini 一起直播”,詳細介紹了點擊直播按鈕可啟動麥克風。用戶可以點擊「保持」或「結束」按鈕或說「停止」來關閉麥克風。該提示還指出,某些功能(例如擴充功能)在 Live 中尚不可用。聊天記錄保存在 Gemini 應用程式活動中。 Gemini Extensions 預計稍後將添加,讓用戶可以透過語音控製手機並存取其他應用程式。9to5Google 報告稱,Gemini UI 很乾淨,用戶可以退出應用程式繼續使用手機或在通話時鎖定螢幕。透過鎖定畫面使用 Gemini Live 時,會出現「與 Gemini 一起直播」通知,表示麥克風已開啟並提供結束直播模式按鈕。互動結束後,「最近」歷史清單中會產生一份文字記錄,顯示文字提示和 Gemini 回覆。使用者可以透過點擊螢幕一角的「即時」按鈕來重新啟動對話。
Gemini Live 與新聲音在 Pixel、三星上推出
]
正如 Google 在 Made by Google 2024 期間宣布的那樣,Gemini Live 即將推出,我們今天可以在 Pixel 和其他 Android 手機上看到更廣泛的可用性。
Gemini Live 圖示是一個帶有閃光標誌的波形,出現在 Gemini 覆蓋層和全螢幕應用程式的右下角。
嗨,我是Gemini。我們即將上線,您只需透過交談即可探索複雜的主題或想法。
介紹性提示解釋如何使用底部的大按鈕「保持」或「結束」對話,或說「停止」。 Google一開始就表示,Gemini Extensions 尚未在 Live 中提供,但稍後會推出,讓您可以透過語音控製手機並存取其他應用程式(Gmail、YouTube 等)。
全螢幕 Gemini Live 使用者介面非常乾淨,但您可以退出應用程式以繼續使用手機或鎖定/關閉螢幕以繼續通話。在這種情況下,您會收到「與 Gemini 一起直播」通知,其中註明「麥克風已開啟」以及「結束直播模式」按鈕。
結束對話後,將出現顯示您的提示和 Gemini 回應的文字記錄。它像其他文字聊天一樣出現在「最近」歷史記錄清單中。您可以透過點擊角落的「即時」按鈕來重新啟動對話。
在 Gemini 設定中,您可以使用新的“中斷即時回應”開關(Google特別自豪讓用戶插話)和“Gemini聲音”,可以從 10 個適合明星和太空主題的選項中進行選擇(感謝 Omega192) 。這種新聲音也可以在 Live 之外使用。
- Nova:平靜•中頻聲音
- Ursa:參與 • 中頻聲音
- Vega:明亮•更高的聲音
- Pegasus:參與 • 聲音低沉
- 曲目:精力充沛•聲音低沉
- 天琴座:明亮•聲音更高
- Orion:明亮·聲音低沉
- Dipper:投入 • 聲音低沉
- Eclipse:充滿活力 • 中頻聲音
- 無伴奏合唱:英國口音 • 聲音較高
到目前為止,我們已經在 Pixel 和 Samsung 設備上看到了這一點。 Gemini Live 正在廣泛推廣到 Android 平台。它需要 Gemini Advanced 訂閱,並且可以在全球範圍內使用英語。
]
多年來,我們一直依靠數位助理來設定計時器、播放音樂或控制我們的智慧家庭。這項技術讓工作變得更加容易,並且每天節省了寶貴的時間。
現在,借助生成式人工智慧,我們可以為複雜任務提供全新類型的幫助,從而節省您的時間。透過 Gemini,我們正在重新構想私人助理真正提供幫助的含義。 Gemini 正在不斷發展,以提供人工智慧驅動的行動協助,將提供新水平的幫助,同時更加自然、對話式和直觀。
了解有關新 Gemini 功能的更多信息,該功能將在 Android 和 iOS 上提供。
]
ChoozMo是台灣領先的生成式AI應用公司,為台灣各大電視台提供AI新聞主播服務,包括SET iNews、CTS、Hakka TV。為台北101開發基於LLM的AI客服,支援中文、英文、日文、韓文。此外,他們正在開發 ESG 領域的法學碩士。
Google今天在 Pixel 9 活動上宣布,將為 Gemini 推出新的語音聊天模式,名為 Gemini Live。 Gemini Advanced 訂閱者可以使用,它的工作原理很像 ChatGPT 的語音聊天功能,有多種聲音可供選擇,並且能夠進行對話式交談,甚至無需點擊按鈕即可打斷。
谷歌表示,與 Gemini Live 的對話可以“自由流動”,因此你可以做一些事情,例如在句子中打斷答案或暫停對話並稍後再返回。 Gemini Live 也可以在背景或當您的手機鎖定時運作。谷歌在今年稍早的 I/O 開發者大會上首次宣布 Gemini Live 即將推出,並表示 Gemini Live 將能夠即時解釋影片。
Gemini Live 為 Google 的 AI 助理添加了語音聊天功能。動圖:Google
谷歌還提供了 10 個新的 Gemini 聲音供用戶選擇,名字包括 Ursa 和 Dipper。該功能已於今天開始針對 Android 裝置推出,僅提供英文版本。該公司表示,它將在「未來幾週內」登陸 iOS 並提供更多語言。
除了 Gemini Live 之外,Google還宣布了其 AI 助理的其他功能,包括稍後推出的 Keep、Tasks、Utilities 和 YouTube Music 等應用程式的新擴充功能。 Gemini 也獲得了對螢幕環境的感知,類似於蘋果今年在 WWDC 上宣布的人工智慧功能。谷歌表示,當用戶點擊“詢問此屏幕”或“詢問此視頻”後,Gemini 可以為您提供信息,包括從旅行視頻中提取目的地等詳細信息以添加到谷歌地圖中。
]
這是不可避免的。隨著 Gemini 在 Google 生態系統的各個部分逐漸形成,Android 顯然最終也會效仿。除了新的Pixel 硬體系列之外,Google還宣布將加倍兌現其人工智慧承諾,推出一些支援Gemini 的新功能,其中包括Gemini Live,它可以讓你與它聊天,就像它就在你耳邊一樣。谷歌稱其為新重建的“Gemini 助理體驗”。
Android 用戶將獲得新的 Gemini 覆蓋層。與之前的 Assistant 一樣,Gemini 可以在您需要時隨時長按電源按鈕彈出,並提供有關螢幕上內容的上下文。這可以以不同的方式與多個不同的應用程式配合使用。 Google 的範例包括詢問有關您在 YouTube 影片上觀看的內容的更多資訊。或者,使用它在 Google Messages 等應用程式中生成圖像。 Circle to Search 在大多數 Android 裝置上也有一個小功能提升。您可以在與之互動時選擇並分享材料。
然後,還有今天推出的 Gemini Live。這種體驗感覺最像獨立低俗時代的電影《Her》,但採用的是 Google 方式,而且沒有 ScarJo 的問題。你可以「自然地」與Gemini說話,就像你與另一個人交談一樣,就像華金·菲尼克斯對耳機所做的那樣。是的,新款 Pixel Buds Pro 2 將啟用此功能。谷歌表示,新的 Gemini Live 可以理解意圖,遵循思路,並完成智慧助理以前無法完成的複雜任務。 Gemini Live 甚至可以讓您與它談論生活並追蹤您可能有的任何想法。該公司建議使用它來「集思廣益」適合您技能的潛在工作。讓機器幫你找出你在機器中的位置。
Gemini 將成為 Google 最廣泛使用的人工智慧助手,就像 Google Assistant 一樣。在某種程度上,它仍然存在於 Nest 生態系統中,但 Gemini 取代了曾經的 Google Assistant,成為了得心應手的幫手。唯一的區別是您輸入的方式。Gemini更依賴圖像和直接提示,而這不是我們與 Google Assistant 交談的方式。一旦我們意識到數位助理並不像我們希望的那樣進行“隨意對話”,我們就會訓練自己調低提示音。也許 Gemini 就是 Android 的那個。
谷歌承諾 Gemini 是私有的。該功能需要您的許可才能訪問生態系統中您生活的所有部分,然後它將與您的電子郵件和文件進行交互,並充當其標稱的助手。 Gemini 的一些 Android 功能是在雲端處理的,而大多數「敏感用例」則透過 Gemini Nano 保留在裝置上。
如果您按照 Google 的預期使用 Gemini,Gemini Live 等功能將開始向 Gemini Advanced 訂閱者推出。如果您購買 Pixel 9 或 Pixel 9 Pro,Google 將贈送一年的 Google One AI Premium Plan,其中包括一年免費使用 Gemini Advanced。
]
Kerry Wan/ZDNET
生成式人工智慧最有用(也是最需要的)應用之一是增強語音助手,多年來它相對保持不變。現在,Google在 Gemini 的幫助下對其語音助理體驗進行了多項升級。
在周二舉行的谷歌製造活動上,谷歌將Gemini 設為默認語音助手,用更智能的替代品取代了Google Assistant,它可以被打斷,能夠識別你的谷歌應用程序,甚至可以幫助回答有關屏幕內容的問題。
另外:Google憑藉 Gemini Live 和 Pixel 的人工智慧功能在指數中名列前茅
可以說,Gemini 最大的公告是 Google 在 Google I/O 大會上宣布 Gemini Live 三個月後推出。
Gemini Live 是一款高級語音助手,可就複雜話題進行類人的多輪(或交流)口頭對話,甚至為您提供建議。例如,與助理說話時,您可以中途打斷,助理仍然能聽懂您的意思。您還可以選擇多種聲音來增強您的對話體驗。
然而,有一個問題:只有 Android 裝置上的 Gemini Advanced 訂閱者才能存取它。該功能已在三星和 Pixel 設備上推出。
作為獎勵,Pixel Pro 9 用戶可以訪問 Google One AI Premium 計劃,其中包括訪問 Gemini Advanced - 以及 Gemini Live - 第一年無需額外付費。但對於所有其他 Android 用戶來說,很難說 Gemini Live 是否值得每月支付 20 美元購買 Google One AI Premium Plan。如果您想了解該計劃是否值得,可以透過一個月的試用免費試用。
另外:如何免費試用 Google 新推出的 Gemini Live AI 助手
當在 Google I/O 大會上宣佈時,Gemini Live 還具有多模式功能,使其能夠使用相機查看周圍的世界,並將其作為答案的背景。不過,該功能尚未發布。
Gemini Live 是 GPT-4o 全新改進的語音模式的直接競爭對手,後者俱有相同的對話和多模式功能。與Google一樣,OpenAI 尚未提供影片和螢幕分享功能。