Google Drive新功能!PDF即時轉AI語音總結

Ai




NotebookLM最受歡迎功能擴展至Google Drive,製作PDF音頻概覽

Google最新推出的NotebookLM,是一款強大的AI研究助手,內含多種功能讓用戶更輕鬆進行深入調查。當中如音頻和視頻概覽等特色,令學習過程更生動有趣。受其受歡迎程度啟發,Google決定把其中一項功能擴展至其他應用程式。

近日,Google開始將NotebookLM的音頻概覽功能帶到Google Drive中,讓用戶能將儲存在Drive的PDF文件轉換成類似Podcast風格的音頻摘要。當你在Google Drive打開PDF文件時,會在文件預覽頁頂部看到一個專門用來生成音頻概覽的按鈕。你可以直接點按按鈕,或在專屬於Gemini AI的側邊欄輸入指令。根據文件長度,系統會生成長度介乎2至10分鐘的音頻概覽。

目前該功能只支援網頁版Google Drive,尚未支援手機應用程式,但Google預計未來會加快移動端的支援。播放時,生成的音頻會在新分頁中開啟,就像Drive內的普通音頻文件一樣播放。值得注意的是,這些音頻概覽會以獨立文件形式保存在Drive內,方便用戶日後查閱。不過,Gemini側邊欄目前不會保存對話記錄,無法像NotebookLM那樣隨時中斷或與AI音頻主持互動,也未有進度同步或文字轉錄功能。

此外,這項服務目前並非免費,使用者必須擁有Google Workspace帳戶(包括企業版和教育版)或付費訂閱Gemini AI Pro/Ultra。Google表示,音頻概覽功能將從11月12日開始分階段推送,未來數週內會向所有Workspace和Gemini高階用戶開放。雖然Google未公布具體地區限制,但目前功能只支援英文文件。

評論與觀察:AI音頻概覽的實用與未來展望

Google將NotebookLM的音頻概覽功能引入Google Drive,無疑是讓AI協助日常工作和學習更貼地的創舉。PDF作為最普遍的文件格式之一,能直接生成音頻摘要,對於長時間閱讀感到疲倦或需要多任務處理的用戶來說,是非常實用的輔助工具。尤其對學生、研究員或需要快速掌握大量資料的專業人士而言,這種以播客形式呈現的音頻概覽,能大大提升資訊吸收效率。

不過,目前這項功能僅限於英語文件,且只對付費用戶開放,無疑限制了其普及度。未來若能擴展多語言支援及降低使用門檻,將更能惠及全球不同語言背景的用戶。此外,缺乏進度同步和交互功能,令使用體驗仍有提升空間。若Google能結合語音交互,讓用戶能在聆聽過程中隨時提問或標記重點,將令這項技術更具革命性。

最後,這項功能的推出也反映出AI技術正逐步融入工作和生活的各個細節,從純文字轉述到多媒體呈現,未來不單是「看」文字,還能「聽」內容,極大地擴展了學習和資訊獲取的方式。香港用戶若能及早掌握這類工具,無疑能在競爭激烈的學術和職場環境中佔得先機。期待Google未來能加快推廣速度,並完善功能,為更多用戶帶來便利。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗