
你而家可以直接喺Gemini AI生成Podcast風格的「音頻概述」
使用AI生成Podcast,學習你想知道的任何事物。
—— Khamosh Pathak
2025年3月27日
去年,Google推出了一個小眾功能於其實驗性產品NotebookLM,結果成為了意外的熱門。用戶可以上傳任何文檔至NotebookLM,系統會利用AI生成一個兩人對話的Podcast。這些Podcast並不是為了上傳給觀眾,而是讓用戶作為學習的廣告來收聽。
這個概念的主要想法是,有時候兩個人隨意地討論一個概念時,理解會更加容易。如果這聽起來對你有吸引力,恭喜你:你不再需要深入不熟悉的NotebookLM界面來試用它。現在,Google的AI生成Podcast,稱為音頻概述,已經可以在Gemini應用程序和網站上免費使用。現在音頻概述直接整合到Gemini中,你甚至可以使用Gemini的深度研究報告作為Podcast的資料來源。
就我個人而言,我發現先讓Gemini生成一個主題的深度研究報告,然後再直接從中生成音頻概述,這樣的方式非常有用(省去自己閱讀的時間)。
生成並下載任何主題的Podcast
要開始,使用Gemini網站或Gemini應用程序。要上傳自己的文檔或幻燈片,點擊加號按鈕,然後添加你想要的源文件。文件處理完成後,你會看到生成音頻概述的按鈕。
按下該按鈕,然後等候Gemini開始工作。根據資料的深度,生成Podcast音頻可能需要3至5分鐘的時間。
另外,你也可以提示Gemini使用文本框下方的深度研究選項為你創建報告。在這裡,你同樣需要等候幾分鐘,直到研究準備好。然後,打開深度研究文檔,點擊下箭頭按鈕,再使用生成音頻概述按鈕。你也可以直接在文本框中輸入「生成音頻概述」。
處理完成後,你會收到來自Gemini網站或應用程序的通知。你現在可以在聊天框中看到一個播放器。按下播放按鈕開始播放,並使用查找條跳轉到錄音的任何位置。是的,還有速度控制,但你只能將播放速度提高到1.5倍。
我從一份12頁的文檔中獲得了10分鐘的Podcast概述,因此內容的詳細程度還不錯。如果你不想立即收聽Podcast,或者想分享它,你還可以下載音頻以便離線播放。點擊音頻播放器中的三點菜單按鈕,選擇下載選項。
在這裡,你也可以選擇共享對話選項,通過鏈接分享你的Gemini聊天和錄音。
而且,當你在使用Gemini時,你可能想試試創建自己的自定義AI機器人,稱為Gems,因為這些現在對所有人免費開放使用。
評論與反思
這項新功能在學習和知識傳遞方面提供了一個全新的視角。音頻概述的引入,不僅讓用戶能夠以更加輕鬆的方式獲取信息,還能夠提升學習的趣味性和互動性。尤其是在快節奏的生活中,能夠以音頻的形式隨時隨地學習,無疑是對傳統學習方式的一次挑戰。
不過,這樣的技術也帶來了一些潛在的問題,例如音頻生成的準確性和可靠性如何保障?我們是否會因為依賴這些AI生成的內容而忽略了更深入的思考和分析?未來,這項技術能否真正成為學習的有效工具,還需要用戶的反饋和進一步的改進。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。