AI 醫療轉錄工具:真相與幻覺的危機

Ai

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

研究人員表示,醫院使用的人工智能轉錄工具創造出從未說過的內容

(加蘭斯·伯克和希爾克·謝爾曼,聯合新聞報道)2024年11月2日

科技巨頭OpenAI宣稱其人工智能驅動的轉錄工具Whisper擁有接近“人類水平的穩健性和準確性”。然而,根據多位軟件工程師、開發者和學術研究人員的訪談,Whisper卻存在一個重大缺陷:它容易創造出大量文本,甚至整句話,這些內容實際上從未被說過。這些虛構文本在行業內被稱為“幻覺”,可能包括種族評論、暴力言論甚至虛構的醫療處方。

專家指出,這些虛構內容的存在非常成問題,因為Whisper正在全球多個行業中被用來翻譯和轉錄訪談、生成流行消費技術中的文本以及為視頻創建字幕。更令人擔憂的是,儘管OpenAI警告該工具不應用於“高風險領域”,許多醫療機構仍急於使用基於Whisper的工具來轉錄患者與醫生的諮詢。

一名密西根大學的研究人員在進行公共會議的研究時發現,他檢查的每十個音頻轉錄中就有八個存在幻覺。另一名機器學習工程師則發現,在超過100小時的Whisper轉錄中,約有一半存在幻覺。第三名開發者表示,他創建的26,000份轉錄中幾乎每一份都存在此問題。即便是在錄音質量良好的短音頻樣本中,這些問題依然存在。

Alondra Nelson,曾擔任拜登政府白宮科學技術政策辦公室主任,指出這些錯誤在醫院環境中可能會產生“非常嚴重的後果”。她強調:“沒有人希望出現誤診,應有更高的標準。”

Whisper還用於為聽障人士提供字幕,這使得這一人群特別容易受到錯誤轉錄的影響,因為他們無法識別這些“隱藏在其他文本中的虛構內容”。

隨著這些幻覺的普遍存在,專家、倡導者和前OpenAI員工呼籲聯邦政府考慮對人工智能進行監管。他們表示,OpenAI至少需要解決這一缺陷。前OpenAI工程師William Saunders表示:“如果公司願意優先處理這個問題,那麼這似乎是可以解決的。”

雖然大多數開發者認為轉錄工具會拼寫錯誤或犯其他錯誤,但工程師和研究人員表示,他們從未見過其他人工智能驅動的轉錄工具像Whisper那樣頻繁地出現幻覺。

Whisper幻覺的影響

Whisper工具被整合到OpenAI的旗艦聊天機器人ChatGPT的一些版本中,並且是Oracle和Microsoft的雲計算平台中的內置產品,這些平台為全球數千家公司提供服務。根據最近的統計,Whisper在過去一個月內的某個版本在開源人工智能平台HuggingFace上被下載超過420萬次。

康奈爾大學的教授Allison Koenecke和弗吉尼亞大學的Mona Sloane調查了從卡內基梅隆大學的研究庫TalkBank獲得的數千個短片段,發現近40%的幻覺是有害或令人擔憂的,因為說話者可能會被誤解或誤表達。

在一個例子中,說話者提到:“他,男孩,打算,我不太確定,拿著雨傘。”但轉錄軟件卻添加道:“他拿了一大塊十字架,一小塊……我肯定他沒有恐怖刀,所以他殺了好幾個人。”在另一錄音中,一位說話者描述了“另外兩個女孩和一位女士”,Whisper卻虛構地添加了種族評論,說“另外兩個女孩和一位女士,嗯,都是黑人”。在第三個轉錄中,Whisper虛構了一種不存在的藥物,名為“超活化抗生素”。

研究人員尚不確定Whisper及類似工具為何會出現幻覺,但軟件開發者指出,虛構內容往往出現在停頓、背景噪音或音樂播放時。

儘管OpenAI在其在線披露中建議不要在“決策上下文中”使用Whisper,但醫院和醫療機構仍在使用語音轉文本模型,包括Whisper,來轉錄醫生就診時的對話,以使醫療提供者能夠減少記錄或報告撰寫的時間。

據Nabla公司的首席技術官馬丁·賴森(Martin Raison)介紹,超過30,000名臨床醫生和40個醫療系統,包括明尼蘇達州的Mankato Clinic和洛杉磯的兒童醫院,已開始使用基於Whisper的工具。該工具經過醫學語言的微調,旨在轉錄和總結患者的互動。

然而,賴森指出,該公司意識到Whisper可能會出現幻覺,並正在解決這一問題。他補充說,由於數據安全原因,Nabla的工具會刪除原始音頻,這使得難以將AI生成的轉錄與原始錄音進行比較。

這一情況引發了隱私方面的擔憂。加州州立法議員Rebecca Bauer-Kahan表示,她在今年早些時候帶孩子去看病時,拒絕簽署醫療網絡提供的表格,該表格要求她允許將諮詢音頻分享給包括OpenAI最大投資者的Microsoft Azure在內的供應商。她不希望這樣親密的醫療對話被分享給科技公司。

結論

這項研究強調了人工智能在醫療領域應用的潛在風險,尤其是在轉錄和數據處理方面。隨著技術的進步,對於如何有效管理和規範這些工具的討論越來越重要。企業和醫療機構應該更加謹慎,考慮到使用這些工具可能帶來的後果,並採取措施確保信息的準確性和保護患者的隱私。這不僅是技術的挑戰,更是道德和法律的考量。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Create a hyper-realistic 8K close-up body portrait of a female model, using the uploaded photo as the exact facial reference. Maintain 100% accuracy of the facial features — do not alter or modify any aspect of the face. Render the skin texture, lighting, and overall composition with photo-realistic detail, ensuring lifelike color tones and natural depth of field. A man with his original hair is sitting casually on a white cube, smiling warmly at the camera. He is wearing a cream-colored cable-knit sweater, blue jeans, and brown loafers. His legs are crossed, with one hand resting on his knee.
The background reveals a cozy and festive living room. A large, beautifully decorated Christmas tree with numerous warm lights and gold ornaments stands prominently behind him. Several wrapped gift boxes are visible at the base of the tree. To his left, another smaller decorated Christmas tree and a wreath on the wall further enhance the holiday atmosphere. The lighting is soft and inviting, creating a warm and welcoming scene. Create a photorealistic and highly detailed image featuring the attached image walking confidently down a modern city street, accompanied by Jason Statham, Dwayne “The Rock” Johnson, and Jason Momoa acting as bodyguards.

John Wick (Keanu Reeves) is walking just beside or slightly behind the subject, holding an umbrella over him to shield from light rain.

The subject should be the central figure, wearing stylish casual clothing — like a fitted jacket, dark jeans, and sunglasses — exuding calm authority and cool charisma.

Statham, The Rock, and Momoa are dressed in black tactical-style suits, maintaining alert, protective stances, scanning the surroundings like professional bodyguards. John Wick wears his signature black suit and tie, looking composed as he holds the umbrella.

The setting is a downtown urban street with wet pavement reflecting city lights, parked luxury cars, and paparazzi in the background snapping photos.

The photo should look like a real paparazzi shot — slightly off-angle, mid-step motion blur, with realistic lighting and reflections.

Lighting: natural daylight with overcast skies, reflections from wet concrete, realistic shadows, subtle raindrops on the umbrella and clothing.

Camera realism: crisp detail on facial features and clothing textures, shallow depth of field emphasizing the group, with lens flare or light bloom for authenticity.

Mood & tone: grounded, cinematic, and stylish — feels like a moment from a celebrity entourage photo or action-movie press capture, taken with an iPhone by paparazzi.

Style: ultra-realistic, documentary-style street photography with modern cinematic sharpness. [Subject]: Young Asian female with "Imada Mio-inspired" doll-like aesthetic (精緻洋娃娃臉). She has large round expressive eyes, a small V-line face, and rosy cheeks. Her expression is innocent, energetic, and slightly flirty. [Hair]: Messy morning hair (剛睡醒的凌亂感), long dark brown hair, slightly tousled, natural volume. [Outfit]: Wearing an oversized translucent white button-down shirt (男友風白襯衫), unbuttoned at the top to reveal collarbones, creating a "bottomless" look (下衣失蹤風格). [Style]: Japanese Gravure Photobook style (寫真集風格), Pure & Sexy vibe, bright high-key lighting, soft skin texture, Fujifilm PRO 400H color tone.