2024年AI報告：數據質量急降，挑戰重重

zero comment

**生成式AI在2024年增長17%，但數據質量下降：Appen的AI報告關鍵發現**

來自AI數據供應商Appen的新報告顯示，隨著人工智能逐漸融入企業運營，公司在獲取和管理高質量數據方面面臨挑戰。

Appen的2024年AI狀況報告調查了超過500位美國IT決策者，顯示生成式AI的採用率在過去一年增加了17%，但企業在數據準備和質量保證方面遇到重大障礙。報告指出，與獲取、清理和標記數據相關的瓶頸每年增加10%，凸顯了建立和維護有效AI模型的複雜性。

Appen策略主管Si Chen在接受VentureBeat訪問時表示：「隨著AI模型處理更複雜和專門的問題，數據需求也在改變。公司發現，僅僅擁有大量數據已經不夠。要微調模型，數據必須是高質量的，這意味著數據要準確、多樣、正確標記並針對特定AI用途量身定制。」

雖然AI的潛力不斷增長，報告指出企業面臨的幾個主要障礙。以下是Appen 2024年AI狀況報告的五大要點：

**1. 生成式AI採用激增，但數據挑戰也隨之而來**

生成式AI（GenAI）的採用在2024年增長了17%，主要得益於大型語言模型（LLM）的進步，使企業能夠在多種應用中自動化任務。從IT運營到研發，企業正在利用GenAI來簡化內部流程和提高生產力。然而，GenAI使用的快速增長也帶來了數據管理的新挑戰。

Chen告訴VentureBeat：「生成式AI的輸出更為多樣、不可預測和主觀，這使得定義和衡量成功變得更加困難。要實現企業級AI，模型必須使用針對特定用途的高質量數據進行定制。」

定制數據收集已成為為GenAI模型獲取訓練數據的主要方法，這反映了從通用網絡數據向定制、可靠數據集轉變的更廣泛趨勢。

**2. 企業AI部署和投資回報率下降**

儘管AI興奮不斷，報告發現了一個令人擔憂的趨勢：越來越少的AI項目能夠部署，而那些成功部署的項目顯示的投資回報率也在下降。自2021年以來，成功部署的AI項目比例下降了8.1%，而顯示有意義投資回報的部署項目比例則下降了9.4%。

這一下降主要歸因於AI模型的日益複雜。圖像識別和語音自動化等簡單應用已被視為成熟技術，但企業正在轉向更雄心勃勃的AI計劃，如生成式AI，這需要定制的高質量數據，並且更難以成功實施。

Chen解釋說：「生成式AI在理解、推理和內容生成方面具有更高級的能力，但這些技術本質上更具挑戰性。」

**3. 數據質量至關重要，但正在下降**

報告強調了AI開發中的一個關鍵問題：數據準確性自2021年以來下降了近9%。隨著AI模型變得更加複雜，它們所需的數據也變得更為複雜，通常需要專業的高質量註釋。

如今，86%的公司至少每季度重訓或更新其模型，這凸顯了對新鮮、相關數據的需求。然而，隨著更新頻率增加，確保數據的準確和多樣性變得更加困難。公司正在尋求外部數據供應商的幫助，以滿足這些需求，近90%的企業依賴外部資源來訓練和評估其模型。

Chen表示：「雖然我們無法預測未來，但我們的研究顯示，管理數據質量將繼續成為公司的重大挑戰。隨著更複雜的生成式AI模型出現，數據的獲取、清理和標記已成為主要瓶頸。」

**4. 數據瓶頸惡化**

Appen的報告顯示，與獲取、清理和標記數據相關的瓶頸每年增加10%。這些瓶頸直接影響到公司成功部署AI項目的能力。隨著AI用途變得更加專業化，準備合適數據的挑戰也愈加嚴峻。

Chen指出：「數據準備問題已經加劇。這些模型的專業性質需要新的、量身定制的數據集。」

為了解決這些問題，公司正在專注於長期策略，強調數據的準確性、一致性和多樣性。許多公司還在尋求與數據供應商的戰略合作，以幫助應對AI數據生命周期的複雜性。

**5. 人工介入比以往任何時候都重要**

雖然AI技術不斷演變，但人工參與仍然不可或缺。報告發現，80%的受訪者強調了人機協作機器學習的重要性，這是一個利用人類專業知識來指導和改進AI模型的過程。

Chen說：「人工參與對於開發高性能、倫理和具有上下文相關的AI系統仍然至關重要。」

人類專家在確保偏見減少和倫理AI開發方面特別重要。通過提供特定領域的知識並識別AI輸出中的潛在偏見，他們幫助細化模型並使其與現實世界行為和價值觀保持一致。這對於生成式AI尤為重要，因為其輸出可能不可預測，需要仔細監督以防止有害或偏見結果。

—

**評論與見解**

這篇文章揭示了生成式AI在2024年的快速增長，但也同時暴露了數據質量下降的嚴重問題。AI技術的進步讓企業能夠在多種應用中實現自動化，但這也帶來了新的挑戰，特別是在數據管理方面。隨著AI模型的複雜性增加，企業需要的不僅僅是大量數據，而是高質量、準確和量身定制的數據。

從這個角度看，未來AI的成功將依賴於如何有效地管理和優化數據資源。企業可能需要重新評估其數據策略，並考慮與專業數據供應商建立更深入的合作關係。此外，人工介入在確保AI系統的倫理性和準確性方面的重要性也不容忽視。

對於香港的企業來說，這些發現同樣具有啟發性。隨著香港在智慧城市和數字經濟方面的發展，如何高效利用AI技術並克服數據管理的挑戰，將成為未來競爭力的關鍵因素。

以上文章由特價GPT API KEY所翻譯

Download TXT

🔥 CHATGPT PLUS 帳戶出租