2024年AI報告:數據質量急降,挑戰重重

Ai

**生成式AI在2024年增長17%,但數據質量下降:Appen的AI報告關鍵發現**

來自AI數據供應商Appen的新報告顯示,隨著人工智能逐漸融入企業運營,公司在獲取和管理高質量數據方面面臨挑戰。

Appen的2024年AI狀況報告調查了超過500位美國IT決策者,顯示生成式AI的採用率在過去一年增加了17%,但企業在數據準備和質量保證方面遇到重大障礙。報告指出,與獲取、清理和標記數據相關的瓶頸每年增加10%,凸顯了建立和維護有效AI模型的複雜性。

Appen策略主管Si Chen在接受VentureBeat訪問時表示:「隨著AI模型處理更複雜和專門的問題,數據需求也在改變。公司發現,僅僅擁有大量數據已經不夠。要微調模型,數據必須是高質量的,這意味著數據要準確、多樣、正確標記並針對特定AI用途量身定制。」

雖然AI的潛力不斷增長,報告指出企業面臨的幾個主要障礙。以下是Appen 2024年AI狀況報告的五大要點:

**1. 生成式AI採用激增,但數據挑戰也隨之而來**

生成式AI(GenAI)的採用在2024年增長了17%,主要得益於大型語言模型(LLM)的進步,使企業能夠在多種應用中自動化任務。從IT運營到研發,企業正在利用GenAI來簡化內部流程和提高生產力。然而,GenAI使用的快速增長也帶來了數據管理的新挑戰。

Chen告訴VentureBeat:「生成式AI的輸出更為多樣、不可預測和主觀,這使得定義和衡量成功變得更加困難。要實現企業級AI,模型必須使用針對特定用途的高質量數據進行定制。」

定制數據收集已成為為GenAI模型獲取訓練數據的主要方法,這反映了從通用網絡數據向定制、可靠數據集轉變的更廣泛趨勢。

**2. 企業AI部署和投資回報率下降**

儘管AI興奮不斷,報告發現了一個令人擔憂的趨勢:越來越少的AI項目能夠部署,而那些成功部署的項目顯示的投資回報率也在下降。自2021年以來,成功部署的AI項目比例下降了8.1%,而顯示有意義投資回報的部署項目比例則下降了9.4%。

這一下降主要歸因於AI模型的日益複雜。圖像識別和語音自動化等簡單應用已被視為成熟技術,但企業正在轉向更雄心勃勃的AI計劃,如生成式AI,這需要定制的高質量數據,並且更難以成功實施。

Chen解釋說:「生成式AI在理解、推理和內容生成方面具有更高級的能力,但這些技術本質上更具挑戰性。」

**3. 數據質量至關重要,但正在下降**

報告強調了AI開發中的一個關鍵問題:數據準確性自2021年以來下降了近9%。隨著AI模型變得更加複雜,它們所需的數據也變得更為複雜,通常需要專業的高質量註釋。

如今,86%的公司至少每季度重訓或更新其模型,這凸顯了對新鮮、相關數據的需求。然而,隨著更新頻率增加,確保數據的準確和多樣性變得更加困難。公司正在尋求外部數據供應商的幫助,以滿足這些需求,近90%的企業依賴外部資源來訓練和評估其模型。

Chen表示:「雖然我們無法預測未來,但我們的研究顯示,管理數據質量將繼續成為公司的重大挑戰。隨著更複雜的生成式AI模型出現,數據的獲取、清理和標記已成為主要瓶頸。」

**4. 數據瓶頸惡化**

Appen的報告顯示,與獲取、清理和標記數據相關的瓶頸每年增加10%。這些瓶頸直接影響到公司成功部署AI項目的能力。隨著AI用途變得更加專業化,準備合適數據的挑戰也愈加嚴峻。

Chen指出:「數據準備問題已經加劇。這些模型的專業性質需要新的、量身定制的數據集。」

為了解決這些問題,公司正在專注於長期策略,強調數據的準確性、一致性和多樣性。許多公司還在尋求與數據供應商的戰略合作,以幫助應對AI數據生命周期的複雜性。

**5. 人工介入比以往任何時候都重要**

雖然AI技術不斷演變,但人工參與仍然不可或缺。報告發現,80%的受訪者強調了人機協作機器學習的重要性,這是一個利用人類專業知識來指導和改進AI模型的過程。

Chen說:「人工參與對於開發高性能、倫理和具有上下文相關的AI系統仍然至關重要。」

人類專家在確保偏見減少和倫理AI開發方面特別重要。通過提供特定領域的知識並識別AI輸出中的潛在偏見,他們幫助細化模型並使其與現實世界行為和價值觀保持一致。這對於生成式AI尤為重要,因為其輸出可能不可預測,需要仔細監督以防止有害或偏見結果。

**評論與見解**

這篇文章揭示了生成式AI在2024年的快速增長,但也同時暴露了數據質量下降的嚴重問題。AI技術的進步讓企業能夠在多種應用中實現自動化,但這也帶來了新的挑戰,特別是在數據管理方面。隨著AI模型的複雜性增加,企業需要的不僅僅是大量數據,而是高質量、準確和量身定制的數據。

從這個角度看,未來AI的成功將依賴於如何有效地管理和優化數據資源。企業可能需要重新評估其數據策略,並考慮與專業數據供應商建立更深入的合作關係。此外,人工介入在確保AI系統的倫理性和準確性方面的重要性也不容忽視。

對於香港的企業來說,這些發現同樣具有啟發性。隨著香港在智慧城市和數字經濟方面的發展,如何高效利用AI技術並克服數據管理的挑戰,將成為未來競爭力的關鍵因素。

以上文章由特價GPT API KEY所翻譯

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *