AI煉金術:合成數據點石成金

Ai

合成數據將推動人工智能發展:它是什麼及其重要性

Gretel的聯合創始人及首席技術官約翰·邁爾斯在Quartz AI Factor最新一集的訪談中指出,合成數據將成為推動人工智能未來發展的「燃料」。他形容合成數據就像是人工智能的合成油。

邁爾斯提到,數據就像是新石油,這一觀點最早由數學家克萊夫·漢比於2006年提出,數據的價值在於其經過精煉後的可用性。他表示:“我認為合成數據將基本上成為推動AI系統發展的根本燃料,特別是進入這些系統的數據。”

Gretel專門為企業提供合成數據,以改善人工智能及機器學習模型的性能。數據是系統開發及模型訓練的基礎,使人工智能在每次使用中變得更智能和有效。

邁爾斯形容合成數據的運作方式與合成油相似:“當今每一位開車的人都在使用合成油。他們知道這類油品有點像真實的油,但它是經過製造的,並且具備保證的特性,可以確保引擎平穩運行。”

合成數據的生成有兩種方式。第一種是從現有數據中提取並使其安全可用,這包括減少數據量、提高可攜性以及消除隱私風險。第二種是完全「從零開始」創建數據,生成不存在的數據以解決問題並構建新產品。

根據顧問公司Gartner的估計,到2024年,60%的人工智能及分析數據將是合成生成的。根據BCC Research的預測,合成數據生成市場將從2022年的3.813億美元增長至2028年的21億美元。

隱私是合成數據的一大賣點,特別是在金融服務和醫療保健等高度受監管的行業中,這些行業處理大量敏感個人信息。然而,合成數據還可以填補現實數據的不足,並補充那些過時或質量不佳的有機生成數據。

邁爾斯強調,他並不認為合成數據會取代原始數據,而是會作為真實數據和記錄的補充。他表示:“我認為你會發現,當我們想要構建應用程序或將這些數據付諸實踐時,會有一個明確的界限,告訴我們要使用合成版本的數據。然後,這將成為企業層面上構建應用程序的基礎,而原始數據則用來進一步提煉出這些合成數據。”

評論
合成數據的興起無疑是人工智能領域的一個重大突破,它不僅能解決隱私問題,還能為數據匱乏的領域提供支持,這對於推動創新至關重要。然而,邁爾斯的觀點提醒我們,合成數據不應被視為原始數據的替代品,而是應作為一種增強工具,幫助我們更有效地利用現有數據。未來,如何平衡合成數據與真實數據的使用,將是企業和研究者必須面對的重要課題。這不僅涉及技術層面,也關乎倫理和法律的考量,特別是在數據隱私日益受到重視的環境中。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Chat Icon