OORT AI數據集登上Kaggle熱門榜單

zero comment

crypto

去中心化的OORT AI數據在Google Kaggle上名列前茅

去中心化的AI解決方案提供商OORT開發的人工智能訓練圖像數據集在Google的Kaggle平台上取得了顯著成功。OORT的多樣化工具Kaggle數據集自四月初發布以來，已經在多個類別中攀升至首頁。Kaggle是一個由Google擁有的在線數據科學和機器學習競賽、學習與合作的平台。

OORT的核心貢獻者Ramkumar Subramaniam告訴Cointelegraph：“Kaggle首頁的排名是一個強有力的社會信號，表明該數據集正在吸引正確的數據科學家、機器學習工程師和從業者社群。”

OORT的創始人兼CEO Max Li表示，該公司“觀察到有前景的參與指標，這證實了其通過去中心化模型收集的訓練數據的早期需求和相關性”。他補充道：

> “來自社群的自然興趣，包括活躍的使用和貢獻，顯示出像OORT這樣的去中心化、社群驅動的數據管道可以在不依賴集中中介的情況下實現快速分發和參與。”

Li還表示，OORT計劃在未來幾個月發布多個其他數據集，包括車載語音命令數據集、智能家居語音命令數據集以及用於改進AI驅動媒體驗證的深度偽造視頻數據集。

多個類別的首頁排名

該數據集經Cointelegraph獨立驗證，已在Kaggle的通用AI、零售與購物、製造和工程類別中於本月初達到首頁。根據發佈時的情況，由於可能與不相關的數據集更新，該數據集在5月6日和5月14日之後失去了這些位置。

在肯定這一成就的同時，Subramaniam告訴Cointelegraph：“這不是實際採用或企業級質量的明確指標。”他指出，OORT的數據集之所以與眾不同，不僅在於排名，還在於數據集背後的來源和激勵層。他解釋道：

> “與可能依賴不透明管道的集中供應商不同，透明的、以代幣激勵的系統提供可追溯性、社群策劃和在正確治理下的持續改進潛力。”

Generative Ventures的合夥人Lex Sokolin表示，雖然他不認為這些結果難以複製，但“這確實顯示出加密項目可以利用去中心化的激勵來組織經濟上有價值的活動。”

高質量AI訓練數據：稀缺的商品

根據AI研究公司Epoch AI發佈的數據，預計人類生成的文本AI訓練數據將在2028年耗盡。這種壓力已經足夠大，以至於投資者現在正在調解將版權材料的權利授予AI公司的交易。

有關日益稀缺的AI訓練數據及其可能限制該領域增長的報告已經流傳多年。儘管合成（AI生成的）數據在某種程度上越來越多地被使用，但人類數據仍然被視為更好的替代品，因為它能導致更高質量的AI模型。

在AI訓練的圖像方面，情況變得越來越複雜，因為藝術家故意破壞訓練工作。為了保護他們的圖像不被未經許可地用於AI訓練，Nightshade允許用戶“毒化”他們的圖像，從而嚴重降低模型的性能。

Subramaniam表示：“我們正進入一個高質量圖像數據將變得越來越稀缺的時代。”他還認識到，這種稀缺性因圖像毒化技術的日益流行而變得更加嚴峻：

> “隨著圖像隱蔽和對抗性水印等技術的興起，開源數據集面臨著數量和信任的雙重挑戰。”

在這種情況下，Subramaniam表示，可驗證和社群來源的激勵數據集“比以往任何時候都更有價值”。根據他的說法，這樣的項目“可以成為不僅僅是替代品，而是數據經濟中AI對齊和來源的支柱。”

這篇文章突顯了去中心化數據集的潛力，尤其是在當前高質量數據日益稀缺的背景下。隨著AI技術的發展，如何確保數據的質量和來源將成為未來的關鍵挑戰。OORT的成功不僅顯示了社群驅動的數據收集模式的可行性，還可能引領未來數據經濟的發展方向。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

✨🎱 Instagram留言 →