现代人工智能模型的发展离不开大量训练数据。然而,这些训练数据的来源往往不透明,且许多数据贡献者(如作家、研究人员、领域专家)往往无法从中获得应有回报。随着公众对 AI 合规性、隐私和版权所有权的关注提升,这种 “数据被无偿使用” 的状况引发了广泛讨论。在这样的背景下,如何让数据贡献者能够被公平补偿、让 AI 模型的训练过程更具透明性,成为了 AI 社区和 Web3 社区都亟待解决的问题。
OpenLedger 的愿景是创造一个去中心化的 AI 数据生态,让数据贡献者和模型开发者能够在同一平台上交互与合作。该项目并非专注于通用大模型(如大型语言模型),而是聚焦于 专用语言模型(SLM, Specialized Language Models)。通过构建 datanets(数据网络),OpenLedger 鼓励社区共同维护垂直领域的数据集,让领域专家上传高质量数据,并借助区块链技术记录谁贡献了什么。
2025 年 11 月,OpenLedger 正式发布 OPEN 主网。主网的核心是让用户将数据上传至共享的 datanets,开发者可以使用这些数据训练模型,而系统通过链上机制追踪数据的使用情况,并自动将报酬(以 OPEN 代币计)分配给贡献者。这种 Payable AI 模型本质上将 AI 训练的数据和贡献变成一种可以被计量、被支付的价值。
OpenLedger 的 “Proof of Attribution” 系统是其技术核心。它能在区块链上记录每份数据集、每个模型、每一个 agent(AI 代理)的所有权和使用轨迹。当 AI 模型产生日志或生成输出时,这系统可以回溯生成过程中到底用了哪些数据,从而正确判断哪些数据贡献者应该获得奖励。这些奖励通过智能合约自动执行,使用的是 OPEN 代币。贡献者不再需要人工申诉或手动计算,其权益是自动链上兑现的。此外,OpenLedger 主网是兼容 EVM 的网络,其上有数据和模型注册表(onchain registry),开发者可以使用熟悉的智能合约框架构建应用。
对于创作者、领域专家或研究人员来说,OpenLedger 提供了一个前所未有的收入模式:
同时,开发者也能减少基础设施成本,无需自己构建完整数据管理系统,就可以在这一网络上构建智能代理。
尽管 OpenLedger 的愿景极具吸引力,但仍面临一些挑战:
OpenLedger 推出的 OPEN 主网,代表了 Web3 与 AI 深度融合的一个新方向。它有可能成为 AI 训练领域的数据基础设施,让贡献者实现价值变现,让模型开发者更公平地获取资源。未来,如果 datanets 能覆盖更多垂直领域(如医疗、金融、科学研究等),OpenLedger 的生态可能快速扩张。随着更多 AI 产品接入这一网络,这种 “可支付 AI” 模式或将成为行业标准。
此外,在全球监管趋严的背景下,OpenLedger 的链上归因与自动支付机制也可能为 AI 合规提供一种技术路径。
分享
目录