Jensen Huang mencionou? SN3 subiu 5x em março, o que exatamente fez?

2026 年 3 月 20 日,All-In 创投播客中有一段不寻常的对话。

风险投资大佬 Chamath Palihapitiya 将话题交给英伟达 CEO 黄仁勋,提到 Bittensor 上有个项目“完成了一项相当疯狂的技术成就”,用分布式算力在互联网上训练了一个大型语言模型,过程完全去中心化,没有任何中心化数据中心参与。

黄仁勋没有回避。他将此比作“现代版的 Folding@home”,即在 2000 年代让普通用户贡献闲置算力,共同对抗蛋白质折叠难题的分布式项目。

在此之前的 4 天前,3 月 16 日,Anthropic 联合创始人 Jack Clark 在发布 AI 研究进展报告时,也重点介绍并引用了这项突破:Bittensor 生态子网 Templar(SN3)完成了 720 亿参数大模型(Covenant 72B)的分布式训练,模型性能与 Meta 2023 年发布的 LLaMA-2 相当。

Jack Clark 将这一章节命名为“通过分布式训练挑战 AI 政治经济学”,并强调这是一项值得持续关注的技术——他能想象未来:设备端 AI 大量采用去中心化训练产出的模型,而云端 AI 继续运行专有大模型。

市场反应略显滞后但极为剧烈:SN3 过去一个月涨逾 440%,过去两周涨逾 340%,市值达 1.3 亿美元。子网的爆发式叙事,直接带动 TAO 的购买压力。也因此,TAO 快速上涨,一度达到 377 美元,过去一个月翻倍,市值约 75 亿美元。

问题来了:SN3 到底做了什么?为何会成为焦点?分布式训练和去中心化 AI 的价值叙事又将如何演变?

那个 72B 的模型

要回答这个问题,首先要看清 SN3 的成绩单。

2026 年 3 月 10 日,Covenant AI 团队在 arXiv 上发布技术报告,正式宣布 Covenant-72B 完成训练。这是一个拥有 720 亿参数的大型语言模型,超过 70 个独立节点(每轮约 20 个节点同步,每个节点配备 8 张 B200 GPU),在约 1.1 万亿 tokens 的语料上完成预训练。

Templar 提供了基准测试数据,当然,比较对象是 Meta 在 2023 年发布的 LLaMA-2-70B。正如 Jack Clark 所说,Covenant-72B 在 2026 年可能已显过时。其在 MMLU 上得分 67.1,大致对应 Meta 2023 年的 LLaMA-2-70B(65.6 分)。

而 2026 年的前沿模型——无论是 GPT 系列、Claude 还是 Gemini——早已在数十万 GPU 上完成了参数超百亿的训练,推理、代码、数学能力的差距是数量级而非百分比。这一现实差距不应被市场情绪淹没。

但若以“用开放互联网上的分布式算力训练出来”作为前提,意义就完全不同。

做个比较:同为去中心化训练的 INTELLECT-1(Prime Intellect 团队出品,100 亿参数)在 MMLU 上得分 32.7;另一个在白名单参与者中的分布式训练项目 Psyche Consilience(400 亿参数)得分 24.2。Covenant-72B 以 72B 规模、67.1 分的 MMLU,在去中心化训练赛道中是个显眼的数字。

更关键的是,这次训练是“无需许可”的。任何人都可以加入成为节点,无需审核,无需白名单。超过 70 个独立节点参与模型更新,来自全球各地贡献算力。

黄仁勋的发言:什么没说什么

还原那场播客的细节,有助于校正外界对“背书”的解读。

Chamath Palihapitiya 在对话中展示了 Bittensor 的技术成就,描述为用分布式算力训练了一个 Llama 模型,过程“完全分布式,同时保持状态”。黄仁勋回应将其比作“现代版的 Folding@home”,并讨论了开源与专有模型共存的必要性。

值得注意的是,黄仁勋没有直接提及 Bittensor 的代币或任何投资意图,也没有深入讨论去中心化 AI 训练。

理解 Bittensor 子网和 SN3

要理解 SN3 的突破,首先要明确 Bittensor 及其子网的运作逻辑。简单来说,Bittensor 是一条 AI 公链和平台,而每个子网相当于一条独立的“AI 生产线”,明确核心任务、设计激励机制,共同构建去中心化 AI 生态。

其运作流程清晰且去中心化:子网所有者定义目标并设计激励模型;矿工提供算力,完成推理、训练、存储等任务;验证者对矿工贡献进行评分,并上传至共识层;最终,Yuma 共识算法根据奖励分配收益。

目前,Bittensor 上有 128 个子网,涵盖推理、无服务器 AI 云、图像、数据标注、强化学习、存储、计算等任务。

SN3 就是其中之一。它不做应用层封装,也不租用现成大模型 API,而是直指 AI 产业链中最昂贵、最封闭的环节之一:大模型预训练。

SN3 希望利用 Bittensor 网络协调异构计算资源,通过激励式分布式训练,证明无需昂贵的中心化超级计算机集群,也能训练出强大基础模型。核心在于“平权”——打破中心化训练的资源垄断,让普通个人或中小机构也能参与,同时借助分布式算力降低成本。

推动 SN3 的核心力量是 Templar,背后团队为 Covenant Labs。该团队还运营着 Basilica(SN39,计算服务)和 Grail(SN81,RL 后训练与模型评估)两个子网。三者形成垂直整合,覆盖从预训练到对齐优化的全流程,构建去中心化大模型训练生态。

具体而言,矿工贡献算力,上传梯度(模型参数的调整方向和幅度);验证者评估贡献质量,按误差改善程度打分。奖励根据贡献“让模型变好多少”直接分配,根本不依赖信任第三方。

激励机制的关键:奖励与“贡献改善模型”挂钩,而非单纯算力出勤。这解决了去中心化场景中最难的问题:如何防止矿工“摸鱼”。

Covenant-72B 如何解决通信效率和激励相容?

两个挑战:一是通信效率——节点间同步完整梯度需高带宽低延迟;二是激励相容——防止恶意节点提交错误梯度,确保诚实训练。

SN3 采用两个核心组件:SparseLoCo 和 Gauntlet。

SparseLoCo 解决通信:每个节点在本地跑 30 步优化(AdamW),再将“伪梯度”压缩上传。压缩方式包括 Top-k 稀疏、误差反馈、2 位量化,压缩比超过 146 倍。

换句话说,原需传输 100MB 的数据,现在不到 1MB。

在普通互联网带宽(上行 110Mbps,下行 500Mbps)下,系统保持约 94.5% 利用率,每轮通信仅 70 秒,20 个节点、每节点 8 张 GPU。

Gauntlet 负责激励相容:在 Bittensor 区块链上验证伪梯度质量,用 LossScore 测试“用该节点梯度后模型损失降低多少”;还检测节点是否用自己分配的数据训练——如果用随机数据的损失改善比用自己数据还好,会被打负分。

每轮只采纳评分最高的节点梯度,其他节点被淘汰,系统保持稳健。平均每轮约 17 个节点参与,累计超过 70 个节点。

去中心化 AI 价值叙事的根本转变

从技术和行业角度看,Covenant-72B 代表几个重要意义。

第一,打破“分布式训练只适合小模型”的预设。虽与最前沿模型仍有差距,但证明了可扩展性。

第二,无许可参与成为可能。这一点被低估。此前项目依赖白名单,只有审核通过的参与者才能贡献算力。SN3 这次任何有算力的人都可加入,验证机制过滤恶意贡献。这是迈向“真正去中心化”的实质性一步。

第三,Bittensor 的 dTAO 机制让子网价值的市场发现成为可能。子网可发行自己的 Alpha 代币,通过 AMM 机制由市场决定 TAO 排放份额。这为产出具体成果的子网提供了价值捕获机制。当然,这也容易被叙事和情绪影响,模型训练成果的质量难以由普通市场参与者独立评估。

第四,去中心化 AI 训练的政治经济意义。Jack Clark 在 Import AI 中提出“谁拥有 AI 的未来”。当前,最前沿模型由少数大规模数据中心垄断,不仅是商业问题,更关乎权力结构。若分布式训练持续突破,有望在某些模型(如特定领域的小型前沿模型)上形成真正的去中心化开发生态。前景尚远。

总结:一个里程碑,也伴随诸多问题

黄仁勋将其比作“现代版的 Folding@home”。Folding@home 在分子模拟领域做出贡献,但未威胁到大型制药公司的核心研发。这个比喻非常贴切。

SN3 证明了协议的可行性,验证了分布式训练的潜力。但背后仍有许多少有人深入讨论的问题:

  • MMLU 本身存在争议,题目和答案可能泄露训练集信息。更重要的是,比较基线(LLaMA-2-70B 和 LLM360 K2)都是 2023-2024 年的模型,且在问及 Grok、豆包时表现中下,Claude 视为严重落后。若用更动态或抗污染的基准,结论或许不同。

  • 高质量数据(对话、代码、数学、文献)仍由少数巨头掌控。算力民主化了,数据端仍是寡头结构,矛盾未被充分讨论。

  • 安全性方面,无许可参与意味着无法知晓节点身份和数据来源。Gauntlet 能过滤明显异常,但难以防微妙的投毒行为。若某节点系统性投毒,可能导致模型偏移,尤其在金融、医疗、法律等高合规场景,风险巨大。

  • Covenant-72B 以 Apache 2.0 开源,不使用 SN3 代币。持有代币获得未来模型产出收益,而非模型使用的直接收益。价值链依赖持续训练和网络机制的健康运转。若训练停滞或成果不达预期,代币估值会动摇。

列出这些问题,不是否定其意义。它证明了曾被认为不可能的事可以实现,这一事实不会消失。但“做到了”与“意味着什么”是两回事。

过去一个月,SN3 代币涨了 440%。这中间的距离,可能不仅是炒作,而是叙事快于现实。未来,这段距离会被市场修正,还是被现实拉近,取决于 Covenant 团队接下来交出的成果。

值得关注的是,Grayscale 已在 2026 年 1 月提交 TAO ETF 申请,显示机构资本对这条赛道的兴趣。此外,2025 年 12 月,Bittensor 将每日 TAO 排放减半,供给端结构性收紧也在酝酿中。

参考链接:

TAO-1,19%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar