🍀 Spring Appointment, Lucky Draw Gifts! Growth Value Issue 1️⃣7️⃣ Spring Lucky Draw Carnival Begins!
Seize Spring Luck! 👉 https://www.gate.com/activities/pointprize?now_period=17
🌟 How to Participate?
1️⃣ Enter [Plaza] personal homepage, click the points icon next to your avatar to enter [Community Center]
2️⃣ Complete plaza or hot chat tasks like posting, commenting, liking, and speaking to earn growth value
🎁 Every 300 points can draw once, 10g gold bars, Gate Red Bull gift boxes, VIP experience cards and more great prizes await you!
Details 👉 https://www.gate.com/announcements/article/
独立AI生态系统的建设:本地芯片和先进算法如何推动2026年的变革
已经过去八年,自从地缘政治的考验开始。2018年,国际障碍在半导体行业爆发,中国企业面临前所未有的危机。但到了2026年,故事截然不同。全球AI格局反映出一次重大变革——从由单一强国主导的技术,到多条路径同步发展的世界。核心问题不再是“我们能否生存”,而是“我们应付出多少代价,才能实现计算的独立”。
真正的阻碍:生态系统的封锁,而非芯片
许多人认为主要障碍在硬件。但事实更为深刻。被称为CUDA——Compute Unified Device Architecture的平台,实际上成为中国AI企业的主要障碍。NVIDIA于2006年推出该平台,为开发者提供GPU计算能力的直接访问。起初,这只是一个简单工具,但随着深度学习时代的到来,它成为整个行业的基础。
训练大型AI模型本质上是大规模矩阵运算——GPU在此中发挥关键作用。CUDA生态系统经过十余年的发展,建立了从硬件到应用层的完整链条,为全球AI开发者提供支持。如今,所有主要框架——从Google的TensorFlow到Meta的PyTorch——都深度依赖CUDA基础设施。
这个生态系统已成为一个难以打破的飞轮。开发者越多,工具和库越丰富;生态越完善,吸引的开发者越多。到2025年,CUDA拥有超过450万开发者,支持超过3000个GPU加速应用。这意味着全球超过90%的AI开发者都依赖这个生态。
问题不仅在技术层面,更在结构性。如果想切换到其他平台,就必须重写所有经验、工具和代码——这些都是全球顶尖人才十年积累的成果。谁来承担这个成本?因此,在2022-2024年连续出现的障碍中,中国AI企业没有选择正面抗争,而是走上了更艰难的道路——通过创新实现技术自主。
算法突破:成本经济学的转变
从2024年底到2025年,中国AI企业集体转向一条新技术路径:混合专家模型(MoE,Mixture of Experts)。这个概念优雅而强大——不再让整个大模型在每个任务中全部运行,而是将其拆分为多个较小的专家,只激活最相关的部分。
以DeepSeek V3为例。拥有6710亿参数,但每次推理只用到370亿参数——仅占总数的5.5%。训练时,使用2048个NVIDIA H800 GPU,耗时58天,总成本达557.6万美元。相比之下,GPT-4的预估训练成本接近7800万美元,差距达近一倍半。
这种极致优化直接反映在价格上。DeepSeek API的输入成本为每百万token 0.028到0.28美元,而GPT-4的输入费用为每次5美元。Claude Opus更贵。实际效果是:DeepSeek的价格比竞争对手低25到75倍。
这一变革对全球开发者市场的影响巨大。到2026年2月,在全球最大的API集成平台OpenRouter上,中国AI模型的周使用量在短短三周内激增127%,首次超过美国。每年,中国模型的市场份额仍不足2%,但一年后已达6%。
原因在于结构性变化。从2025年下半年开始,AI的主要应用从简单对话转向Agent系统。在Agent场景中,Token的使用量比普通对话高10到100倍。当Token消耗呈指数增长时,价格成为决定性因素。而中国模型的极致效率正好满足新兴市场的需求。
从推理到训练:本地芯片的质变飞跃
最大里程碑之一,是本地芯片从仅支持推理到全面训练的转变。这不仅是渐进式改进,而是质的飞跃。
在江苏兴化,这个曾以钢铁和食品闻名的城市,建成了一条长达148米的本地计算服务器生产线,仅用180天就完成了合同签订到投产的全过程。核心是两款完全自主设计的芯片:龙芯3C6000处理器和泰楚元气T100 AI加速器——从指令集到微架构全部自主研发。
2026年1月,智谱AI联合华为推出了GLM-Image,这是首个完全由本地芯片训练的先进图像生成模型。2月,中国电信在上海临港完成了“星辰”模型的全流程训练——参数规模达万亿级。
关键不在芯片本身,而在信号:本地基础设施已具备生产级AI开发的能力。推理只需推理能力,需求低;训练则需要大规模数据处理、复杂梯度计算、宽带资源和成熟的软件生态。这是一个根本更高层次的需求。
华为昇腾系列成为主要入口。到2025年底,昇腾生态系统拥有400万开发者和3000多合作伙伴。行业内43个主要模型已成功预训练,超过200个开源适配版本。2026年3月,在MWC上,华为还展示了面向海外市场的SuperPoD基础设施,昇腾910B已实现FP16算力与NVIDIA A100的对等。
这种生态的建立,并非从完美芯片开始,而是从“足够好”的芯片规模化部署,利用实际商业需求作为持续改进的催化剂。字节跳动、腾讯、百度等企业的本地服务器采用战略目标,到2026年都比2025年翻了一番。
无形优势:能源成为新竞争前沿
当世界聚焦芯片竞争时,更根本的约束在背后逐渐显现:能源。
2026年初,美国弗吉尼亚暂停了新建数据中心的许可,随后乔治亚、伊利诺伊、密歇根也相继跟进。国际能源署数据显示,2024年美国数据中心的用电量已达183太瓦时,约占全国总用电的4%。到2030年,预计将翻倍至426太瓦时,占比超过12%。
Arm的CEO警告,单是AI数据中心的用电量,到2030年可能占到美国总用电的20-25%。美国电网已然紧张。PJM电网覆盖13个东部州,电力缺口达6GW。到2033年,美国将面临全国范围的175GW电力缺口,相当于1.3亿家庭的用电量。主要数据中心所在地区的电价在过去五年上涨了267%。
相反,中国的年度发电总量达10.4万亿度,是美国的2.5倍。更关键的是,中国居民用电仅占总用电的15%,而美国为36%。这意味着中国拥有更大的工业用电容量,可以专门用于AI计算基础设施。
电价差异更为悬殊。中国西部工业用电价已接近每千瓦时0.03美元,而美国主要AI枢纽地区的电价为0.12到0.15美元,是中国的4到5倍。
实际影响是:当美国担心电力紧张时,中国正悄然扩展计算基础设施。工业算力已达1590EFLOPS(十亿亿次浮点运算),2026年将迎来大规模本地计算部署。
Token作为新型数字商品
这一现象创造出一种新的经济现实。Token——AI模型使用的基本信息单位,正成为在中国制造、通过海底电缆全球分发的数字新商品。
DeepSeek用户的地域分布显示:30.7%来自中国,13.6%来自印度,6.9%来自印度尼西亚,4.3%来自美国,3.2%来自法国。支持37种语言,特别在巴西等新兴市场有较高采纳率。全球注册企业达2.6万家,企业版用户达3200家。
到2025年,新增AI创业公司中有58%将DeepSeek集成到技术栈中。在中国,市场份额已达89%;其他国家根据地区不同在40%到60%之间。这一分布模式,犹如一种数字版的传统贸易格局——技术在某一地区制造,全球分发,形成新的经济依赖。
历史的类比:今日局势有何不同
对比1986年日本半导体危机,颇具启示。那年,日本占据全球市场51%,前十名中有六家是日本公司。但在签署美日半导体协议后,美国利用301调查和战略支持韩国竞争者,打破了日本的垄断。日本的DRAM市场份额从80%跌至10%。
日本的悲剧源于单一路径依赖——更高效的生产,但缺乏自主生态。一旦市场准入受阻,无备选策略。
而中国当前的地位则截然不同。不是防御性,而是有意为之。从算法优化到本地芯片研发,再到能源基础设施和全球Token分发,每一环都经过深思布局,旨在实现自主。每一次在芯片上的损失,都是生态建设的直接成本,但也是工业化真正自主基础的“战争税”。
2026年的战况:一半火焰,一半水流
2026年2月27日,三份本地AI芯片企业的业绩报告同时发布。寒武纪——营收增长453%,首次实现全年盈利;摩尔线程——营收增长243%,但净亏损10亿美元;牧星——营收增长121%,净亏损80亿美元。
模式:一半火焰,一半水流。火焰代表市场对替代方案的渴望。黄仁勋的95%市场份额,使NVIDIA难以垄断AI基础设施——而这些本地企业的财报证明,市场愿意接受次优技术,只要有选择。
水流——亏损,是生态建设的真实成本。每一笔亏损,都是在生态发展、软件补贴和现场工程支持上的投入。这不是失败的标志,而是“战时经济”下的自主建设表现。
这场变革非庆典,而是血与火的战报。士兵在流血中崛起,但战争的本质已发生根本转变。八年前,问题是“我们能否生存”;如今,问题变成“我们应花多少钱,才能获得自由”。成本,反而成为衡量真正进步的指标。