关闭广告

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势2026-02-03 00:00:0175人阅读



产业竞争的烈火终究是烧到了大模型上,前段时间,知名编程模型Claude的开发商、估值超过3500亿美元(约合25000亿人民币)的Anthropic公司选择对华“断供”。而且不仅是对中国企业,也明确指出包含中国公司持股的海外企业。

国内企业陆续被暂停了Claude API使用,纷纷寻找替代品。包括字节跳动的TRAE和腾讯的CodeBuddy等编程平台的国内版,也被迫下架Claude模型,一时间风声鹤唳。

在大模型百花齐放的今天,Claude断供中国真的如此关键吗?答案是肯定的。

Claude之所以难以被替代,源于其深厚的技术积淀。在复杂算法实现和系统架构设计等高级编程任务中,Claude有更高的完成度,跨越了编程领域“可信”和“可靠”的心理阈值。

然而,机遇往往与危机并存。



1月底,一家中国大模型公司发布的新开源模型,因为突出的编程性能和视觉理解能力,引发了海内外技术社区和开发者的广泛关注。

连续一周登上Twitter科技新闻热搜,仅仅三四天时间,官方发布帖子的阅读量就达到了 680万,甚至不亚于美国OpenAI和Anthropic的旗舰模型发布帖子。顶尖AI技术领袖,160万粉丝的前特斯拉AI总监Andrej Karpathy、卡内基梅隆大学教授Tim Dettmers等专家也点赞恭喜。



从AI行业权威的评测机构LMarena(大模型匿名竞技场)代码能力基准测试中,这个名为Kimi K2.5的中国模型,排在全球开源模型的第一位,仅次于Claude和谷歌Gemini最新的旗舰模型。在前10名的榜单中,也是唯一的中国模型。



美国大模型技术最好的三家公司:OpenAI、Claude和Gemini,因为旗下模型的性能和实际表现总在排行榜的前列,通常被行业称为美国“御三家”。

这是第一次,中国公司通过开源模型打破了美国“御三家”的编程和视觉理解技术垄断。

美国另一家权威评测机构Artificial Analysis和中国模型基准测试机构SuperCLUE的分析都显示,Kimi K2.5模型的智能水平是全球开源第一,仅次于闭源的美国“御三家”。

在特别注重编程性能的AI领域,但凡有一款大模型做到关键指标领先,就会被迅速推开。

Kimi K2.5一经推出后,海外知名编程工具Kilo Code就迅速接入,并宣布首周免费来吸引用户。国内,腾讯旗下编程工具CodeBuddy、字节跳动旗下编程工具TRAE也第一时间上架,因为突出的编程能力,和同时支持视觉的完备性,立即成为首选国产模型。



而发布Kimi K2.5模型的这家中国创业公司,却有个略显“中二”的名字,叫月之暗面。2025年底,他们刚刚完成了C轮35亿元的融资,公司总估值在350亿左右。仅为Anthropic 2.5万亿的1/70。



和很多工业软件一样,在编程大模型领域,中国的业界曾经也处于被卡脖子的状态。

据行业评测数据显示,Claude在复杂算法实现、系统架构设计等高级编程任务中的完成度显著高于行业平均水平。在市场生态方面,Claude也因为先发优势,构建了完整的开发者服务体系,形成了显著的用户粘性,特别是大型企业用户的年均续约率更高。

也正是基于这些优势,Claude的相关模型价格高了国内5-7倍。

那么贵,为什么不用国产?

不得不承认,在这个中国模型亮相之前,国产编程模型存在明显的技术差距。

首先是模型的智能水平,海外模型基本都是万亿参数起步,才能做到对广泛任务和高难度任务的较好应对。中国主要是几千亿参数的模型,难以应对较为复杂的任务,只能做一些非常简单的编程工作。

然后是,中国主流模型在架构设计上普遍采用纯文本预训练,缺乏视觉模块的整体集成。这意味着模型无法理解图像包含的语义信息,在需要多模态理解的场景中表现受限。

比如在前端开发领域。某大型电商平台技术团队曾进行对比测试:当要求模型根据UI设计稿生成前端代码时,必须有很强视觉能力,才能准确识别设计稿中的布局关系、色彩体系和交互元素。

视觉理解能力的技术门槛主要体现在三个层面:首先是视觉信号编码,需要将像素信息转化为有意义的特征表示;其次是跨模态对齐,要求模型理解视觉内容与文本描述之间的关联;最后是统一表示学习,需要建立共享的语义空间。

这些技术难题如同几座大山,阻碍了国产编程模型的进阶之路。

而在实际应用中,这种技术差距直接影响了开发效率。开发效率的差距进一步影响了产品的迭代速度,这在快速变化的市场环境中是致命的。

大模型不同于新能源汽车,要想超车,没有技术以外的捷径可走。

面对技术壁垒,中国公司选择对大模型的底层架构进行革新。

比如Kimi K2.5采用了原生多模态架构,通过ViT+Transformer的混合编码器实现图像和文本的联合表示,在模型底层实现了信号融合。

这种设计相比传统的后期融合方法,在语义保持度和计算效率上具有显著优势,具体而言,模型在训练过程中就建立了视觉与文本的深度关联,而非简单地将两个独立的模型输出进行拼接。

此外,据了解,在Kimi K2.5模型的开发中,这家公司还重点优化了训练基础设施,通过重构强化学习框架,让训练效率提升数倍。

而在视觉理解能力的痛点上,Kimi K2.5更是实现了对Claude的反超:在界面设计稿转代码任务中,Kimi K2.5可准确识别组件的空间关系、样式属性和交互逻辑,代码生成准确率超过Claude。

更为友好的是Kimi K2.5的定价:API调用的输入价格为4元/百万Token,仅为Claude中号模型Sonnet 4.5的1/5,大号模型 Opus 4.5 的1/8。

对于那些每年在大模型上砸数千万元的互联网企业而言,终于等到了一个全功能的、代码和视觉能力都很强的Claude中国平替模型。



当然,一个大模型好不好用,性能到底受不受认可,最终都是市场来说话。

OpenRouter数据显示,Kimi K2.5上线第二天即进入日活跃度前三。



全球最大、估值超千亿的AI搜索创业公司Perplexity,第一时间上架了Kimi K2.5模型,作为给付费用户的高级模型使用。在Perplexity平台上,这也是唯一的中国模型。



从全球开发者的实际反馈来看,这个名为Kimi K2.5的模型,编程能力的表现非常突出, “可以挑战Claude的中号模型Sonnet 4.5,略逊于大号模型Opus 4.5”,同时价格只有他们的1/5到1/8,性价比优势突出。

知名编程工具Cline的开发专家Juan Pa发帖称,他在一项实际编程任务中测试了Codex 5.2、Opus 4.5 和 Kimi K2.5三个模型,他的测试结果是“Kimi K2.5以38%的成本达到了约Opus 90%的质量。”



人工智能专家Mariusz Kurman则建议,“在项目计划阶段使用Opus4.5模型,在创建阶段使用Kimi K2.5模型,可以达到最佳效果。”



在国内技术社区上,开发者们实测之后反馈称,“Kimi K2.5多模态能力以及coding能力还可以的,作为Gemini Pro。Claude和GPT5.2 codex模型的替代也是不错的。国产模型越来越好了。”



一直以来,很多人都以为在AI竞赛上,美国企业主导基础模型层,而中国企业只是擅长应用开发。

2025年初,DeepSeek的出现打破了这种判断。2026年初,这家叫月之暗面的公司推出的新模型,则在编程这个关键领域再次突破了美国模型的垄断。

事实上,这家公司并不是2026年初才横空出世的。早在2025年中,他们就因为首个万亿参数的开源模型K2受到了国际社会的关注,被英国自然杂志称为中国的另一个DeepSeek时刻。

而在硅谷广受欢迎的All-In Podcast中,Kimi K2.5也被直接定义为“开源AI的重要里程碑”。



硅谷知名的风险投资家、企业家Chamath Palihapitiya将Kimi K2.5的发布和带来的反响概括为“Kimi K2.5时刻”。

作为一位曾参加白宫科技圆桌会议并采访过美国总统的权威人士,Chamath认为,开闭源已不只是技术路线之争,而是企业、组织乃至国家层面的“基础设施选择”。

由此可见,我们需要更多的DeepSeek时刻,需要看到更多中国力量的突破,不是一个DeepSeek,而是一大批DeepSeek。特别是在地缘政治不确定性的背景下,本土模型更是中国企业的刚需,因为在核心系统中采用自主可控的AI技术,既是商业选择,也是战略必须。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨振宁逝世:改变了中国人觉得不如人的心理/库克:苹果AI正努力入华/GPT-5攻克「百年数学难题」遭反转|Hunt Good周报

爱范儿 浏览 274 10-19

王毅:中国愿做促进全球增长的稳定力量

经济观察报 浏览 2716 02-19

她的发型又火了!年底做头发,不妨从这篇找找灵感

黎贝卡的异想世界 浏览 119 12-30

云南省农科院征集新品种月季名 网友二舅的名字被采纳

上游新闻 浏览 104 12-24

宗馥莉的两大心腹疑似离职,“宏胜系”权力大洗牌

财通社 浏览 186 10-15

媒体:34岁印度穆斯林后裔拿下纽约 令特朗普感到畏惧

南风窗 浏览 183 11-12

2025造车新势力变局:“鸿零米”改变“蔚小理”格局

21世纪经济报道 浏览 103 01-06

广汽拟设立合资公司,持续深化低空经济布局

盖世汽车 浏览 2540 07-09

继续引援脚步,多位媒体人:北京首钢正在接触前NBA球员麦基

懂球帝 浏览 93 01-07

浙江稠州商业银行“共享法庭”实践,获评消费者权益保护领航企业

Daily每日财报 浏览 105 01-05

腾讯 AI 实现肺癌基因突变预测,精度最高 99%

IT之家 浏览 217 10-13

2025年ETF盘点:冠军花落通信ETF,年度黑马竟是它!十大关键事件影响深远

每经牛眼 浏览 114 01-02

商务部公告附件首次改为wps格式 此前多为doc或pdf

上游新闻 浏览 159 10-13

鸣鸣很忙明天上市:获腾讯淡马锡等2亿美元融资 市值将超800亿

雷递 浏览 98 01-28

净利润减少超50%,珍酒李渡能靠“大珍”走出低谷吗?

征探财经 浏览 35 03-03

泰国达叻府5县实施宵禁

新京报 浏览 113 12-15

一汽丰田10月销售新车71407辆 今年累计销售65.8万辆

网易汽车 浏览 173 11-03

日本渣男骗前女友拍全裸写真出轨

孤独的独角兽影视 浏览 170 01-16

乌戈:今天是场起伏很大的比赛;过去几场打出了我们想要的风格

懂球帝 浏览 62 02-04

方盒子"大床房" 福特智趣烈马售22.98万起

网易汽车 浏览 109 12-20

今年一定要拥有这件“爆火单品”,让你美出新高度

LinkFashion 浏览 117 12-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2