每当你要求人工智能总结长文档或编写一行代码时,幕后都会触发一系列金融事件。你每月订阅费的一小部分会从应用界面通过亚马逊或谷歌等云提供商,最终流向英伟达(Nvidia)的资产负债表。这就是现代科技世界的“税收”。对于像 Anthropic 这样的公司来说,这些成本对其业务模式构成了持续的压力。为了改变这种动态,Anthropic 现在正着眼于其算力的物理源头。该公司正处于与三星(Samsung)设计和制造其自有定制 AI 芯片的早期讨论阶段。
这一转变使 Anthropic 从一家租用计算机算力的软件公司,转变为一家掌控自己命运的硬件设计者。虽然合作伙伴关系仍处于探索阶段,但它标志着 AI 行业运作方式的重大变化。目标很简单:减少支付给外部芯片供应商的巨额账单,并获得构建运行 Claude(Anthropic 的旗舰 AI)的硬件能力,使其比通用芯片更高效。从大局来看,这是一个从购买通用工具到为单一任务构建专用机器的过渡。
要理解 Anthropic 为何想要自有芯片,我们必须看看这些系统是如何运作的。当今大多数 AI 都运行在英伟达制造的图形处理器(GPU)上。这些芯片是 21 世纪的数字原油。它们功能强大且用途广泛,但也价格昂贵且消耗大量电力。因为英伟达设计这些芯片是为了服务于成千上万家不同的公司和使用场景,所以它们带有专业化公司可能并不需要的开销。
Anthropic 正在探索一条不同的道路。通过与三星合作,他们可以设计一种忽略 Claude 从不执行的任务的芯片。这种精简的方法可以实现更高的每瓦性能。在数据中心领域,电力往往是最高的经常性成本。如果定制芯片在生成相同句子时减少 30% 的功耗,这将直接转化为更高的利润率或更低的用户终端价格。实际点说,这就是驾驶笨重的豪华 SUV 递送一封信件与使用专用自行车快递员之间的区别。两者都能完成任务,但后者针对特定目标的效率要高得多。
三星是地球上少数几家拥有将 Anthropic 的蓝图转化为物理现实的基础设施的公司之一。虽然英伟达设计芯片,但他们实际上并不自己烧制硅片,而是依赖代工厂。三星是这一领域的巨头,并一直在专门为 AI 扩大产能。他们已经制造高带宽内存(HBM),这是一种 AI 芯片高速处理数据所需的特殊 RAM。
通过与三星合作,Anthropic 获得了垂直整合供应链的渠道。三星生产内存,管理代工厂,并拥有协助现代处理器所需复杂封装的工程人才。有趣的是,三星也与英伟达密切合作,提供 Anthropic 希望最终减少依赖的那些组件。这创造了一个复杂的协作网络,三星在其中扮演着竞赛中所有人的供应商角色,确保无论哪种 AI 模型最终胜出,他们都能获利。
在市场方面,这一合作伙伴关系有助于三星与台积电(TSMC)竞争,后者是目前主导高端芯片市场的台湾巨头。如果三星能成功帮助 Anthropic 推出具有竞争力的芯片,就证明了对于其他希望摆脱英伟达生态系统的科技公司来说,他们是一个可行的替代方案。这种竞争对行业是有益的,因为它防止了单一公司对驱动我们数字生活的硬件产生完全垄断。
Anthropic 并非在真空环境中运作。他们的主要竞争对手 OpenAI 最近宣布与博通(Broadcom)合作开发名为 Jalapeño 的自有定制处理器。Anthropic 消息传出的时机可能并非巧合。在科技行业,如果你的竞争对手制造了自己的引擎,你就不能永远继续租用引擎,否则在速度和成本上就会落后。
OpenAI 声称 Jalapeño 是一款推理处理器。通俗地说,推理就是 AI “思考”并给出答案的行为。训练是 AI 从数据中学习的初始阶段。训练需要大规模、昂贵的芯片集群,而推理则是数百万用户提示机器人时每分每秒都在发生的事情。如果 Anthropic 将与三星的合作重点放在推理芯片上,他们瞄准的就是其业务中随用户群规模增长的部分。
从历史上看,同时控制软件和硬件的公司拥有巨大优势。苹果(Apple)是这一策略的典范。通过设计 iPhone 内部的芯片,苹果使硬件和软件完美协作,从而实现比使用通用部件的竞争对手更长的电池寿命和更快的性能。Anthropic 和 OpenAI 现在正试图将同样的逻辑应用到云端。他们希望 Claude 和 ChatGPT 运行在为运行它们而生的芯片上。
对于使用 AI 应用写邮件或规划假期的人来说,这些公司层面的博弈似乎很遥远。然而,其影响是切实的。目前,运行 AI 模型的高昂成本是许多最佳功能被锁定在每月 20 美元订阅费背后的原因。随着像 Anthropic 这样的公司转向定制芯片,生成响应的成本将会下降。
| 功能 | 通用 GPU (英伟达) | 自研 AI 芯片 (拟议) |
|---|---|---|
| 功耗 | 高 | 针对特定任务优化 |
| 可用性 | 受全球短缺限制 | 由公司掌控 |
| 每次提示的成本 | 因高利润率而昂贵 | 长期来看更低 |
| 性能 | 多功能但宽泛 | 针对特定 AI 模型速度更快 |
在日常生活中,这可能会带来一个 AI 集成到更多设备中的未来,而不需要持续的互联网连接或沉重的订阅费。如果芯片变得足够高效,我们可能会看到高质量的 AI 在笔记本电脑甚至家用电器上本地运行。从消费者的角度来看,三星与 Anthropic 的交易是迈向让先进智能成为廉价、无形的公用事业,而非奢侈服务的一步。
最终,该项目的成功取决于 Anthropic 定义其实际需求的能力。据报道,他们仍在决定芯片的确切功率和服务器配置。硬件是一个缓慢且不容错错的行业。与软件不同(你可以在几分钟内修复漏洞),芯片设计中的一个错误需要数月时间和数百万美元来纠正。Anthropic 进入芯片领域承担着巨大的风险,但另一种选择是继续依赖他们无法控制的供应链。
展望未来,你应该会看到更多此类合作伙伴关系。通用计算机时代正慢慢让位于超专业化机器时代。作为用户,你将从更快的响应速度和更具韧性的服务中受益。下次当你的 AI 助手即时回答问题时,原因可能就是一块在韩国三星工厂制造的定制芯片。这就是现代世界的数字骨干正在被重建的方式——一次一块定制芯片。
来源:Reuters, The Information, TechCrunch, Samsung Electronics Investor Relations.


