多年来,科技精英们一直以处理故障社交网络或漏洞百出的操作系统的思维方式来对待人体。这种叙事诱人且简单:如果我们能映射代码,就能修复漏洞。在这个世界里,癌症只是一个逻辑错误,而衰老则是内存泄漏。虽然这种观点推动了数十亿美元的投资,但生物学的现实远比任何硅谷服务器集群都要混乱得多。
马克·扎克伯格和普莉希拉·陈的 Biohub 是将这种计算逻辑应用于生物世界的最新、或许也是最雄心勃勃的尝试。通过投入 5 亿美元构建人类细胞的 AI 模型,他们不仅是在寻找一种新药;他们正试图构建生命本身的数字模拟。但在“预测建模”和“大规模计算基础设施”这些术语背后,我们必须追问:软件真的能掌控人类生物学那种不断变化、反复无常的本质吗?
要理解 Biohub 正在尝试做的事情,我们需要了解现代 AI 的运作机制。我们都熟悉像 ChatGPT 这样的大语言模型(LLMs),它们通过数万亿个单词的训练来预测下一个句子。Biohub 的计划本质上是将细胞视为一种语言。这里的“词汇”不是单词,而是由基因序列、蛋白质结构和化学信号组成的。
通过将海量的生物数据输入到由英伟达(NVIDIA)驱动的超级计算机中,研究人员希望创建一个“虚拟细胞”。简单来说,这是一个数字模拟器,科学家可以在其中询问:“如果我们向肺细胞引入这种化学物质会发生什么?”AI 将在几秒钟内运行数百万次模拟,而不是在实验室里用培养皿花费三年时间。这就是医学的去中心化未来——将发现过程中的繁重工作从物理实验室转移到数字云端。
然而,存在一个根本性的障碍。虽然互联网为 AI 学习英语提供了现成的数据集,但生物数据是出了名的不透明。我们目前缺乏高保真传感器来在分子水平上实时观察细胞的生命活动。正如 Biohub 科学负责人 Alex Rives 所指出的,我们需要比目前存在的数据多出几个数量级的数据。我们不仅是在构建 AI;我们还必须发明显微镜和传感器来为其提供数据。
Biohub 并不是这个领域唯一的参与者。我们正在见证一场系统性的转变,大型科技公司正在有效地吸收制药行业。从大局来看,细胞建模竞赛已成为新的太空竞赛,主要参与者各自占据了不同的领域:
| 参与者 | 核心策略 | 关键优势 |
|---|---|---|
| CZ Biohub | 开源数据和基础细胞模型 | 海量单细胞数据集和非营利协作 |
| Isomorphic Labs (Google) | 利用 AlphaFold 进行 AI 驱动的药物研发 | 在蛋白质折叠和结构方面的最深厚专业知识 |
| Microsoft Health AI | 大规模医学影像和临床记录 | 与现有医院系统和基因组学的整合 |
| NVIDIA (BioNeMo) | “数字原油”供应商 | 提供专用芯片和供他人构建的平台 |
对于普通用户来说,这种竞争是一把双刃剑。一方面,它加速了发现的步伐。另一方面,它创造了一个动荡的格局,我们未来的健康数据正越来越多地由管理我们电子邮件和社交动态的同一批公司来管理。
从历史上看,科技行业一直难以应对“生物熵”的概念。在计算机中,1 + 1 总是等于 2。但在人体中,一种能救人的药物可能对另一个人有毒,原因仅仅是肠道微生物群的微小差异或一周的工作压力。生物学不是一个静态的蓝图;它是一个对环境做出反应的、具有韧性的、相互关联的网络。
这正是“治愈所有疾病”的口号面临的最严峻挑战。从实际角度来看,即使是一个完美的细胞模型也无法解释整个人体生物系统的混沌本质。将 AI 作为一名不知疲倦的实习生来筛选数十亿种蛋白质组合,对科学来说是颠覆性的、基础性的,但它并不是一根魔杖。
换句话说,拥有建筑中每一块砖的完美地图,并不一定能告诉你城市的交通是如何流动的。Biohub 专注于“砖块”——即细胞。理解这数万亿块砖块如何相互作用以创造人类健康的“交通”,是一个更大、更系统的问题,仅靠数据可能无法解决。
虽然扎克伯格在本世纪末治愈所有疾病的目标听起来像科幻小说,但切实的物理影响已经开始渗透到消费者层面。以下是这种从实验室到笔记本电脑的转变在未来十年可能改变你生活的方式:
最终,我们不应将 Biohub 的 5 亿美元投资视为治愈疾病未来的保证,而应将其视为构建一套更先进的工具。我们正在告别医学是一系列经验性猜测的时代,迈向医学是高分辨率模拟的时代。
从消费者的角度来看,最值得关注的不是那些抢占头条的“治愈所有疾病”的语录,而是这项技术如何整合到医疗供应链中。如果这些 AI 模型奏效,理论上它们应该通过降低临床试验中 90% 的失败率来降低药品成本。如果价格没有下降,我们就会知道效率提升带来的收益被企业而非患者获取了。
展望 2026 年及以后,AI 与生物学的交汇仍然是科技领域最令人兴奋、也最复杂的领域。它提醒我们,虽然我们可以制造会思考的机器,但我们所居住的机器——我们的身体——仍然是地球上最复杂的科技。目标不仅是修补代码,而是最终理解编写代码的语言。
来源:


