OpenAI 刚刚发布了一款全新的 AI 模型,它可能会从根本上改变我们治疗疾病的方式,但有一个限制:你几乎肯定无法使用它。这款名为 GPT-Rosalind 的专业模型是 OpenAI 所称的“生命科学”系列中的首个产品。它是对罗莎琳德·富兰克林(Rosalind Franklin)的直接致敬,这位英国化学家的工作对发现 DNA 结构至关重要,但她在生前却遗憾地被边缘化。
与帮助你写邮件或规划假期的通用型 ChatGPT 不同,GPT-Rosalind 是一个特定领域的推理引擎。它旨在应对生物学、基因组学和蛋白质工程等高门槛、高风险的复杂领域。对于普通用户来说,这似乎只是又一个科技公告,但它对你药柜里的药物——以及这些药物研发所需的时间——有着深远的影响。
要理解 GPT-Rosalind 的重要性,我们必须审视实验室重工业的现状。从历史上看,在美国,一种新药从科学家的“灵光一现”到摆上药房货架需要 10 到 15 年的时间。这是一场大多数跑者都无法跑完的马拉松;进入临床试验的候选药物中,只有约十分之一能最终上市。
这段时间的大部分并不是花在灵感的闪现上,而是耗费在“苦差事”中:解析数千篇学术论文、查询碎片化的数据库,以及手动设计实验所需的化学试剂。在日常生活中,这相当于想要盖房子,但在开始打地基之前,你必须自己编写说明书并制造每一颗钉子。GPT-Rosalind 旨在成为那名不知疲倦的实习生,处理这些体力活,让科学家能够专注于治愈方案的架构。
OpenAI 不仅仅是做出大胆的声明,他们还拿出了数据支持。在 BixBench(一项测试 AI 处理现实世界生物信息学任务能力的基准测试)上,GPT-Rosalind 录得了 0.751 的通过率。这是目前所有已公布结果的模型中的最高分,击败了 GPT-5.4 等通用模型,甚至超过了谷歌的 Gemini 3.1 Pro 等竞争对手。
在与 Dyno Therapeutics 进行的一项特别引人注目的测试中,该模型被要求预测它从未见过的 RNA 序列的功能。GPT-Rosalind 的预测表现优于 95% 的人类专家,并在生成新序列方面达到了第 84 百分位。
| 基准测试 | GPT-Rosalind 得分 | GPT-5.4 (通用型) | Gemini 3.1 Pro |
|---|---|---|---|
| BixBench (生物信息学) | 0.751 | 0.732 | 0.550 |
| LABBench2 (实验室任务) | 表现最佳 | 在 6/11 项任务中胜出 | N/A |
| RNA 预测 | 95th 百分位 | N/A | N/A |
这意味着该模型不仅在通用意义上“更聪明”,而且更精确。它理解生物学的特定语法。如果说 GPT-5.4 是万事通,那么 GPT-Rosalind 就是专科医生。
如果这个工具如此具有革命性,为什么要把它锁起来?目前,GPT-Rosalind 仅作为研究预览版提供给美国符合条件的企事业客户,如安进(Amgen)、现代纳(Moderna)和赛默飞世尔科技(Thermo Fisher Scientific)。
这种准入限制有一个系统性的原因:生物安全。一个由 100 多名科学家组成的国际联盟最近警告说,在深度生物数据上训练的 AI 模型可能会被误用来设计危险的病原体或生物武器。OpenAI 的受限推广是对这些担忧的直接回应。要获得访问权限,机构必须经过严格的安全审查,并证明其研究具有明确的公共利益。
对于普通用户来说,这创造了一个奇怪的悖论。你生活在一个正在构建最先进人类健康工具的时代,然而它们比我们每天使用的消费级应用更加去中心化且不透明。你近期不会在 ChatGPT 的侧边栏中看到“Rosalind”按钮。
OpenAI 还为 Codex 发布了一个免费的生命科学研究插件,它可以连接到 50 多个科学数据库。这允许研究人员直接查找蛋白质结构和基因组学流程。这是向科学工作空间更广泛进军的一部分,始于 1 月份推出的 Prism——一个用于撰写论文的 LaTeX 原生环境。
从大局来看,我们正看到从通用 AI 向“垂直 AI”的转变。正如我们有专门针对建筑师或会计师的软件一样,我们现在正看到生命科学数字骨干的出现。OpenAI 不仅仅是在构建一个聊天机器人,他们正在构建一个实验室操作系统。
虽然你无法登录 GPT-Rosalind 来为自己的咳嗽进行自我诊断,但它的存在最终会波及到你当地的药房。
最终,GPT-Rosalind 代表了我们看待 AI 方式的转变。它正从一个数字玩具转变为人类生存的基础工具。你可能不是输入提示词的人,但你肯定会是受益于答案的人。值得密切关注这个领域——不是为了炒作,而是为了在世界最先进实验室锁上的大门背后,那些悄然发生的、复利式的进步。



