OpenAI Codex Security 扫描 120 万次代码提交：揭示 10,561 个高风险安全问题

OpenAI Codex Security 利用深度上下文和智能体 AI 推理，在 120 万次提交中识别出 10,561 个高风险漏洞。

2026年3月8日

OpenAI Codex Security 扫描 120 万次代码提交：揭示 10,561 个高风险安全问题

软件安全领域正从被动补丁转向主动的 AI 驱动识别。OpenAI 随着 Codex Security 的推出正式进入这一领域，这是一个先进的 AI 驱动安全智能体。在其最初的大规模部署期间，该工具扫描了 120 万次代码提交，并识别出 10,561 个高风险漏洞——这些问题通常是传统自动化工具容易忽略的。

这一发布标志着 DevSecOps 演进中的一个重要里程碑。通过超越简单的模式匹配，OpenAI 旨在为开发者提供一个能够理解漏洞背后“原因”而不仅仅是“位置”的工具。

从 Aardvark 到 Codex Security

Codex Security 是 Aardvark 的直接后裔，后者是 OpenAI 在 2025 年底开始进行私测的一个内部项目。虽然 Aardvark 最初主要用于帮助 OpenAI 自身的开发者保护其基础设施，但 Codex Security 已被提炼为一个面向消费者的成熟智能体工具。

与根据僵化规则标记潜在问题的传统静态分析安全测试 (SAST) 工具不同，Codex Security 以“智能体”的形式运行。这意味着它不仅仅是扫描代码；它还会浏览代码库，理解依赖关系，并验证潜在缺陷在应用程序的特定上下文中是否真正可被利用。OpenAI 声称，这种从被动扫描器到主动验证器的演进，减少了经常困扰安全团队的误报“噪音”。

深度上下文的力量

自动化安全面临的主要挑战之一是上下文。一段代码在孤立状态下可能看起来很危险，但由于外部清理或架构约束，它可能是完全安全的。相反，看似无害的代码在与特定的库版本或环境变量结合时，可能会产生灾难性的后果。

OpenAI 将这种能力描述为“深度上下文”。为了理解它，可以想象一位建筑检查员。传统工具就像一个传感器，如果看到磨损的电线就会发出鸣叫。而 Codex Security 就像一位经验丰富的电工，他看到磨损的电线后，会将其追溯到断路器箱，意识到它是当前已断电的冗余系统的一部分，并据此判断它是构成真实的火灾风险，还是只需要进行微调。

通过构建项目的这种全面图谱，该智能体可以提供更高置信度的发现。这使得开发者能够将有限的时间集中在真正重要的 10,561 个高风险问题上，而不是筛选数千个低影响的警告。

方法对比：AI 与传统 SAST

为了理解 Codex Security 在现代开发工作流中的位置，将其功能与传统安全工具进行对比会很有帮助。

功能	传统 SAST 工具	OpenAI Codex Security
分析方法	模式匹配与启发式算法	智能体推理与深度上下文
误报率	通常较高；需要人工分选	较低；在报告前验证结果
修复建议	通用建议或文档链接	提供具体的、感知上下文的代码修复
范围	通常限于单个文件/模块	全库及依赖项感知
速度	小型扫描速度极快	较慢，但更彻底且具自主性

剖析 10,561 项发现

虽然 OpenAI 尚未公布在 120 万次提交扫描中发现的具体漏洞的完整明细，但“高风险”标签通常是指可能导致未经授权的数据访问、远程代码执行 (RCE) 或整个系统崩溃的缺陷。

在许多情况下，这些漏洞并非出现在新代码中，而是出现在代码库的遗留部分，那里多年前做出的安全假设在今天已不再成立。Codex Security 的智能体特性使其能够通过现代威胁向量的视角“重新阅读”旧代码，识别出多年来一直隐藏在眼皮底下的逻辑缺陷。

开发者实用建议

Codex Security 目前面向 ChatGPT Pro、Enterprise、Business 和 Edu 层级的用户提供研究预览版。在接下来的一个月内，用户可以免费使用，为团队将其集成到 CI/CD 管道中提供了一个无需立即承担成本支出的窗口。

如果你计划测试该工具，请考虑以下步骤：

从遗留项目开始： 针对文档可能稀缺的旧代码库运行该智能体。这是该工具推断上下文能力最有价值的地方。
审查建议的修复方案： 虽然 Codex Security 会提出修复建议，但它不能替代人工监督。务必在分阶段环境中审查建议的代码更改。
集成而非取代： 将 Codex Security 与现有的 linting 和 SAST 工具配合使用。它旨在捕获“复杂”问题，但传统工具在捕获简单的基于语法的安全错误方面仍然更快。
监控幻觉： 与任何基于大语言模型 (LLM) 的工具一样，AI 存在“幻觉”出引入不同逻辑错误的修复方案的非零风险。将其输出视为高质量的草案，而非最终指令。

自主安全的未来

Codex Security 的发布标志着向自主安全运营的转变。随着软件变得越来越复杂以及部署速度的加快，人类安全团队无法手动审计每一行代码。能够作为“力量倍增器”——在大规模范围内发现、验证和修复缺陷的工具——将成为开发者工具包的标准组成部分。目前，发现的 10,561 个问题清醒地提醒着我们在保护世界软件安全方面还有多少工作要做。