在包装打开之前中和供应链威胁

Perplexity 的 Bumblebee 工具可在不执行代码的情况下扫描恶意软件和 MCP 配置，保护现代 AI 供应链免受攻击。

2026年5月26日

现代恶意软件检测的一个基本悖论是：寻找威胁的行为往往正是引狼入室的原因。在我追踪高级持续性威胁（APT）和分析软件供应链攻击残骸的这些年里，我目睹了一个反复发生的悲剧：安全分析师运行了一项旨在保护其环境的扫描，结果该扫描却触发了它原本要寻找的有效载荷。这在数字世界中相当于怀疑一瓶水有毒，却决定通过喝一口来检查。

从风险的角度来看，这种生存方式已经变得难以为继。5 月 11 日，我们在一个被追踪为 UNC6780 的组织发起的协调行动中看到了这一现实。他们入侵了 NPM 和 PyPI 等主要注册表中的 160 多个软件包。这些并非默默无闻的脚本；名单中包括与 Mistral AI 相关的包以及广泛使用的 React 工具。开发者运行简单的安装命令那一刻，感染就扎下了根。发生这种情况是因为现代包管理器不仅仅是下载文件，它们还会执行脚本来进行设置。当传统扫描器提醒你某个文件看起来很可疑时，恶意代码已经向其命令与控制服务器发出了信号。

Perplexity 最近开源了一个名为 Bumblebee 的工具，旨在打破这一循环。这是一个因需而生的工具——旨在审计开发者的机器，而绝不会触发它所检查的代码。

包管理器中的幽灵

要理解为什么我们需要 Bumblebee，我们必须从当今开发者工作的架构层面来看。当你运行 npm install 甚至像 pip list 这样的诊断工具时，包管理器通常不仅仅是在读取文本文件。它正在与环境进行交互。恶意行为者通过“安装前”（pre-install）和“安装后”（post-install）脚本来利用这一点。这些是自动运行以配置库的代码片段。

在 5 月 11 日的攻击中，恶意软件并没有等待开发者将库导入项目并运行应用程序。它在软件包接触磁盘的那一刻就启动了。如果安全扫描器使用底层的包管理器来清点系统上的内容，它就有可能在无意中执行这些脚本。主动地讲，如果你的防御机制依赖于攻击者已经入侵的同一个子系统，那么你不仅是脆弱的——你还是自己被入侵的帮凶。

Bumblebee 绕过了整个执行层。它不是询问包管理器安装了什么，而是充当法医读取器。它直接解析原始元数据文件——package-lock.json、poetry.lock 以及浏览器扩展的清单文件。它阅读成分标签，而不是品尝汤的味道。通过将这些文件视为静态数据而非可执行指令，Bumblebee 确保了即使软件包具有极大的恶意，它在扫描期间也会保持休眠状态。

新的攻击面：模型上下文协议 (MCP)

Bumblebee 最具前瞻性的功能也许是它扫描 MCP 配置文件（Model Context Protocol）的能力。对于我们这些追踪 AI 与安全交集的人来说，模型上下文协议是新的前沿。这些连接器允许你的 AI 助手——无论是 Claude、Cursor 还是自定义智能体——触及你的电子邮件、私有 GitHub 仓库和本地数据库。

从最终用户的角度来看，MCP 就像魔法。它将聊天机器人变成了强大的生产力引擎。但从安全角度来看，MCP 配置文件是一个高价值目标。如果攻击者设法将恶意连接器潜入你的本地配置，他们基本上就在每个内部门口安插了一个被贿赂后视而不见的 VIP 俱乐部保镖。你的 AI 助手可能会被指示泄露敏感凭据或在后台执行 shell 命令，而你甚至没有意识到上下文已被污染。

Bumblebee 是我遇到的第一个将这些 AI 连接器视为关键安全表面的开源工具。它对 AI 工具配置的审查程度与系统二进制文件或浏览器扩展相同。随着 AI 智能体变得越来越普遍，我们的扫描工具必须进化，以理解这些进入我们数据完整性的新“钩子”。

Bumblebee 的幕后运作方式

当我第一次查看 GitHub 上的仓库时，我被这个工具的简洁性所震撼。它不需要庞大的安装过程，也不需要占用内存的后台守护进程。它是一个单次通过的扫描器，输出干净、结构化的 JSON 或文本报告。

在幕后，该工具依赖于一个威胁目录。在 Perplexity，这个过程由他们自己的 AI 智能体协助完成。当像 UNC6780 这样的新威胁出现时，他们的内部系统会根据已知的恶意哈希和文件模式起草目录条目。人类安全工程师会审核该条目，然后将其推送到整个开发团队。

这种工作流程是主动防御的典型案例。他们不是在等待来自 EDR（端点检测与响应）系统的被动告警，而是在整个组织中搜寻特定的入侵指标（IoC）。由于扫描是非侵入性的且从不修改系统，因此可以频繁运行而不会干扰开发生命周期。

功能	传统扫描器	Perplexity Bumblebee
检测方法	动态 / 基于执行	静态元数据分析
触发恶意软件的风险	高（通过包管理器）	零（只读访问）
AI 感知能力	低 / 不存在	高（支持 MCP 配置）
系统影响	可能较重 / 侵入性	轻量级 / 非修改性
开源	视情况而定	是 (Apache 2.0)

现代开发者应有的健康偏执

作为一名白帽黑客，我保持着一种大多数人觉得精疲力竭的健康偏执。我不信任浏览器扩展。我会验证下载的每个二进制文件的哈希值。我通过 PGP 和 Signal 与最敏感的消息源沟通，因为我假设网络边界是一道过时的护城河。

但即使是对我这样的人来说，现代 JavaScript 或 Python 项目中庞大的依赖项数量也让手动审计变得不可能。我们正在成千上万块不是我们自己烧制的砖块上建造数字大教堂。因此，我们需要能够在不导致建筑倒塌的情况下审计这些砖块的工具。

Bumblebee 为开发者环境中的“影子 IT”提供了急需的可见性。这不仅仅关乎你编写的代码；还关乎 VS Code 中的插件、Brave 或 Firefox 浏览器中的扩展，以及 AI 工具中隐藏的连接器。这些是现代攻击者隐藏的隐秘角落，而这正是 Bumblebee 所照亮的地方。

实施弹性防御

为了向前迈进，我建议在团队处理本地机器安全的方式上进行特定的转变。撇开补丁管理不谈，你必须假设开发者的机器是网络内横向移动的主要目标。

首先将 Bumblebee 纳入你的定期安全审计中。它基于 Apache 2.0 许可证发布，这意味着你可以对其进行分叉并构建自己的内部威胁目录。如果你还没有监控团队的 MCP 配置，请从今天开始。通过 AI 工具进行未经授权的数据访问风险不再是一个理论练习；它是一个任务关键型的漏洞。

就数据完整性而言，最危险的威胁是你因为害怕看而没有看到的威胁。Bumblebee 消除这种恐惧，它提供了一种窥视系统黑暗角落的方法，而不会意外打开灯并惊醒怪物。

给 IT 领导者和开发者的关键启示

静态优于动态： 在审计软件包注册表时，避免调用 npm、pip 或 cargo 的工具。使用静态元数据分析来防止恶意脚本的意外执行。
保护 AI 上下文： 审计你的模型上下文协议 (MCP) 和 AI 工具配置。将它们视为特权访问文件。
清点你的扩展程序： 浏览器和 IDE 扩展是供应链攻击的高杠杆目标。定期运行扫描以确保没有未经授权的插件被侧载。
持续搜寻： 不要等待入侵发生。使用开源工具，根据最新的威胁情报报告主动扫描已知的入侵指标 (IoC)。

来源：

NIST Special Publication 800-161: Cybersecurity Supply Chain Risk Management Practices.
MITRE ATT&CK Framework: Technique T1195 (Supply Chain Compromise).
Perplexity Engineering: "Bumblebee: An Open-Source Supply Chain Auditor."
Google Threat Analysis Group (TAG) Report on UNC6780 Campaigns (2024-2026).

免责声明：本文仅供参考和教育目的。它不能替代专业的网络安全审计，用户在运行开源软件时应行使自己的尽职调查。