Meta 正在将员工变成 AI 时代的数字碰撞测试假人

Meta 正在记录员工的按键和鼠标移动以训练 AI 智能体。了解这对职场隐私和 AI 未来的意义。

2026年4月22日

虽然流行的说法往往认为人工智能面临的最大障碍是缺乏高质量的人类文学或复杂的编码逻辑，但现实情况要细微得多，坦率地说，也更触及核心。行业已经发展到了这样一个阶段：读完世界上所有的书已不再足够。为了迈向下一个阶段，AI 需要学习如何“移动”。它需要了解我们如何点击、如何犹豫，以及我们如何操作现代软件中迷宫般的菜单。

根据路透社首先报道的最新进展，Meta 已确认其正在将自己的员工队伍作为一个活生生的实验室。通过记录员工的按键和鼠标移动，这家社交媒体巨头正试图弥合“能写诗的 AI”与“能真正代表你操作电脑的 AI”之间的差距。从大局来看，这不仅仅是一个古怪的内部实验；它是我们这个时代的“数字原油”提取方式的根本性转变。

从“我们说什么”到“我们怎么做”的转变

在过去的几年里，AI 革命一直由文本驱动。像 GPT-4 或 Meta 自家的 Llama 这样的大语言模型（LLM）是在互联网的集体产出——博客、Reddit 帖子、数字化书籍和开源代码——上进行训练的。这创造了一代口才极佳但本质上处于“瘫痪”状态的 AI。它可以告诉你如何订机票，但它无法为你打开浏览器、导航到旅游网站、选择日期并点击“购买”按钮。

为了构建行业所称的“智能体”AI（Agentic AI）——即能够执行多步数字任务的勤奋实习生工具——开发人员需要一种不同的数据。他们需要一张通过外围设备表达的人类意图路线图。本质上，Meta 正在寻找数字工作的“结缔组织”。当一名员工点击下拉菜单，停顿两秒钟，然后选择一个特定的子选项时，他们正在提供一堂文本本身无法传达的逻辑课。

抛开这些术语，这其实是在教机器软件的物理节奏。人类看到的是一个“提交”按钮，而计算机看到的是屏幕上的一个坐标。通过捕捉数以百万计的此类交互，Meta 希望构建出能够理解用户目标与实现该目标所需的点击之间系统性关系的模型。

引擎盖下：数据采集的内部机制

Meta 的方法涉及一种旨在捕获特定应用程序输入的全新内部工具。据该公司称，这包括从鼠标移动和按钮点击到员工操作嵌套菜单的方式等一切内容。从技术架构的角度来看，这是一个大规模的遥测项目。想象一下，光标的每一次抖动都被转换成一个数据点，帮助神经网络理解某个图标代表“编辑”，而另一个代表“删除”。

从实际操作来看，这些数据的分辨率极高。它不仅关乎最终动作，还关乎到达那里的路径。对于普通用户来说，这似乎有些大材小用，但对于机器来说，“错误”的动作与“正确”的动作同样具有教育意义。如果一名员工不小心点错了标签并立即纠正，AI 就能学到常见的人类错误以及如何避免这些错误。

Meta 很快指出，已经采取了保护敏感内容的保障措施。他们声称这些数据不用于绩效评估或除培训以外的任何目的。然而，“培训数据”与“监控”之间的界限正变得越来越模糊。当一家公司记录员工与工作站的每一次机械交互时，职场隐私的传统边界就开始消解。

搜寻数字档案

Meta 的这一举动是整体趋势的一部分：对新数据源的拼命搜寻。最近有报告称，一些“僵尸”初创公司和倒闭公司的企业通信——想想多年的 Slack 存档和 Jira 工单——正在被搜寻并出售给 AI 开发人员。换句话说，你旧日的办公室闲谈和项目管理抱怨正在被回收利用，注入到未来数字助手的“大脑”中。

数据类型	传统来源	新兴来源（“新”数据）
知识	维基百科、书籍、新闻	内部 Slack 频道、Jira 工单
逻辑	研究论文、代码	员工按键日志、点击流
沟通	公共论坛、社交媒体	私人企业邮件、存档聊天记录
交互	用户反馈、应用评论	实时鼠标遥测、悬停模式

这种转变凸显了行业中一种动荡的紧张关系。随着公共、高质量文本供应的枯竭，科技巨头们正转向内部或寻求私人数据孤岛。其结果是一种强大但具有潜在侵入性的新方法论。如果一家公司在开放网络上找不到足够的数据，他们就会通过实时观察自己的员工来直接制造数据。

这对普通消费者意味着什么

虽然这个故事聚焦于 Meta 的内部员工，但对更广泛公众的影响是显而易见的。我们可能正在进入数据“免费增值”时代的最后阶段。目前，Meta 使用自己的员工是因为这在法律上更简单，且能提供一个受控环境。然而，一旦这些模型成熟，下一个逻辑步骤就是将这些追踪功能推广给更广泛的受众——或许是以“改善用户体验”或“个性化 AI 助手”为幌子。

对于普通用户来说，底线是你的数字行为现在比你的数字内容更有价值。这不再仅仅关乎你在 Instagram 上发布了什么，而关乎你如何使用这个应用。你在某个特定广告上悬停了多久？你按下了哪一系列按钮来报告一个错误？这些信息正在成为下一代直观软件的基础层。

从市场端来看，这也预示着一个竞争新时代的到来。拥有庞大员工队伍和专有软件生态系统的公司——如微软、谷歌和 Meta——拥有巨大的优势。他们拥有一群内置的、被动的“培训师”，这些员工在获得报酬的同时，正在生成最终可能使他们自己的部分工作实现自动化的数据。这是一个既令人印象深刻又略显不安的循环过程。

人机交互界面的未来

奇妙的是，这一举动表明 AI 的未来不仅仅是变得“聪明”，而是变得“好用”。我们正在从作为搜索引擎的 AI 转向作为数字肢体的 AI。为了实现这一目标，企业愿意在隐私和数据收集方面突破极限。

归根结底，技术的民主化通常伴随着隐形税。在 21 世纪初，这种税是我们的个人信息，用于定向广告。在 21 世纪 20 年代，这种税似乎是我们的机械习惯。通过观察今天的 Meta 员工，这些模型正在学习人类意图的细微差别，以便它们能够预测我们明天的需求。

展望未来，值得思考的是这如何改变了我们与工具的关系。如果每一次点击都是机器的一课，那么我们的电脑就不再仅仅是静态物体，而是学生。这种认识应该促使我们更密切地观察自己的数字习惯。我们是在使用设备，还是在无意中培训我们的替代者？

从消费者的角度来看，最好的方法是保持坚韧的怀疑态度。当这些“智能体”功能开始出现在你最喜欢的应用中时，请记住，它们提供的无缝、直观体验很可能是建立在成千上万次被追踪的按键之上的。这些数据实践的透明度在未来几年仍将是一个关键战场，因为我们将决定为了换取一个效率稍高一点的周二，我们究竟愿意交出多少“数字废气”。

来源：