Приватность

Внутри проекта по обучению ИИ, превращающего каждый клик мыши в корпоративную собственность

Инструмент MCI от Meta для обучения ИИ отслеживает клики сотрудников, вызывая масштабный конфликт в сфере конфиденциальности между корпоративными целями США и правилами GDPR ЕС.
Внутри проекта по обучению ИИ, превращающего каждый клик мыши в корпоративную собственность

Несколько месяцев назад сотрудники Meta в США получили уведомление о новом внутреннем проекте под названием Model Capability Initiative, или MCI. На первый взгляд это звучало как стандартное техническое обновление: инструмент, разработанный, чтобы помочь компании создавать более совершенных ИИ-агентов. Но когда программное обеспечение начало работать в фоновом режиме на тысячах корпоративных ноутбуков, реальность проекта стала меньше походить на обновление и больше — на цифровую облаву.

Цель Meta амбициозна. Они хотят обучить модели ИИ действовать как автономные агенты — программное обеспечение, которое может перемещаться по сложным интерфейсам, заполнять формы и управлять рабочими процессами точно так же, как это делает человек. Для этого им нужны данные. И не просто любые данные, а детализированные, ежесекундные движения профессиональных работников интеллектуального труда. Каждый клик мыши, каждая прокрутка выпадающего меню и каждый переход между приложениями собираются в качестве обучающего материала для следующего поколения искусственного интеллекта компании.

Однако то, что начиналось как инициатива в США, быстро превратилось в регуляторное минное поле по другую сторону Атлантики. Недавно всплыли внутренние документы, свидетельствующие о том, что этот инструмент фиксирует не только клики; он «пылесосит» взаимодействия европейских коллег, которые никогда не подписывались на этот эксперимент. Эта трансграничная утечка данных создает почву для серьезного юридического противостояния с регуляторами Европейского союза в области конфиденциальности.

Цифровая лаборатория: как работает MCI

Чтобы понять причины правовых трений, мы должны сначала рассмотреть технический охват инструмента. MCI — это не просто программа для записи экрана. Это наблюдатель, который находится поверх более чем 200 различных приложений и веб-сайтов, используемых персоналом Meta. Согласно внутренним отчетам, инструмент отслеживает «пути» пользователя — то, как он переходит от тикета в Jira к среде кодирования, а затем к приложению для обмена сообщениями, такому как Slack или WhatsApp.

Представьте свой цифровой след как дорожку из хлебных крошек. Обычно эти крошки разбросаны и со временем исчезают. В рамках MCI Meta фактически следует за пекарем, записывая точный вес каждой крошки, угол, под которым она упала, и время, которое потребовалось, чтобы ее уронить. Это создает высокоточную карту человеческого поведения, которую можно использовать для воспроизведения этого поведения с помощью ИИ.

Любопытно, что внедрение инструмента было далеко не незаметным. Некоторые сотрудники сообщили, что поглощение данных было настолько интенсивным, что лимиты их домашнего интернета исчерпывались за считанные дни. Еще более тревожными стали результаты внутреннего анализа, проведенного сотрудником Meta, которые показали, что MCI использовал защитное программное обеспечение для доступа к содержимому буфера обмена (тексту, который вы копируете и вставляете) и даже к незашифрованным логам активности сотрудников. По сути, инструмент превращал рабочее место в массивную лабораторию в реальном времени, где сотрудники были подопытными экземплярами.

Курс на столкновение с GDPR

В то время как трудовое законодательство в Соединенных Штатах обычно предоставляет работодателям широкие возможности для мониторинга персонала на устройствах, выданных компанией, Европейский союз работает в рамках гораздо более строгой структуры: Общего регламента по защите данных (GDPR). В тот момент, когда американский инструмент Meta фиксирует сообщение или документ, которыми поделился коллега в Дублине, Париже или Берлине, вступает в силу юрисдикция GDPR.

С точки зрения комплаенса, Meta должна преодолеть три основных препятствия, и в настоящее время кажется, что она спотыкается на каждом из них.

1. Тест на ограничение целей
В европейском праве существует принцип, называемый «Ограничение целей» (Purpose Limitation). Это означает, что если вы собираете данные по одной причине — скажем, для облегчения рабочего общения — вы не можете внезапно решить использовать их для совершенно другой цели, например, для обучения коммерческой модели ИИ, без нового законного основания. Использование чата между двумя коллегами о проекте для наполнения обучающего набора ИИ является, в глазах многих регуляторов, фундаментальным нарушением этого правила.

2. Отсутствие детализированного согласия
Хотя Meta утверждает, что данные «отделены» от идентифицирующей информации, GDPR скептически относится к таким заявлениям. Если данные могут быть отслежены до конкретного лица через его уникальные паттерны поведения или специфическое содержание сообщений, они остаются персональными данными. Для европейских сотрудников согласие должно быть добровольным, конкретным и информированным. Косвенный захват их данных из-за того, что они случайно отправили электронное письмо коллеге из США, не соответствует этому порогу.

3. Пропорциональность и вмешательство
GDPR требует, чтобы обработка данных была пропорциональной. Действительно ли необходимо отслеживать каждое движение мыши, чтобы создать ИИ-агента? Или существует менее инвазивный способ достижения этой цели? В регуляторном контексте «всегда включенный» характер MCI, фиксирующий клики в сотнях приложений, часто рассматривается как непропорциональное вмешательство в частную жизнь работников.

Миф об анонимизированном клике

Meta отвергла эти опасения, заявив, что инструмент сфокусирован на том, как люди используют компьютеры, а не на содержании того, что они делают. Они утверждают, что, отделяя данные от конкретных имен, они защищают конфиденциальность. Однако в мире высокоскоростных данных истинная анонимизация часто является миражом.

Эксперты по конфиденциальности часто называют это проблемой «цифровой программы защиты свидетелей». Вы можете изменить имя и лицо, но если объект все еще ходит так же, посещает те же места и говорит с той же интонацией, его легко повторно идентифицировать. Для работника интеллектуального труда его «интонация» — это то, как он перемещается по коду, специфический жаргон, который он использует в сообщениях, и его распорядок дня. Захватывая буфер обмена и URL-адреса, Meta поглощает высокоспецифичные идентификаторы, которые делают «отделение» очень слабым щитом против юридического контроля.

Более того, тот факт, что инструмент фиксирует прямые сообщения и электронные письма от отправителей, не являющихся резидентами США, создает экстерриториальный охват. Если французский сотрудник отправляет личное сообщение коллеге из США, и это сообщение попадает в хранилище для обучения ИИ Meta в США, Meta фактически экспортирует европейские персональные данные без необходимых гарантий или раскрытия информации, требуемых ЕС.

«Фабрика по извлечению данных сотрудников»

Возможно, самым поразительным аспектом этой истории является внутренняя реакция. Некоторые сотрудники Meta назвали компанию «Фабрикой по извлечению данных сотрудников». В том, что вас просят предоставить те самые данные, которые в конечном итоге будут использованы для автоматизации ваших собственных рабочих функций, кроется ощутимая ирония.

В прошлом мониторинг рабочего места в основном касался безопасности или производительности — обеспечения того, чтобы сотрудники не допускали утечки коммерческой тайны или не бездельничали. MCI представляет собой сдвиг в сторону «генеративного мониторинга». Здесь цель не в том, чтобы следить за работником; цель в том, чтобы собрать опыт работника и превратить его в корпоративный актив. Это создает нестабильную среду для персонала, который чувствует, что их уникальная профессиональная интуиция превращается в товар клик за кликом.

Будущее ИИ на рабочем месте

По мере того как Ирландская комиссия по защите данных (DPC) начинает изучать эти практики, этот случай, вероятно, станет ориентиром для того, как ИИ обучается в корпоративном мире. Он подчеркивает растущую напряженность: компаниям нужны массивные наборы данных, чтобы оставаться конкурентоспособными в гонке ИИ, но самые ценные данные часто являются самыми личными.

Для компаний, стремящихся избежать нынешнего затруднительного положения Meta, уроки ясны. Прозрачность — это не просто галочка в списке; это фундамент. Если вы внедряете инструменты, отслеживающие поведение, эти инструменты должны создаваться с учетом принципа Privacy by Design (конфиденциальность по определению). Это означает интеграцию минимизации данных с самого начала — сбор только того, что строго необходимо, и обеспечение того, чтобы данные из защищенных регионов (таких как ЕС) отфильтровывались до того, как они попадут на сервер обучения.

Ключевые выводы для цифровых прав и комплаенса:

  • Аудит взаимосвязей: Компании должны понимать, что данные, собранные в одной юрисдикции, могут легко затрагивать субъектов в другой. Если ваша команда в США использует инструмент отслеживания, вы должны оценить, фиксирует ли он данные из ваших глобальных офисов.
  • Определение целей на раннем этапе: Четко сформулируйте, зачем собираются данные. Если вы переходите от «мониторинга безопасности» к «обучению ИИ», вам нужна новая правовая база и, скорее всего, новое согласие от затронутых лиц.
  • Проверка заявлений об анонимизации: Не верьте на слово поставщику или ИТ-отделу в том, что данные «анонимны». Проводите тесты на повторную идентификацию, чтобы увидеть, могут ли паттерны поведения пользователя раскрыть его личность.
  • Соблюдение права на забвение: Если сотрудник увольняется или возражает против использования его данных для обучения ИИ, можете ли вы на самом деле удалить его «клики» из модели? Если ответ «нет», вы можете нарушать статью 17 GDPR.

По мере того как мы все глубже входим в эру ИИ, граница между нашей работой и нашими данными будет продолжать стираться. Защита этой границы больше не является задачей только юридического отдела; это фундаментальное требование для поддержания доверия на современном рабочем месте.

Источники:

  • General Data Protection Regulation (GDPR), Article 5 (Principles relating to processing of personal data).
  • General Data Protection Regulation (GDPR), Article 6 (Lawfulness of processing).
  • General Data Protection Regulation (GDPR), Article 17 (Right to erasure).
  • CJEU Case C-311/18 (Schrems II) regarding international data transfers.
  • European Data Protection Board (EDPB) Guidelines on the processing of personal data for AI training.

Отказ от ответственности: Данная статья представлена исключительно в информационных и журналистских целях. Она не является официальной юридической консультацией или юридическим заключением. Для получения конкретных рекомендаций по соблюдению нормативных требований в отношении мониторинга рабочих мест или внедрения ИИ, пожалуйста, проконсультируйтесь с квалифицированным юристом.

bg
bg
bg

До встречи на другой стороне.

Наше решение для электронной почты и облачного хранения данных со сквозным шифрованием обеспечивает наиболее мощные средства безопасного обмена данными, гарантируя их сохранность и конфиденциальность.

/ Создать бесплатный аккаунт