Хотя в популярных дискуссиях часто предполагается, что самым большим препятствием для искусственного интеллекта является нехватка качественной человеческой литературы или сложной логики кодирования, реальность гораздо более детализирована и, честно говоря, гораздо ближе к сути. Индустрия достигла точки, когда прочтения всех книг в мире уже недостаточно. Чтобы перейти на следующий уровень, ИИ нужно научиться двигаться. Ему нужно знать, как мы кликаем, как мы колеблемся и как мы ориентируемся в лабиринтах меню современного программного обеспечения.
В недавнем отчете, впервые опубликованном агентством Reuters, компания Meta подтвердила, что теперь использует свой собственный персонал в качестве живой лаборатории. Записывая нажатия клавиш и движения мыши своих сотрудников, гигант социальных сетей пытается преодолеть разрыв между ИИ, который может написать стихотворение, и ИИ, который действительно может использовать компьютер от вашего имени. Глядя на общую картину, можно сказать, что это не просто причудливый внутренний эксперимент; это фундаментальный сдвиг в том, как добывается «цифровая нефть» нашей эпохи.
В последние несколько лет революция ИИ подпитывалась текстом. Большие языковые модели (LLM), такие как GPT-4 или собственная Llama от Meta, обучались на коллективном контенте интернета — блогах, ветках Reddit, оцифрованных книгах и открытом исходном коде. Это создало поколение ИИ, которое невероятно красноречиво, но, по сути, парализовано. Он может подсказать вам, как забронировать авиабилет, но не может открыть браузер, перейти на сайт для путешествий, выбрать даты и нажать кнопку «купить» за вас.
Чтобы создать то, что в индустрии называют «агентным» ИИ — инструменты, которые действуют как неутомимый стажер, способный выполнять многоэтапные цифровые задачи — разработчикам нужен другой тип данных. Им нужна дорожная карта человеческих намерений, выраженная через периферийные устройства. По сути, Meta ищет «соединительную ткань» цифровой работы. Когда сотрудник нажимает на выпадающее меню, делает паузу на две секунды, а затем выбирает конкретный подпункт, он дает урок логики, который текст сам по себе передать не может.
За этим жаргоном скрывается обучение машин физическому ритму программного обеспечения. В то время как человек видит кнопку «Отправить», компьютер видит координату на экране. Запечатлевая миллионы таких взаимодействий, Meta надеется создать модели, которые понимают системную связь между целью пользователя и кликами, необходимыми для ее достижения.
Подход Meta включает в себя новый внутренний инструмент, предназначенный для захвата ввода в определенных приложениях. Согласно заявлению компании, это включает в себя все: от движений мыши и нажатий кнопок до того, как сотрудники перемещаются по вложенным меню. С точки зрения технологической архитектуры, это масштабный проект телеметрии. Представьте, что каждое движение курсора преобразуется в точку данных, которая помогает нейронной сети понять, что определенный значок означает «редактировать», а другой — «удалить».
С практической точки зрения, эти данные имеют невероятно высокое разрешение. Речь идет не только о конечном действии, но и о пути, пройденном для его достижения. Для обычного пользователя это может показаться излишним, но для машины «неправильные» действия так же поучительны, как и «правильные». Если сотрудник случайно нажимает не ту вкладку и сразу же исправляет это, ИИ узнает об общих человеческих ошибках и о том, как их избежать.
Meta поспешила отметить, что существуют меры предосторожности для защиты конфиденциального контента. Они утверждают, что данные не используются для оценки производительности или каких-либо иных целей, кроме обучения. Однако грань между «обучающими данными» и «слежкой» становится все более прозрачной. Когда компания записывает каждое механическое взаимодействие сотрудника со своей рабочей станцией, традиционные границы приватности на рабочем месте начинают стираться.
Этот шаг Meta является частью общей тенденции: отчаянной охоты за новыми источниками данных. Недавно появились сообщения о том, что корпоративные коммуникации стартапов-«зомби» и прекративших существование компаний — например, многолетние архивы Slack и тикеты Jira — собираются и продаются разработчикам ИИ. Иными словами, ваша старая офисная болтовня и жалобы на управление проектами перерабатываются в «мозги» цифровых помощников завтрашнего дня.
| Тип данных | Традиционный источник | Новый источник (Новые данные) |
|---|---|---|
| Знания | Википедия, книги, новости | Внутренние каналы Slack, тикеты Jira |
| Логика | Научные работы, код | Логи нажатий клавиш сотрудников, кликстримы |
| Коммуникация | Публичные форумы, соцсети | Частная корпоративная почта, архивные чаты |
| Взаимодействие | Отзывы пользователей, обзоры приложений | Телеметрия мыши в реальном времени, паттерны наведения |
Этот сдвиг подчеркивает волатильную напряженность в индустрии. По мере того как запасы общедоступного высококачественного текста иссякают, технологические гиганты обращаются внутрь себя или ищут частные хранилища. Результатом является надежная, но потенциально навязчивая новая методология. Если компания не может найти достаточно данных в открытом интернете, она просто создаст их, наблюдая за своими сотрудниками в режиме реального времени.
Хотя эта история сосредоточена на внутреннем персонале Meta, последствия для широкой общественности вполне ощутимы. Мы, вероятно, вступаем в завершающую стадию эры «freemium» данных. В настоящее время Meta использует своих сотрудников, потому что это юридически проще и обеспечивает контролируемую среду. Однако, как только эти модели будут усовершенствованы, следующим логическим шагом станет внедрение этих функций отслеживания для более широкой аудитории — возможно, под предлогом «улучшения пользовательского опыта» или «персонализированной помощи ИИ».
Для обычного пользователя суть в том, что ваше цифровое поведение теперь ценнее вашего цифрового контента. Речь больше не идет только о том, что вы публикуете в Instagram; речь о том, как вы используете приложение. Как долго вы задерживаете курсор на конкретном объявлении? Какую последовательность кнопок вы нажимаете, чтобы сообщить об ошибке? Эта информация становится фундаментом для следующего поколения интуитивно понятного программного обеспечения.
Глядя на рыночную сторону, это также сигнализирует о новой эре конкуренции. Компании с большим штатом сотрудников и проприетарными экосистемами программного обеспечения — такие как Microsoft, Google и Meta — имеют огромное преимущество. У них есть встроенная, постоянная аудитория «тренеров», которым платят за генерацию тех самых данных, которые в конечном итоге могут автоматизировать часть их собственной работы. Это циклический процесс, который одновременно впечатляет и немного тревожит.
Любопытно, что этот шаг предполагает, что будущее ИИ заключается не только в том, чтобы быть «умным», но и в том, чтобы быть «полезным». Мы уходим от ИИ как поисковой системы к ИИ как цифровому продолжению человека. Чтобы достичь этой цели, компании готовы раздвигать границы приватности и сбора данных.
В конечном счете, демократизация технологий обычно сопровождается скрытым налогом. В начале 2000-х этим налогом была наша личная информация для таргетированной рекламы. В 2020-х налогом, похоже, становятся наши механические привычки. Наблюдая за сотрудниками Meta сегодня, эти модели изучают нюансы человеческих намерений, чтобы предвосхищать наши потребности завтра.
Заглядывая вперед, стоит задуматься о том, как это меняет наши отношения с инструментами. Если каждый клик — это урок для машины, наши компьютеры больше не просто статичные объекты; они — ученики. Это осознание должно побудить нас внимательнее следить за собственными цифровыми привычками. Используем ли мы наши устройства или непреднамеренно обучаем тех, кто нас заменит?
С точки зрения потребителя, лучший подход — это устойчивый скептицизм. Когда эти «агентные» функции начнут появляться в ваших любимых приложениях, помните, что бесшовный, интуитивно понятный опыт, который они обеспечивают, скорее всего, был построен на основе тысяч отслеженных нажатий клавиш. Прозрачность этих практик работы с данными останется ключевым полем битвы в ближайшие годы, когда мы будем решать, какую именно часть нашего «цифрового выхлопа» мы готовы отдать в обмен на чуть более эффективный вторник.
Источники:



Наше решение для электронной почты и облачного хранения данных со сквозным шифрованием обеспечивает наиболее мощные средства безопасного обмена данными, гарантируя их сохранность и конфиденциальность.
/ Создать бесплатный аккаунт