· AI· Стартапы

Я неделю записывал себя за домашними делами ради денег. И кто теперь робот?

Я неделю записывал себя за домашними делами ради денег. И кто теперь робот?

Готовка. Стирка. Уборка. Все ваши домашние дела можно превратить в данные для обучения будущих человекоподобных роботов — если вы готовы к последствиям.

Я больше не просто человек. Я — проводник реальности, медиум сообщений. Я держу нож и нарезаю органический огурец, сгорбившись так, чтобы пристёгнутый ко лбу айфон захватил все десять пальцев. Я бросаю кружочки в салатницу и останавливаю запись. Где-то маленький робот стал чуточку умнее.

Так я жил целую неделю в прошлом месяце, собирая данные, не выходя из квартиры, и обучал гуманоидов оттирать посуду, складывать бельё, наливать напитки и выполнять прочую чёрную работу. Если роботы когда-нибудь поселятся с нами и начнут помогать по дому, им нужно развить мелкую моторику. Я выполнял домашние обязанности с гордостью (обычно, убирая футболки, я не вношу вклад в огромные датасеты). И возможности подзаработать я тоже был рад.

Видео от первого лица, снятые камерой, закреплённой на голове или груди, нужны всё больше — по мере того как всё больше компаний пытаются строить роботов и улучшать модели ИИ. Интернет полон видео, которые можно парсить, но сверхспецифичные ролики — например, тысячи крупных планов рук, наливающих воду в стакан, не расплёскивая, — критически важны для тонкой настройки машин на реальные задачи. Такой формат съёмки в индустрии называют эгоцентрическими данными, и спрос на них так высок, что, по оценкам некоторых инвесторов, в ближайшие несколько лет ведущие компании закупят у сторонних поставщиков сотни миллионов часов записей.

«Я хочу, чтобы каждый человек на планете записывал, как он моет посуду, — говорит Ави Патель, 22-летний основатель маркетплейса данных Kled. — Благодаря этому появится робот, который избавит вас от мытья посуды навсегда». Сбор эгоцентрических данных уже набирает обороты в таких странах, как Индия, где самозанятые работники в среднем зарабатывают около 125 долларов в месяц, а такие заказы на видео от первого лица могут приносить сравнимые суммы.

На волне растущего интереса всё больше компаний по сбору данных присматриваются к Штатам. Например, в начале этого года DoorDash запустил отдельное приложение Tasks. Возможно, скоро многие гиг-работники в США начнут поставлять реальность, чтобы сводить концы с концами, — в дополнение к привычной доставке еды комнатной температуры.

К счастью, крепление на голову у меня уже было — осталось от тестирования Tasks от DoorDash. Уже тогда у меня сложилось впечатление, что видео-данные на заказ — это антиутопичное будущее, в котором мы уже живём, но мне захотелось разобраться в растущей индустрии. Tasks в Калифорнии, где я живу, недоступен, поэтому я зарегистрировался на трёх других платформах: Kled, Luel и Waffle Video.

Заработал я сущие гроши. По сути, тренировал роботов почти бесплатно и даже не покрыл часть аренды за квартиру в Сан-Франциско — 2500 долларов в месяц, которые мы делим с партнёром. Но у подработки оказался неожиданный бонус: моя квартира никогда ещё не была такой чистой.

Прорыв Kled случился, когда Патель в начале года выложил видео в X, показав крошечный фрагмент обширного видеоархива компании. Ролик быстро набрал больше 4 миллионов просмотров, и телефон Пателя разрывался от звонков покупателей данных. «Со мной связалась каждая крупная лаборатория, каждый разработчик фундаментальных моделей — все просили данные», — рассказывает он.

Данные для тренировки роботов — лишь часть того, что Kled собирает у 300 с лишним тысяч пользователей. В основном стартап платит людям за загрузку всей их галереи — как материал для обучения ИИ. Патель заметил, что ранние последователи активно включились в подработку в Малайзии, а для продвижения видео-заданий на платформе есть раздел «специальные задачи». Пользователи выбирают из списка, какое дело хотят снять, и записывают контент прямо в приложении. Почасовая ставка не указана; каждое задание помечено как низко-, средне- или высокооплачиваемое без конкретного диапазона. (В компании обещают, что примерно через месяц в обновлении появятся ставки для многих, но не для всех задач.)

На Kled я выбрал «вынос мусора» как свою первую задачу по обучению роботов. Она отмечена как «среднеоплачиваемая». Начать было легко — приложение подсказывает, что снимать:

Описание: Заснимите, как вы выносите домашний мусор, чтобы помочь обучению роботов реальным действиям.

Требования к заданию: Снимите непрерывное видео в приложении, показав: извлечение мешка, завязывание, установку нового пакета и утилизацию мусора. Держите камеру неподвижно и избегайте съёмки лиц.

Я нацепил ремешок со смартфоном на голову и заснял, как завязываю кухонный пакет и провожаю его до мусорного бака в переулке за домом. Я немного нервничал из-за возможной встречи с соседями и необходимости объяснять, чем занят. Запись автоматически отключилась примерно через две минуты, не дав мне вставить новый пакет, — приложение сообщило, что лимит исчерпан.

Патель говорит, что важнейшей задачей для Kled в последний год стало выявление мошенничества. Люди часто пытаются загружать скачанные из интернета ролики или просто чёрные квадраты. Остро стоит и вопрос приватности: «Нужно убедиться, что все данные анонимизированы, и удалить личную информацию, иначе лаборатории у вас ничего не купят, — говорит он. — То же касается любых плохих загрузок. Всё это нужно отфильтровывать». По словам Пателя, Kled недавно ушёл из Нигерии, потому что около 95 процентов загружаемых пользователями материалов были либо бесполезными дубликатами, либо подделками.

Я выполнил девять задач на Kled, записывая их урывками во время домашних хлопот на выходных, и только потом понял, что для получения любой выплаты приложение требует загрузить 100 медиафайлов. Слегка раздражённый, я решил залить больше 90 фотографий из прошлогоднего отпуска, чтобы достичь порога. Поскольку на обработку данных у Kled уходит несколько дней, я переключился на другие платформы, собирающие данные для роботов, в ожидании денег.

Luel — платформа, которая платит пользователям со всего мира за данные, — довольно похожа на Kled. У обеих молодые основатели: Уильяму Намгьялу из Luel было всего 18, когда его компания попала в Y Combinator в начале этого года. Обе собирают самые разные данные, помимо самостоятельно снятых видео. «Люди готовы записывать простые ролики, где произносят фразы на родном языке, — говорит Намгьял об интересе Luel к сохранению языков. — Почему бы не расшириться до эгоцентрических видео и документов?» Теперь приложение также платит пользователям за запись экрана их компьютеров и загрузку фотографий чеков.

В моих тестах Luel показался чуть более корявым в дизайне, чем Kled. Платформа не разделяет задания по типу дел; там просто есть объявление «Запишите любую практическую деятельность от первого лица», за которое предлагают 6.60 за час видео (Для сравнения: федеральная минимальная зарплата в США — 7.25 в час.) Требования Luel сверхконкретны: только крепление на голове, широкоугольная камера в горизонтальном положении, разрешение минимум 1080p, руки в кадре 95 процентов времени.

Я снова пристегнул телефон ко лбу и взялся за работу на кухне — скрёб тарелки, загружал посудомойку. Отправил на сайт Luel пятиминутное видео; через день его отклонили. «Ваши руки не были видны в достаточном количестве кадров», — гласило объяснение.

Сначала я не получил ничего. Через несколько дней Luel прислал письмо, отменяющее первоначальное решение. В сообщении говорилось, что, хотя «видимость рук составила 83% по выбранным кадрам», я удовлетворил остальным требованиям объявления, и Luel всё же выплатит деньги. Я стал богаче на 55 центов.

Waffle Video определённо стал моим любимчиком из трёх платформ. В отличие от Kled и Luel, он фокусируется исключительно на видео-данных для обучения, а «миссии», которые я видел в приложении — завязывание шнурков и наливание воды, — оплачивались по $25 за час видео. Вот это другой разговор.

Каждый датасет, создаваемый пользователями, формируется под конкретного заказчика, поэтому «миссии» Waffle доступны лишь ограниченное время. Приложение также предлагает гиг-работникам периодический доход — по сути, отчисления за перепродажу — если их видео перелицензируют другим компаниям. «Я думаю, есть потрясающая возможность создать симбиотические отношения между людьми, которые отдают этим моделям свою жизнь, взгляд, творчество, данные, — говорит Джошуа Месник, 34-летний сооснователь и операционный директор Waffle. — Чтобы это были взаимовыгодные, а не односторонние отношения». Месник основал стартап вместе с гендиректором Джоуи Ньюфилдом (ему 33) в 2024 году.

Waffle также даёт самые подробные инструкции о том, что приложение приемлет, а что нет. Перед загрузкой пользователи видят все возможные причины отклонения — от размытого качества записи до наличия защищённого авторским правом аудио. Наряду с примерным видео задания содержат детальные указания по съёмке каждого действия, например, вот фрагмент для «наливания жидкостей»:

  • Процесс наливания должен быть виден.
  • Жидкость должна быть чётко показана.
  • Обе ёмкости должны быть в кадре.
  • Принимающая ёмкость должна быть из прозрачного стекла или пластика, чтобы видеть изменение уровня жидкости.

После того как стартапы собирают видео от первого лица у людей вроде меня, следующая задача — превратить горы данных в пригодные для продажи форматы. Waffle прогоняет каждое пользовательское видео через систему MAPLE — Media Asset Processing and Labeling Engine. «Всё проверяется на авторские права. Всё размечается, аннотируется и структурируется, чтобы сразу идти в обучение ИИ», — говорит Месник. Компаниям не так интересна сырая неразмеченная информация; им нужны аккуратно упакованные видео с высокодетализированными метаданными, прикреплёнными к каждому файлу.

С Waffle я по-настоящему вошёл во вкус видеоданных. Ставка была достаточно высокой, чтобы заинтересовать, и я весело порхал по дому, как продюсер реалити-шоу, стремясь снять как можно больше контента. Завязывал шнурки снова и снова? Готово! Тёр посуду до блеска? Готово! Переливал диетическую колу туда-сюда между стаканами, пока она не выдыхалась? Готово!

Мой смартфон был практически приклеен ко лбу весь вечер, пока я выполнял ИИ-задания на Waffle. Каждый ролик длился около 20 секунд — так требовало приложение для этой «миссии». За несколько дней работы я выдал 125 одобренных загрузок, заработав 20 долларов.

Намгьял, основатель Luel, беспокоится о будущем рынка труда, хотя и руководит компанией, тренирующей роботов, которые однажды могут заменить людей. «Мой самый большой страх — что безработица вырастет чрезвычайно, больше, чем сейчас», — говорит он. Намгьял рассматривает Luel и гиг-экономику в целом скорее как быстрый способ для людей заработать, а не как панацею от трудовых трендов. «Часть нашей цели — тоже создавать рабочие места, но это, очевидно, сложно».

Патель с гордостью рассказывает, что один из лидеров по заработку на Kled — водитель грузовика, зарабатывающий 8000 долларов в месяц, снимая на видеорегистратор и присылая фото дорожных ям. Но этот случай — явное исключение. Большинство тех, кто предоставляет данные для обучения ИИ-моделей, таких денег не получают, хотя аппетит к видео-данным кажется почти безграничным. Эгоцентрическая видео-подработка — это всё же гиг-работа, с меньшей защитой и общей нестабильностью.

Специализация, возможно, единственный способ заработать на этом в США значимые суммы. Записать нарезку огурцов может любой, но только опытный суши-шеф покажет лучший способ нарезки сашими из лосося. «Я уверен, что наступит мир, где повара полностью исчезнут, — говорит Патель. — Но на самом деле они не исчезнут, потому что будут дома снимать видео, создавая уникальные рецепты для обучения роботов. И получать за это деньги».

Наконец пришло время и мне получить деньги. Когда Kled закончил обработку моих девяти эгоцентрических видео и 97 фотографий из отпуска, я многого не ждал, но выплата всё равно меня ошеломила: 1 доллар.

Преодолев первый укол разочарования, я ощутил укол гордости. Возможно, я помогаю строить лучшее будущее — такое, где мои внуки будут блаженно не ведать о бытовых привычках, которые мне пришлось выработать. Однако гордость быстро растворилась, стоило задуматься о том, что я, возможно, тренирую тех самых гуманоидов, которые заменят людей на работах далеко за пределами нудных домашних дел.

Мой общий заработок за неделю составил $21.55. Для меня этот опыт был необременительной подработкой, способом оплатить несколько лишних баночек диетической колы, занимаясь делами по дому. Но для работников по всему миру, и всё чаще в США, такая ИИ-гиг-работа может быть принята под экономическим давлением и стать средством к существованию: научи робота готовить сегодня, чтобы завтра было что поесть.

[Источник: wired]