ИИ с ручным приводом

Прорывы в области машинного обучения создают опасную иллюзию, будто люди в процессе не участвуют. На деле каждый алгоритм требует хорошего набора данных — правильно размеченного, структурированного и сбалансированного. К сожалению, предоставить такие наборы в состоянии только люди — они как бы продают собственные суждения о тех или иных вещах.

Поставщики больших данных разной степени структурированности в 2018 году выручат $65 млрд, говорится в отчете The Big Data Market: 2018–2030. К концу 2021 года рынок вырастет до $96 млрд. Пресс-релиз не отмечает этого, но одними из бенефициаров станут развивающиеся страны, где потребность крупных компаний в разметке наборов данных создаст десятки тысяч рабочих мест.

Один из центров разметки данных наряду с Индией и Филиппинами — Кения, где тысячи низкооплачиваемых работников ежедневно объясняют компьютеру, где на фотографии находятся витрины, дороги, светофоры и автомобили.

Тем же изредка занимаются миллионы пользователей Сети, когда разгадывают капчу от Google, задаваясь важнейшим вопросом современности — является ли ножка дорожного знака дорожным знаком.

Предполагается, что это самый простой способ дать прожорливым алгоритмам беспилотных автомобилей достаточно данных (другой способ использует Tesla, собирая данные поездок со всего флота собственных автомобилей).

Центры сбора и обработки информации есть у каждой уважающей себя крупной технокомпании. Amazon для классификации товаров создал систему раздачи мелких задач Mechanical Turk. Это дало возможность не только структурировать данные для машинного обучения, но и избежать применения ИИ. Один французский стартап за небольшую сумму (около €10 в месяц) оцифровывает ваши чеки, внося их в базу данных. Никакого искусственного интеллекта там нет, все данные вносят рабочие Mechanical Turk за считаные евроценты.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: