Сюжеты · Общество

С чего начинаются роботы: пять главных российских проектов в сфере ИИ

<strong>NtechLab</strong>
Продукт: системы распознавания лиц. Сколько стоит:не раскрывается; по данным московской мэрии, программа распознавания лиц для пилотного проекта в столичном метрополитене стоила 3 млн рублей.
Стартап NtechLab основали три инженера в 2015 году. Спустя полгода команда неожиданно для себя выиграла международное соревнование в области автоматического распознавания лиц, обойдя Google и других грандов.
«После соревнования мы поняли, что эта штука работает. Захотелось применить ее на реальных базах в максимально приближенных к реальности условиях. Первым большим шагом для демонстрации нашей технологии стал FindFace (алгоритм, которые позволяет находить людей в соцсетях по фотографиям. —Ред.)», — рассказывает основатель NtechLab Артем Кухаренко. С тех пор точность распознавания выросла в 3–4 раза и составляет 80–99% в зависимости от условий, а штат стартапа вырос до 50 человек.
В следующий раз слава NtechLab прогремела после чемпионата мира по футболу в 2018 году. «Умные» камеры были установлены на «Лужниках» и других стадионах, и за время ЧМ помогли полицейским поймать более 100 нарушителей, говорят в компании. Основной заказчик — госкорпорация «Ростех». NtechLab также предлагают продукт для ритейлеров, который позволяет определять магазинных воров и строить «умную демографию» для настройки бизнес-процессов.
Технология работает следующим образом. Камера транслирует в систему видеопоток, алгоритм разбивает его по кадрам и фиксирует на каждом из них человеческие лица. Затем заранее обученная на открытых данных нейросеть строит вектор признаков, который позволяет идентифицировать человека. Все это происходит за считаные секунды.
«Хороший вектор признаков должен быть инвариантен к внешним изменениям: разные углы обзора, освещенность, всевозможные прикрытия в виде очков, часов или бороды — все это не должно влиять на качество распознавания», — говорит Кухаренко.
Дальше полученный вектор сопоставляется с базой признаков, которые заранее загружены в систему. Если обнаружено совпадение, то алгоритм присылает уведомление.
Нейросети умеют идентифицировать человека не только по лицу, но и по силуэту. Это нужно в ситуациях плохого обзора — например, когда человек прошел мимо камеры спиной. Но точность распознавания по лицам на порядки выше: в лице содержится намного больше информации. Зато в комплекте с основной системой такие алгоритмы позволяют улучшить результат.
В NtechLab «Новой» сообщили, что московские власти планируют открытый конкурс на 100 тысяч «умных камер» (всего столице 160 тысяч CCTV), в котором компания собирается принять участие. Также есть проекты по переносу московского опыта на другие российские города. Самая масштабная сеть городского видеонаблюдения сейчас развернута в Китае, где насчитывается 176 млн «умных» камер с точностью идентификации около 90%, а в течение нескольких лет их число планируется утроить.
Кухаренко не видит этических проблем в установке «умных камер» в правоохранительных целях.
«У людей возникают большие опасения, потому что они не до конца понимают, как работает эта система, и берут в качестве примера новости из Китая. У наших российских проектов смысл следующий: есть база преступников, которые находятся в розыске, камеры в автоматическом режиме проверяют проходящих мимо людей и сравнивают со списком. Если совпадения нет, то фотография удаляется и ничего не происходит. Если есть, то она отправляется сотруднику полиции, чтобы он принял решение», — говорит программист. Финальное слово всегда остается за человеком, подчеркивает разработчик.
<strong>RoboCV</strong>
Продукт:системы автопилотирования для складской техники. Сколько стоит: около €60 000 за робота (западные аналоги — ближе к €100 000).
В 2008 году стартовал конкурс по созданию первого частного лунохода Google Lunar X Prize. От России в нем участвовала компания «Селеноход» — группа энтузиастов, увлеченных идей отправки аппарата на Луну. Однако призового фонда не хватало для покрытия расходов, и в результате «Селеноход» вышел из конкурса. Команда проекта разбежалась по разным стартапам.
В их числе RoboCV — ныне один из лидеров рынка автоматизации складской техники. Компания разрабатывает автопилот, который состоит из ряда аппаратных компонентов: датчиков, компьютеров, крепежных изделий, троллеров и программного обеспечения.
Первый серьезный контракт компания заключила с Samsung в 2013 году, предложив роботизировать часть техники на складе компании в Калуге. «Половину 2013 года мы жили практически на заводе — мы даже снимали дачу рядом, прожили там все лето, работая практически 24 часа в сутки», — рассказывает гендиректор RoboCV Сергей Мальцев.
До сих пор во всем мире перевозка грузов на заводах и складах автоматизирована только на несколько процентов, а все остальные операции осуществляются людьми. Роботы RoboCV, помимо горизонтальных перемещений грузов, могут поднимать объекты на небольшую высоту, примерно 4 метра. «Например, мы возим комплектующие со склада на сборочный конвейер или внутри склада. Есть и другие логистические операции: комплектация заказов, где, в частности, может использоваться робот-манипулятор», — объясняет Мальцев.
Робот ориентируется с помощью построения карты перемещений. Алгоритм получает лазерную картинку окружающего его пространства, сопоставляет ее с картой и за счет этого определяет свое положение в пространстве.
В RoboCV говорят, что делают ставку на коллаборативность роботов и людей, которая позволяет работать в сложных условиях. Важная функциональность для коллаборативных роботов — умение объезжать препятствия. На реальных складах и заводах, особенно в России, есть неровности, шероховатости и, конечно же, люди.
Сегодня партнеры RoboCV — это Samsung, Volkswagen и французская логистическая компания FM Logistic. Есть незакрытые проекты — крупнейший российский ритейлер и российская нефтегазовая компания.
«У одних наших клиентов роботы быстро окупаются, менее чем за два года. У других в этом плане сложнее, потому что у них мало рабочих смен. Если завод работает 24 часа в сутки 7 дней в неделю, тогда роботы быстро окупаются», — говорит Мальцев.
В Европе и Америке намного легче внедрять роботов, потому что все компании стремятся к снижению издержек на зарплаты — в отличие от России, где зачастую проще нанять живого грузчика. Проблема в том, что западные компании стараются не связываться с российскими производителями, говорит Мальцев, — «в свете отношений между нашими странами». Зато, благодаря низким затратам на разработку, продукция RoboCV оказывается существенно дешевле западных аналогов.
<strong>«Цифра»</strong>
Продукт: системы мониторинга промышленного оборудования. Сколько стоит: 10–15% от цены оборудования.
«Цифра» — еще одна молодая компания, которая существует на рынке около двух лет. При этом в свежем докладе консалтинговой фирмы Frost & Sullivan «Цифра» названа компанией года по решениям мониторинга машинных данных на основе искусственного интеллекта для процессных отраслей.
«Цифра» сформировалась как дочка промышленной группы «Ренова» Виктора Вексельберга — отсюда выбор направления деятельности. К тому же в промышленности на тот момент конкуренции практически не было — в первую очередь цифровизация пришла в банки и ритейл.
«Применение ИИ в промышленности сейчас переживает настоящий бум, здесь еще автоматизировать и автоматизировать, — говорит директор департамента интеллектуальных приложений компании «Цифра» Константин Горбач. — В более цифровых индустриях этот бум уже прошел, они вышли на плато и собирают последние крохи».
В промышленности существует своя специфика, которая выделяет ее из других индустрий с точки зрения цифровизации. Прежде всего, это природа самих данных: промышленность — естественная среда, в которой происходят сложные процессы, здесь гораздо труднее «причесать» данные, чем, например, в банковском секторе.
Компания «Цифра» продает лицензии на платформу анализа данных и услуги по адаптации моделей под конкретного заказчика. Компания устанавливает клиентам датчики для сбора информации, а потом анализируют ее для выработки совместных решений. Поскольку цена ошибки в промышленности очень высока, сначала ИИ внедряется в режиме советчика, который дает рекомендации оператору. Оператор вправе принять или не принять решение, подсказанное роботом. Если на продолжительном участке времени решение работает эффективно и надежно, то можно говорить о полном замещении оператора ИИ. Внедрение интеллектуальных систем окупается за период от 3 месяцев до 1–3 лет.
Основные клиенты «Цифры» — крупные компании из нефтянки, металлургии, химической промышленности. Пример — проект в области автоматизации управления печей ДСП (дуговая сталеплавильная печь). «Это комбинированное решение, где мы используем и аппаратную составляющую, и софтовую. Есть интересный проект в области нефтедобычи, который состоит в оптимизированном управлением насосов для того, чтобы увеличить КПД при добыче нефти», — рассказывает Горбач. Один из ключевых заказчиков «Цифры» — компания «Газпромнефть».
Впрочем, российская промышленность еще не вполне готова к тотальному внедрению интеллектуальных систем. Многие предприятия боятся брать на себя риски и реализовывать инновационные проекты. «Если сравнить с китайскими компаниями, то кажется, что желание попробовать что-то новое у них в крови. Они гораздо легче идут на риск», — отмечает Горбач.
<strong>Promobot</strong>
Продукт: сервисный робот-ассистент. Сколько стоит: Promobot V.2 — 480–940 тысяч рублей, Promobot V.4 — 1,2–2 млн рублей (в зависимости от комплектации), аренда — 70 000 рублей в день (Promobot V.4).
С 1970 года в робототехнике известен «эффект зловещей долины», описывающий восприятие людьми роботов в зависимости от степени схожести с человеком. Гипотеза состоит в том, что чем более антропоморфен робот, тем большее отторжение он вызывает у людей. Андроид, у которого есть подобие человеческой кожи, волос и ногтей, скорее всего, будет вызывать у вас дискомфорт.
Пермская компания Promobot выпускает сервисных роботов, которые умеют общаться с людьми, распознавать лица и речь, перемещаться по объекту, демонстрировать какие-то материалы на дисплее, кивать головой и двигать руками. Этот комплекс функций помогает им выполнять ряд бизнес-задач: например, работать хостес, промоутером или администратором. При этом степень сходства с человеком подобрана так, чтобы избежать жутковатых эффектов.
В меру антропомофрные роботы для обслуживания людей — это именно та ниша, которая может выстрелить, решили несколько лет назад три пермских инженера. И собрали первый прототип в гараже на окраине Перми. Сейчас Promobot — крупнейший производитель автономных сервисных роботов на территории России, а также Восточной и Северной Европы.
«Мы находимся на первом пике графика «зловещей долины», потому что делаем абстрактных роботов, которые максимально располагают к себе аудиторию и создают лояльность к компании, — говорит директор по развитию компании «Промобот» Олег Кивокурцев. — А виртуальные ассистенты находятся в самом начале этой шкалы, потому что по визуальному восприятию не ощущаются как что-то живое».
Продукция компании поставляется в 27 стран (65% роботов идет на экспорт — в основном в страны СНГ и Ближнего Востока, но также в США и Канаду), при этом производство и головной офис до сих пор находятся в Перми. «С точки зрения качества распознавания лиц и функциональности нам сильно проигрывают конкуренты из других стран», — утверждает Кивокурцев.
На 80% роботы состоят из отечественных комплектующих. Остальные 20% — сложная микроэлектроника, которой нет в России: экраны, материнские платы и видеокарты.
Чаще всего «промоботы» выступают в роли консультантов в клиниках, торговых центрах, кофейнях и гостиницах. «Очень часто компаниям не хватает людей, которые бы отвечали на простые вопросы и что-то продавали», — объясняет Кивокурцев. На втором месте идет робот-консьерж в бизнес-центрах и жилых апартаментах. На третьем — робот-гид, который водит экскурсии по музеям.
«Промоботы» работают в двух российских МФЦ, в Перми и в Салехарде. Они сканируют документы, выдают справки, автоматически заполняют заявления и тем самым ускоряют работу операционистов примерно на 30%, говорят в компании. Планируется расширение на другие российские города.
Другой нашумевший продукт Promobot — робот-полицейский, патрулирующий людные места. Начиная маршрут на вокзале или в аэропорту, робот ездит по заданному периметру, чтобы избавить «белковых» полицейских от рутинной работы. В базу данных робота загружены данные о разыскиваемых преступниках, при обнаружении которых он в реальном времени отправляет уведомление в полицию. Достать пистолет и провести оперативное задержание «промобот» пока не может.
На данный момент пермские роботы-полицейские есть в Казахстане и ряде азиатских стран. От российских правоохранительных органов «Промоботу» запросов пока не поступало.
Робот-полицейский не нарушает прав человека, уверен Кивокурцев, потому что занимается только поиском разыскиваемых преступников. «В Китае ИИ полицейский подсоединялся к персональным данным граждан: они видели состояние банковских счетов, какие покупки делали родственники, данные медицинской карты. С этической точки зрения такое проникновение в частную жизнь недопустимо».
В начале года пермский робот стал героем рубрики «Происшествия»: на выставке в Лас-Вегасе его сбил американский электромобиль Tesla Model S. Позже оказалось, что виновен в ДТП водитель Tesla, который не справился с переключением автомобиля в автономный режим. Но в дальнейшем нас ждет немало дискуссий о нетривиальных дорожных ситуациях.
<strong>«Наносемантика»</strong>
Продукт: виртуальный чат-бот. Сколько стоит: продвинутые модели — от 700 тысяч рублей.
Идея создать чат-боты пришла к основателям «Наносемантики» в конце 1990-х, когда это явление называлось громоздким термином «автоматизированные диалоговые системы». В конце 1990-х стала появляться флагманская техника с функцией простых голосовых оповещений: стиральные машины, которые сообщают о завершении стирки, или холодильники, реагирующие на пустые полки. Но человек не мог сказать ничего в ответ.
«Это была простая, понятная, но к тому времени новаторская коммуникационная идея о том, что даже если с тобой начал разговаривать робот, то это вполне естественно, что человек отвечает. Было понятно, что это случится не завтра, но этим надо было заниматься заранее», — рассказывает руководитель отдела лингвистики компании Анна Власова.
В нынешнем виде стартап «Наносемантика» существует с 2005 года и занимается проблемами машинной обработки естественного языка. Чат-боты «Наносемантики» используются в колл-центрах банков и сотовых операторов, применяются при оказании госуслуг (правда, пока только в Казахстане), замещают уставших сотрудников в отделах кадров крупных компаний.
Мотивация в каждом случае одна и та же: «Люди хотят работать над сложными вопросами, а не рассказывать целый день, как зайти в личный кабинет или заполнить заявление на отпуск», — говорит Власова.
Сейчас самое перспективное направление развития диалоговых систем — это голосовые колонки, которые не просто рассказывают о продуктах конкретных компаний, но и подстраиваются под персональные предпочтения человека и учитывают его текущее настроение.
Простые «скриптовые» чат-боты работают за счет грамотного интерфейса, хотя внутри это элементарное древо решений, по которому проходит человек, например, покупая авиабилет. В продуктах «Наносемантики» используется более сложный подход: интеллектуальный поиск по базе правил. Когда бот получает фразу от пользователя, он сохраняет контекст сказанного (тема, местонахождение человека и так далее). Во время последующих диалогов бот осуществляет поиск по этой базе с учетом контекста, выбирая наиболее подходящие правила диалога. Это чат-боты «с мозгами», которые могут принимать самостоятельные решения и учитывать ход диалога. Недостаток такого подхода состоит в том, что базы данных пишутся специально обученными людьми, а это занимает много времени.
Самая последняя волна диалоговых систем основана уже на машинном обучении. Это, в частности, все системы, связанные с распознаванием речи, — например, голосовой помощник «Алиса» компании «Яндекс». Алгоритм обрабатывает данные (в данном случае — большое количество диалогов между людьми), находит в них некоторые закономерности и применяет их в незнакомых ситуациях.
Преимущество машинного обучения очевидно: достаточно загрузить в алгоритм данные, а дальше компьютер все делает самостоятельно. Но в области моделирования языка этот подход пока что находится на начальных стадиях развития. «В коммерческом применении систем, созданных только на нейросетях, пока не существует, — говорит Власова. — Есть пилотные проекты развлекательного свойства, такие как чат-бот Тау от Microsoft (тот самый бот, которого пользователи соцсетей мгновенно научили расизму и сексизму. —Ред.). Но это просто «болталки» на свободную тему — для консультаций клиентов компании их не используют».
Программисты по всему миру бьются над вопросом, как лучше подготовить диалоги для обучения ботов. Данных для хорошего полноценного обучения не хватает, а если вдруг в систему затесались неправильные ответы, то робот может начать выдавать их в самый непредсказуемый момент.
Еще более сложные вопросы лежат в морально-юридической плоскости. «Кто будет отвечать, если робот даст плохой финансовый совет и вы потеряете на этом деньги? С банковскими операторами все понятно, но у робота ведь есть разработчик. Вот такие вещи сейчас представляют огромную сложность», — заключает Власова.