Выпуски в тексте

№100 Филипп Беляев и Владимир Матвеев

Владимир: Добрый день, друзья! Сегодня мы говорим про такую технологию, как компьютерное зрение. У меня в гостях Филипп Беляев и Владимир Матвеев, основатели компании Matller Oilfields. 
Что такое современное компьютерное зрение и что оно собой представляет сегодня?

Владимир: Компьютерное зрение – это технология, позволяющая производить обнаружение, отслеживание и классификацию объектов. Если объяснять своими словами, то с помощью компьютерного зрения можно производить захват, анализ видеопотока с видеокамер и впоследствии уже производить какие-либо классификации данных обнаружений объектов.

Владимир: Если мы вспомним фильм «Терминатор», когда в его глазах было видно, как он видит объект, строит на него мишень, стреляет, – это то же самое фактически в современном мире, только уже реальность, а не фантастика?

Владимир: Да, мы говорим про скайнет, про «Терминатора» – все в одном. В комплексе с компьютерным зрением у нас также используются нейросети. Что такое нейросеть? Это искусственный интеллект, некая математическая модель, а также ее программное и аппаратное воплощение, построенные по принципу организации функционирования биологических нейроннных сетей.

Владимир: Мы понимаем нейросеть как самообучающуюся штуку, которая видит или получает некую информацию и со временем становится лучше. Это так?

Филипп: Это искусственный интеллект, по сути. 

Владимир: Только на данный момент мы используем нейронную сеть и вначале обучаем ее сами, чтобы она могла уже определять какие-либо объекты. По сути, архитектура строится так, что с камер видеонаблюдения видеопоток передается в нейросеть, а нейросеть уже классифицирует объекты, которые нужны для определения и выявления каких-либо нарушений.    

Владимир: В частности ваша компания специализируется на внедрении компьютерного зрения на различных производствах. Могли бы вы привести какие-то кейсы, как ваш продукт интегрируется в конкретные производственные процессы? Чем он может быть полезен?

Владимир: Да, я могу рассказать немного предыстории. Начинали мы всю разработку и исследования в 2016 году. К нам обратилась одна из нефтесервисных компаний, у которой была необходимость выявлять процессы нарушения в технологиях и в первую очередь, связанные с безопасностью. Как они сами говорят, что правила безопасности «у нас писаны кровью». Им нужно было захватывать видеопоток с видеокамер и отслеживать нарушения безопасности в части несоблюдение техник безопасности.  

Владимир: Например, что?

Владимир: Нарушение ношения спецодежды. Человек, который работает в нефтяной и газовой отраслях, он по правилам и технике безопасности должен носить каску на голове, чтобы у него были защищены руки, ноги, то есть средства защиты рук, средства защиты ног, жилет и т.д. И собственно, мы справились с этой задачей, мы разработали систему, которая позволяет в онлайне отслеживать какие-либо нарушения и вовремя предупреждать.

Владимир: Фактически камера смотрит на большое количество людей, работающих на площадке, видит, кто из них не одет в спецодежду, и сообщает об этом курирующему менеджеру? 

Филипп: Да. На текущий момент во многих нефтесервисных, нефтедобывающих компаниях, где ведется производство непосредственно месторождений, бригады различных нефтесервисных подрядчиков оборудованы камерой видеонаблюдения. Но проблема в чем заключается? Вся эта информация собирается, но не анализируется, в онлайн-режиме. Только постфактум, если произошло какое-то происшествие,  тогда уже разбираются, кто там куда бежал, что сделал, не сделал, делаются определенные выводы и прочее. А наша система позволяет минимизировать человеческий фактор и в автоматическом режиме контролировать и выявлять по алгоритму проблемы, нарушения, которые мы туда закладываем.

Владимир: Что еще может делать ваш программный продукт и современные программные продукты в области компьютерного зрения?

Филипп: Сфера применения нашего продукта достаточно широкая. Ее можно применять практически на любом производстве, в любой области, где используется видеонаблюдение. На текущий момент у нас достаточно много заказчиков из области ритейла, мы сотрудничаем с компаниями, занимающимися железнодорожными перевозками, крупными агрохолдингами, крупными компаниями, которые являются производственными площадками.

Владимир: Что может конкретно делать данная технология? Не могли бы вы привести какие-то примеры.

Владимир: На самом деле у нас достаточно много интересных кейсов. Можно начать с лесной промышленности. К нам поступил запрос от одной из областей России, у них была задача в минимизации воровства леса. Нужно было отслеживать лесовозы, смотреть кубатуру, сколько лесовоз везет, сравнивать номера лесовозов с белыми и черными списками и вовремя оповещать ближайший пункт ГИБДД. 

Владимир: При помощи программного продукта и камеры можно узнать, сколько кубов в конкретном грузовике?

Владимир: Да. 

Владимир: А в маркетинге можно было бы это использовать?

Владимир: Да, здесь тоже у нас была очень интересная задача. К нам обратилась большая аптечная сеть. У них были повешены мониторы, телевизоры, и нужно было смотреть и отслеживать, какой возрастной категории заходит к ним человек, и в зависимости от возрастной категории показывать ту или иную рекламу.   

Владимир: Практически контекстная реклама без cookies?

Владимир: Да, можно так сказать. Но данные технологии еще используются в помощь продавцам. Например, когда есть какие-то акционные продукты, которые предлагаются тем или иным возрастным категориям людей. И если продавец видит подсказку у себя на мониторе о том, что большинство людей, присутствующих сейчас в магазине, находятся в целевой аудитории от… и до… лет, он, соответственно, уже может не задумываясь, предлагать акционную продукцию. 

Филипп: Программный продукт «Морриган» может распознавать возраст, пол людей.

Владимир: Наверняка в банках тоже можно это использовать? К примеру, я слышал, что распознавание лиц используется для анализа количества посетителей, их возрастных характеристик для того, чтобы предлагать им те или иные продукты и вообще собирать большие данные, Big Data по клиентам, да?

Владимир: Да, в банках вообще много разных задач используется. Была, например, очень интересная и даже смешная задача по распознаванию лиц для того, чтобы перед VIP клиентами автоматически открывались двери, и секретарша сразу видела, кто к ним заходит. 

Филипп: Также в банковской сфере компьютерное зрение позволяет предупредить какие-либо нарушения, грабежи. Раньше сначала происходили какие-то нарушения, ограбления, задымление, нарушение целостности периметра, и только постфактум смотрели, что случилось. 

Владимир: А как предупредить ограбление, если только не считывать фотографию преступника из базы данных полиции?

Филипп: Это можно сделать по разным маркерам. К примеру, один из маркеров: если заходит взрослый человек в киоск, где расположены банкоматы, и он присел на корточки, сидит на корточках больше минуты, – он что-то затеял, точно не шнурки завязывает. И камеры видеонаблюдения, фиксируя такое нестандартное поведение человека, сразу перенаправляют видеопоток в службу безопасности банка, где они уже глазами могут проследить, что происходит в данный момент в самом киоске. 
Либо какое-то нарушение целостности периметра, когда разбивают стекло днем, в то время когда датчики отключены и не сработают, то мы также можем отследить и вовремя оповестить об этом, чтобы предотвратить аварию, нарушение.

Владимир: А каким образом происходит процесс внедрения вашей технологии в жизнь, из чего состоит сам программный продукт? Понятно, что это какие-то особенные камеры наблюдения,  программное обеспечение... 

Филипп: Если говорить о маркерах, что это такое? Это заданный алгоритм нарушений. Мы разработали типовые маркеры для определенных отраслей, у которых есть спрос и потребности в данной услуге. Основным заказчиком маркеров является непосредственно заказчик, знающий свое производство, который анализирует те узкие моменты, которые должен увидеть маркер. Ззаказчик обсуждает с нами это техническое задание, ставить перед нами задачу. Мы разрабатываем маркеры и потом уже начинаем организационное внедрение, т.е. именно техническое, аппаратное. 

Владимир: И добавлю еще, что преимущество нашего программного продукта «Морриган» в том, что мы можем работать с любым оснащением камер. То есть заказчику не обязательно переоснащать камеры видеонаблюдения, если у него уже есть архитектура данных. Если говорить простым языком, то программный продукт видит все то же самое, что видит человеческий глаз. Это если говорить о качестве камеры, отвечая на второй вопрос. Если при просмотре видео человеческим глазом видны какие-либо нарушения, то, соответственно, программа может это различить. 

Владимир: Друзья, недавно я смотрел видео с американской технологической выставки, где ребята, фактически ваши коллеги, занимаются тоже компьютерным зрением, такими домашними камерами наблюдения. Их концепция отличалась от остальных тем, что они не показывают конкретную картинку, они строят скелет человека, распознавая его при этом. То есть они знают, что это, например, скелет папы, это скелет мамы, это маленького ребенка, а это дедушки. И показывают взаимодействие этих скелетов в пространстве. Так, например, можно ограничить выход ребенка из дома на улицу, сигнализируя родителям, что это опасная зона. Или  если взрослый человек лежит на полу в течение больше 2-х минуты, то существует  опасность для здоровья. Разработчики объясняют выгоду своей концепции тем, что она учитывает вопросы privacy, конфиденциальности, потому что не всегда можно и нужно показывать, чем конкретно занимается человек. Как вы относитесь к вопросу приватности данных? Насколько заказчик должен видеть все, что и с кем происходит? 

Филипп: Спасибо за вопрос. Прежде всего мы работаем в инфраструктуре заказчика. Наш программный продукт решает уже локально те или иные ограничения, о которых Вы сказали, между заказчиком и его потребителями или клиентами, т.е. какими-то юридическими механизмами. В принципе, если у них уже установлены камеры видеонаблюдения, то, наверное, это должно быть каким-то образом прописано в их соглашениях с клиентами или с сотрудниками. А наш программный продукт – это всего лишь дополнительная надстройка, которая дает новые возможности…

Владимир: Это понятно, что вы технология. Но, тем не менее, как вы лично относитесь к этому, если у вас дома или в компании стоит такого рода программный продукт?

Филипп: Все зависит от области применения, нужно ли нам видеть этот скелет в той или иной ситуации. Возможно, нам наоборот нужно видеть и опознать человека, его идентифицировать. Многие наши заказчики хотят именно идентифицировать людей, каких-то определенных рабочих. Сейчас у нас ведутся переговоры с одним заказчиком по установке маркировок на каске, или QR кодов, чтобы они могли конкретно распознать человека — кто это, из какой он бригады, есть ли у него допуск, есть ли у него обучение и прочее. 

Владимир: Осталось только внедрить алкотестер, чтобы уж был полный анализ человека на стройке.

Владимир: От себя лично хочу добавить, что не против такой технологии, и расскажу почему, немного опишу саму технологию. 
Технология позволяет определить человека – в первую очередь камера видит не скелет, а камера видит реального человека. И после идентификации самого человека она уже переводит картинку в скелет, чтобы обезличить саму картинку. Зная саму технологию и принцип ее использования, я считаю, что это наоборот плюс. Если вдруг со мной лично что-то случится и соответствующие службы вовремя отреагируют и приедут, мне помогут. Как я могу быть против этой технологии, учитывая, что камера на выходе дает меня как обезличенное существо в виде скелета? Я даже больше бы добавил: сейчас у нас есть такие проработки, что мы устанавливаем камеры видеонаблюдения на крышах домов для отслеживания свободных парковочных мест. И когда люди ходят внизу по дороге, они должны быть обезличены, мы их закрашиваем квадратиками.

Владимир: Какие задачи стоят сейчас перед технологией компьютерного зрения, что нам ждать в ближайшие 2-3-5 лет?

Филипп: Мы все знаем, что живем в эпоху новых технологий, новых вызовов и контроля информации. Если в последнее десятилетие вопрос был именно технологического характера, по сбору информации, то сейчас он уже решен. Сейчас стоит вопрос по обработке этой информации, по ее хранению. Мы живем в эпоху потребления и эпоху маркетинговых инструментов, когда важна правильная обработка информации.

Владимир: Сейчас даже страшно, если честно, что-то искать на работе в интернете – потом весь офис знает, что ты искал.  

Филипп: Да, именно так. Поэтому сейчас стоит вопрос в обработке информации прежде всего в правильном ее адресном направлении, в персонализированном направлении. Если, к примеру, возьмем ритейл, то консолидируется информация для определенного персонального пользователя, который ему нужен в данный момент и в данную минуту, – ему она и предлагается.

Владимир: Эта технология довольно широко и быстро развивается. И на самом деле сложно заглянуть и сказать, что будет через два года, через три или пять лет. Очень быстро идет развитие данной технологии, самих нейронных сетей и компьютерного зрения.

Владимир: А что на данном этапе хотелось бы, но технологически пока сложно сделать? Какие задачи вы пока не можете решить для своих клиентов?

Владимир: Я бы не сказал, что нельзя что-то решить. Можно улучшать технологию именно в «фейс-детекшн», то есть определение человека по лицу для того, чтобы можно было в большей мере сотрудничать с какими-либо службами. Я говорю про такие запросы, которые к нам приходили, например, от служб, когда люди, какие-то неплательщики, находятся в поиске или еще что-то типа этого. 

Владимир: Друзья, экспериментов с компьютерным зрением было достаточно много. Это и точки контроля в аэропортах (фейс-контроль), и компания Google, которая стала пионером в крутой технологии Google Glass. Почему, на ваш взгляд, это не взлетело на рынке?

Филипп: Потому что это не взлетело в розницу. Если говорить об узко специализированной направленности использования этого девайса, то он широко применяется на производствах. В принципе, Google-очки – это просто хорошая база для внедрения других программных продуктов на базе этих очков, которые будут давать определенные возможности. Мы можем рассказать об одном из кейсов, который был связан у нас с очками Google.  

Владимир: Это было одно производство, где внедряют рекомендательную систему. Каким образом все происходит? Они закупили как раз очки Google и аналог. У них на производстве (не могу разглашать, чем они занимаются) было много брака. И, соответственно, для того чтобы минимизировать количество брака, человек надевает эти очки, они интегрируются с нашей системой, которая как рекомендательная выступает в части направления самого сотрудника.

Владимир: Они что-то собирают?

Филипп: Да, они собирают некую микросхему, им надо засовывать клемму в красную или в зеленую ячейку... И часто из-за человеческого фактора люди сбиваются по тем или иным причинам, и возникает брак. Google очки подсказывают, в какую клемму нужно вставлять тот или иной провод.

Владимир: Да, по факту все клеммы черного цвета, и мы во время рекомендаций как раз подсвечиваем красным цветом те ячейки, куда провод не нужно вставлять,  и зеленым, образно говоря, цветом, куда нужно.  За счет этого количество брака в разы снизилось. 

Владимир: Как вы считаете, каких технологий нам ждать в будущем? Уже появляются часы с камерами, Google очки, супер умные наушники, браслеты. Чего еще можно ждать? 

Филипп: Сейчас вот тоже очень широко развивается технология, связанная с дронами и квадрокоптерами. Наша система работает в части обнаружения каких-либо нарушений, когда дрон летает по территории – без разницы, это несколько гектаров, где ведется стройка, или это запрещенная территория, где нельзя разводить костры, кемпинги, рыбачить около дамб. Представляете, насколько снижается себестоимость всей этой истории, когда не нужно ни человека использовать, ни вертолет, никакие средства. Просто квадрокоптер летает, к примеру, по заданному алгоритму, по какой-то территории, прилетает на базу, а уже ведется анализ того потока, который он отснял, специально обученные люди уже знают, где, в каком месте находится нарушитель.

Владимир: Мы реально живем в будущем. 
Друзья, спасибо большое, что пришли к нам в гости и рассказали про такую крутую технологию будущего, которая уже с нами сегодня!