М.СПИРИДОНОВ: Добрый день, коллеги. Вы слушаете 240-й выпуск программы «Рунетология», запись от 26 ноября 2014 года. Меня зовут Максим Спиридонов.
Партнер этого выпуска – Superjob – крупнейший портал Рунета для публикации вакансий и поиска сотрудников на любые позиции от стажера до топ-менеджера. Superjob постоянно внедряет современные технологии и создает новые сервисы онлайн-рекрутинга, чтобы экономить ваше время и деньги при найме лучших кандидатов.
В 2012 году компания нашего сегодняшнего гостя вела переговоры с Facebook о предоставлении детищу Марка Цукерберга разработанной ими технологии распознавания изображений. Через год эту технологию приобрела российская социальная сеть «Одноклассники». А стали бы вы сами пользоваться сервисом, который способен по фотографии найти понравившиеся вам и сфотографированные вами же туфли, рубашку или галстук? Задам вопрос шире. Считаете ли вы, что современные поисковые технологии способны полноценно проводить поиск по изображениям и видео, находя, скажем, пиратские копии или, как уже говорилось, нечто подобное из товаров, понравившихся вам в обычной жизни?
Сегодня в программе «Рунетология» со-основатель и генеральный директор компании Kuznech Михаил Погребняк. Приветствую, Михаил.
М.ПОГРЕБНЯК: Здравствуйте! Очень приятно!
М.СПИРИДОНОВ: Чем тогда, два года назад закончились переговоры с Facebook? Как я понимаю, в итоге они не взяли вашу технологию?
М.ПОГРЕБНЯК: Всё было очень интересно. Мы были в Калифорнии и совершенно случайно нас познакомили с менеджером, который отвечал за подразделение «Фотографии» внутри Facebook, и буквально на следующий день мы пришли в Facebook разговаривать с ним. Мы рассказывали ему о нас, ему всё очень понравилось, и мы расстались на том, что нам надо было сделать какое-то предложение, но, услышав цифры, которые он говорил, с точки зрения количества фотографий, которое в день загружается в Facebook, мы, четно говоря, опешили. Нам сказали, что нужно в день обрабатывать около 250 миллионов новых фотографий. Если честно, мы технологически не понимали, что с таким количеством делать. Если говорить честно, мы просто упустили момент своего счастья, птица удачи была на расстоянии вытянутой руки, но мы ее почему-то не схватили за хвост. Так произошло, всякое бывает.
М.СПИРИДОНОВ: Почему не схватили? Что вас остановило?
М.ПОГРЕБНЯК: Любой поиск состоит из двух частей. Первая часть – это сами алгоритмы поиска, а вторая часть – это создание высоконагруженной системы, которая в состоянии обеспечивать данным сервисом всех желающих. Если первая часть у нас была готова в тот момент, то есть мы умели искать изображения по похожести, то каким образом сделать так, чтобы система была высоконагруженной, и как ее интегрировать внутрь социальной сети, мы тогда не очень понимали, и таким опытом и экспертизой мы не обладали. Понимание пришло гораздо позже, когда мы начали работать с Одноклассниками в России.
М.СПИРИДОНОВ: Как я понимаю, в итоге Facebook приобрел Face.com и на их базе построил распознавание?
М.ПОГРЕБНЯК: Здесь всё очень сложно. Надо понимать, что есть несколько технологий, которые находятся рядом друг с другом, и их все путают. Первая из них – это поиск изображений. Когда мы ищем похожие изображения, мы не распознаем изображение. Мы можем искать машину, и это будет изображение машины, также это может быть картинка машинки, сделанная на доме с помощью граффити. И в первом, и во втором случае мы найдем картинку, похожую на автомобиль. Когда мы говорим о распознавании лиц, мы решаем две задачи. Сначала мы выясняем, что на фотографии есть человеческое лицо, потом мы это лицо идентифицируем и говорим, что это Элтон Джон, это Барак Обама, а это Мелани Гриффит. Это совершенно другой класс задач, и он решается по-другому. Компания Face.com является компанией, которая занимается именно технологиями распознавания лиц, то есть Face detection и Face recognition. Если говорить о нашей истории, то внутрь Одноклассников мы попали по счастливому стечению обстоятельств. Компания Facebook купила Face.com, Face.com по соглашению с Facebook должен был отозвать все свои лицензии у конкурентов, то есть у других социальных сетей. Социальная сеть «Одноклассники» объявила тендер на технологию детектирования лиц, то есть Face detection. Мы приняли участие в этом тендере и всех обыграли.
М.СПИРИДОНОВ: Хорошо. Не смотря на то, что Face detection, Face recognition и поиск по изображениям – это разные направления, вы занимаетесь и тем, и другим?
М.ПОГРЕБНЯК: Да. Мы находимся в той стадии, когда мы ищем ту нишу, которая позволит нам понять, где находится прорыв. С одной стороны, количество цифрового контента непрерывно растет, чувствуется большой спрос на это, но где именно произойдет прорыв пока до конца непонятно, и мы последовательно перебираем различные ниши, в которых у нас есть экспертиза для того чтобы понять, какая из них будет самой прорывной, и где сильнее всего интерес пользователя.
М.СПИРИДОНОВ: Заявленные вами на сайте продукты – это, возможно, еще не конечный список, и, может, продукт-звезда еще не найден?
М.ПОГРЕБНЯК: У нас есть ощущение, что мы уже подходим к пониманию того, что нужно людям. Мы начинали с поиска похожих изображений, это были фотографии, и наша изначальная гипотеза состояла в том, что в интернете огромное количество фотографий (триллионы фотографий), и каждый день загружаются десятки миллиардов новых, и поскольку все они не описаны, у них нет тегов, их невозможно найти. Мы думали, что если мы предоставим инструмент, который позволит искать эти фотографии, тегировать их, находить похожие, то он будет востребованным. Когда мы всё сделали и вышли на рынок, выяснилось, что люди готовы это воспринимать как игрушку, но платить за это какие-то деньги, не готовы. Нам было непонятно, как выстраивать какие-то механизмы монетизации.
М.СПИРИДОНОВ: Иными словами, потребительского продукта не получилось?
М.ПОГРЕБНЯК: Мы сделали несколько прототипов, которые работали у фотохостингов. Компания Depositphotos была одним из пользователей нашего сервиса. Мы искали похожие фотографии для них и для всех заинтересованных организаций, но построить надежный бизнес, который бы устойчиво генерил деньги, у нас с этим продуктом не получилось. После этого возник проект «Одноклассники», который сказал, что им очень интересно всё, что относится к Face detection и Face recognition. Поскольку у нас были определенные наработки, мы смогли принять в этом участие. Наличие наученной группы, которая есть у нас в компании, позволило нам быстро улучшить те результаты, которые были показаны в первом туре тендера и в седьмой итерации мы показали совершенно фантастические результаты, мы обогнали всех остальных. Мы боролись с семью компаниями, и после этого к нам обратились другие потенциальные заказчики, которые говорили о том, что им очень интересно искать не изображения, а видео. Они спрашивали, можем ли мы решать задачу поиска похожего видео, то есть копий, кропов, вырезок. Так мы начали серьезно заниматься видео, это было где-то год назад, и мы добились очень хороших результатов, сделали систему поиска видео, сделали несколько индексаторов, запатентовали новый алгоритм, который был нами придуман. В результате, мы сделали решение, которое сейчас работает в Одноклассниках и которое будет распространено на все социальные сети Mail.ru Group.
М.СПИРИДОНОВ: Не смотря на то, что вы не единственные, кто работает в этом сегменте, есть такое ощущение, что всё еще поиск в изображениях, тем более поиск в видео, не стал естественным и не вышел на тот уровень, когда он был бы сопоставим с текстовым поиском?
М.ПОГРЕБНЯК: Конечно. С точки зрения вашего мировосприятия и того, как вы общаетесь с компьютером и окружающей средой, вы пишите поисковый запрос на естественном языке, например, «где продается вечером пиво?», «хочу купить себе новые шнурки для кроссовок желтого цвета» и так далее. Яндекс или Гугл, индексируя интернет, находит вам ответ на ваш вопрос. Теперь представьте себе, каким образом вы сможете сделать такой видео-запрос. Сфотографировать желтые шнурки? Наверное, можно, это вариант, но смысл заключается в том, что это не очень естественно. Людям и бизнесу нужны другие инструменты, и видеопоиск нужен для решения немного других задач. Эти задачи более интересные. Во-первых, это задачи, связанные с нарушением авторских прав. Не секрет, что в интернете гигантское количество нелегальных копий, которые лежат в тех же социальных сетях, а собственники и акционеры социальных сетей заинтересованы в монетизации. Каким образом можно монетизировать нелегальную копию? Сначала ее нужно найти, заменить на легальную копию, потом перед легальной копией показать какую-то рекламу и из этого получаются деньги. Задача поиска нелегальных копий для социальной сети, в которой десятки и сотни миллионов видео-фрагментов – это большая и серьезная задача, которая важна для них.
М.СПИРИДОНОВ: Она более интересна правообладателям, потому что социальная сеть, как правило, заинтересована в том, чтобы те или иные контентные объекты находились внутри нее без того, чтобы сильно запариваться с легальной стороной вопроса.
М.ПОГРЕБНЯК: Нет, подождите. Бизнес – это то, что зарабатывает деньги. В чем зарабатывание денег для социальных сетей в тот момент, когда она тратит свое компьютерное оборудование, жесткий диск, интернет на то, что пиратское видео лежит у нее на сервере, на том, что люди приходят и смотрят его? Это же не благотворительность. На самом деле, это неправильное понимание. Правильное понимание – это предложить механизм монетизации, когда я буду заходить во Вконтакте или Одноклассники, открывать сериал «Кухня в Париже» и смотреть этот сериал, но при этом, посмотрев 15-20-секундные ролики, которые будут очень таргетированы под меня, потому что я зарегистрирован в этой социальной сети, и она про меня всё знает. Рекламодатель будет платить деньги, которые будут делиться между всеми участниками процесса, то есть между правообладателями, социальными сетями, как площадками, где было просмотрено видео, и компанией, которая сделала механизм поиска.
М.СПИРИДОНОВ: В идеальном варианте в идеальном мире было бы так. Сейчас же российские социальные сети находятся на переходном этапе к этому движению. Психология, подобная вашей, помогает скорее правообладателям, дополнительно подталкивает соцсети, и они вместе находят пути монетизации, устраивающие их и почти не травмирующие пользователей.
М.ПОГРЕБНЯК: Вы сейчас указали только первый аспект. Второй аспект не менее важен. Каждый из нас понимает, что средний фильм длиной в один час будет весить не меньше гигабайта. Теперь представим себе, что это большая социальная сеть, и что этот фильм загрузило 12 тысяч человек. Сеть будет хранить 5 тысяч копий этого фильма, все эти копии будут разного качества, они будут по-разному называться. Это дисковое пространство, которое тоже стоит недешево. Что хочет социальная сеть? Она хочет найти все копии, оставить только одну в самом хорошем качестве, а остальные удалить и поставить на них ссылку на видео в хорошем качестве. Представляете, какое большое количество денег можно сэкономить на капитальных затратах?!
М.СПИРИДОНОВ: Еще раз можно повторить то, что вы – одна из технологий этаких санитаров леса, которая сегодня помогает навести порядок в правовом поле в области пиратского контента.
М.ПОГРЕБНЯК: Пиратский контент – это раз. Роскомнадзор не дремлет, скоро ко всем придет Никита Михалков и спросит: «Где?», и на его вопрос надо будет ответить в течение 48 часов по закону. Два – это решение технологических задач с точки зрения работы с медиа-контентом. Третий момент связан с тем, что мы делаем разнообразные системы, которые умеют внутри контекста изображения понимать, какой тип видео показывать. Мы сделали систему, которая может понять, является ли данный фильм фильмом, который содержит элементы порнографии или эротики. Опять-таки не секрет, что огромное количество такого видео загружается в социальные сети, и социальная сеть может автоматически детектировать такие фильмы и помечать, что эти файлы не предназначены для широкого показа и убирать их в закрытые коммьюнити, в которых находятся любители подобных фильмов, таким образом, предотвращая к таким фильмам доступ несовершеннолетних школьников, наших же детей. Это тоже очень непростые задачи, которые мы умеем решать.
М.СПИРИДОНОВ: В целом, картина ясна, мы довольно развернуто об этом поговорили, поскольку нам было необходимо представить это во всей полноте, чтобы объяснить то, чем вы занимаетесь. Я думаю, мы это сделали. Сейчас традиционный рассказ о нашем госте в виде короткого досье, и мы продолжим разговор.
ДосьеМихаил Погребняк родился 17 февраля 1970 года в Санкт-Петербурге. В 1993 году окончил Санкт-Петербургский государственный университет аэрокосмического приборостроения по специальности «Элетронно-вычислительные машины, комплексы, сети». В 2007 году окончил Стокгольмскую школу экономики по специальности «Менеджемент». В 1995 году стал со-основателем компании Qbix. В 2010 году стал со-основателем компании Kuznech. Увлекается триатлоном, экстремальным сноубордингом, дайвингом, охотой, живописью. Женат, воспитывает двоих детей. Живет и работает в Санкт-Петербурге.
М.СПИРИДОНОВ: Эти увлечения, которые описаны в досье, подготовленном нашей редакцией, находятся в активном режиме?
М.ПОГРЕБНЯК: Что значит «в активном режиме»?
М.СПИРИДОНОВ: Это значит, что вы более-менее регулярно, хотя бы раз в несколько месяцев занимаетесь триатлоном, сноубордингом, дайвингом, охотой?
М.ПОГРЕБНЯК: Триатлоном надо заниматься постоянно. Он состоит из бега, плавания и велосипеда. В прошлое воскресенье я принял участие в марафоне в Гатчине. Я постоянно тренируюсь, чтобы поддерживать себя в форме. Я хожу в бассейн, кручу педали. Это тяжелый вид спорта, требующий большой самоотдачи. Невозможно купить какие-то элементы за деньги, ты должен быть в форме и должен иметь возможность на морально-волевых качествах добежать и доплыть до конца.
М.СПИРИДОНОВ: У вас довольно активная зона еще не до конца разработанного направления бизнеса, вы, как видится по вашему интервью, увлекающийся предприниматель, вы так активно занимаетесь спортом. У вас на всё хватает время?
М.ПОГРЕБНЯК: Конечно, хочется закончить с бизнесами и посвятить себя чему-то высокому.
М.СПИРИДОНОВ: Бизнес не может быть чем-то высоким?
М.ПОГРЕБНЯК: Надо же понимать, что бизнес – это то, что я умею делать, потому что этому меня научили в институте, мне это нравится, в результате это стало моей работой, это мера моей социальной ответственности, потому что я являюсь работодателем, и у меня работает какое-то количество людей, это ответственность перед моими заказчиками, это в том числе форма моего жизненного самовыражения. С другой стороны, понятно, что нельзя замыкаться на чем-то одном. Работа – это очень хорошо, но как гласит известная пословица «От работы кони дохнут». Есть спорт, есть увлечения, которые позволяют канализировать тот негатив, который ты так или иначе получаешь на работе. Когда бежишь, очень хорошо думается о работе, а когда плывешь, очень хорошо думается о переговорах с клиентами, о потенциальных возможностях. Смена деятельности приводит к тому, что мозг на какой-то момент разгружается, в него приходят новые мысли. Благодаря этому ты двигаешься вперед в своем основном деле.
М.СПИРИДОНОВ: Вы сказали, что вас бизнесу учили в институте, но скажу, что вас все-таки учили быть инженером, а не предпринимателем.
М.ПОГРЕБНЯК: Да, это правда. Я учился в институте и, как мне казалось, стал хорошим инженером. Это был 1993-ый год, и когда нас учили в институте, мы были нацелены на ВПК, космос, а когда мы стали оканчивать институт, выяснилось, что Советского Союза нет, ВПК и все, чему нас учили, никому не нужно, и все на улице торговали спиртом «Рояль». Мне это совершенно было неинтересно, и мне не хотелось этим заниматься. Какое-то недолгое время я проработал в коммерческом банке, потом я увидел, что возникла интересная возможность, и подвернулся большой заказчик в виде недавно приватизированного завода «Степан Разин», который выпускал пиво. Им была нужна учетная система, которая позволяла учитывать готовую продукцию. Мы с моим близким товарищем, который потом стал компаньоном по бизнесу, организовали компанию, которая сначала сама разработала систему учета готовой продукции (ERP-систему). Мы довольно долго и успешно этим занимались. Вопрос заключается в том, что когда вы начинаете заниматься бизнесом, особенно в области высоких технологий, вы постоянно ищете какие-то модели и проверяете их. Есть сервисная модель, когда вы предоставляете сервис как услугу, есть модель, когда вы в какой-то момент времени понимаете, что вам интересно больше заниматься инжинирингом, и вы пытаетесь работать с западными компаниями, которые предоставляют услуги оффшорного программирования. Потом вы понимаете, что и это вам неинтересно, и вы хотели бы делать что-то такое, что не зависит от интересов клиентов, и это продуктовое направление, в котором можно продавать продукты или сервисы как услуги. По истечении 20 лет я нахожусь в той области, когда Kuznech как компания является моей попыткой по-другому вести бизнес, не предоставляя больше сервисных услуг, а делать продукт, предлагать его рынку, пытаться продавать только лицензии. Это мне очень интересно, потому что это новизна с точки зрения меня как бизнесмена и с точки зрения меня как бывшего инженера.
М.СПИРИДОНОВ: Почему занялись именно распознаванием образов? Несомненно, пройдя длинный путь в работе компании, занимающейся программированием по заказу, вы занимались очень разными системами. Те же самые ERP тоже могли стать профилем.
М.ПОГРЕБНЯК: Есть американское словечко «commodity», это когда что-то выходит в тираж, и оно прекращает быть чем-то уникальным и становится ширпотребом. В какой-то момент времени ERP-системы стали таким ширпотребом. Есть Microsoft Dynamics, 1C.Предприятие, SAP Business One. Эти компании, возможно, более успешные, чем ты с точки зрения продаж, они предлагают большое количество бонусов людям, которые принимают решение, у кого купить. Это перестало быть интересным, и на этом стало сложно зарабатывать. Наверное, происходит какое-то выгорание со временем. Когда ты занимаешься чем-то одним, необходимо переключаться. Мне было интересно, потому что распознавание образов, с одной стороны, требует хорошей фундаментальной подготовки, которая была дана в институте и школе, а с другой стороны, это новость, потому что на рынке этого не было. Нам повезло, что в этот момент в стране началось движение в области помощи стартапам. Мы смогли запрыгнуть в движение «Сколково», Сколково и явилось в том числе соавтором того, что компания Kuznech состоялась. Идея компании бродила в воздухе, но все создатели понимали, что, не имея инвестиций и денег, ничего толкового не сделать. В этот момент мы узнали о том, что Сколково стало давать деньги в виде грандов. Если честно, мы несильно надеялись на то, что нам что-то дадут. Тем не менее, мы решили попробовать и обратились в Сколково. Мы довольно долго согласовывали документы, несколько раз переделывали заявки, потому что это было самое начало, и никто до конца не понимал, как они должны быть правильно оформлены. Тем не менее, чудо произошло, и мы получили гранд от Сколково в размере 750 тысяч долларов.
М.СПИРИДОНОВ: Если бы вы не получили денег со стороны Сколково, компания бы началась?
М.ПОГРЕБНЯК: Сослагательное наклонение – штука опасная. В момент когда мы были на стадии достаточно активных переговоров со Сколково, какого-то запасного варианта у нас не было. У нас не было кого-то, кто бы сказал, что если не получится со Сколково, то он даст нам денег. Мы как основатели не думали о том, что если Сколково нам откажет, то мы пойдем к дяде Васе, и он нам точно даст деньги. Наверное, Сколково в тот момент был для нас единственной и уникальной возможностью материализовать идею до уровня научно-исследовательской задачи, которую надо решить.
М.СПИРИДОНОВ: Думаю, здесь будет уместно вставить короткую справку о компании.
Справка о компанииКомпания KuznEch основана в 2010 году Михаилом Погребняком, Александром Валенсия и Павлом Черкашиным. Сейчас KuznEch предлагает 8 продуктов визуального поиска, в том числе для обнаружения лиц, поиска изображений и видео. В 2012 году Kuznech стал обладателем гранта Сколково в размере 750 тысяч долларов. Офисы продаж компании расположены в Бостоне и Сан-Франциско, а центр разработки и исследований находится в Санкт-Петербурге. Первую прибыль KuznEch получил в 2012 году, 2014 год должен стать для компании операционно прибыльным.
М.СПИРИДОНОВ: Я еще раз хочу подойти к одному вопросу. Правильно ли я понимаю, что, взяв за основу принцип работы с изображениями, распознавания изображений и определенных выводов из этого распознавания в разных проекциях, вы стремитесь найти разные способы применения и коммерциализации?
М.ПОГРЕБНЯК: Да, это так. Мы начинали в момент, когда мы думали о том, что мы сможем создать такой продукт, который будет работать с конечным пользователем, с консьюмером, то есть будет модель B2C. Примерно через полгода разнообразных попыток мы поняли, что мы либо не понимаем, как это надо сделать, либо нет рынка.
М.СПИРИДОНОВ: Что вы пробовали сделать? Самое логичное – сделать поисковую систему по изображениям.
М.ПОГРЕБНЯК: Это классно, это супер. Эта идея лежит на поверхности, но дальше возникает основной вопрос «Кто за это заплатит деньги?». Вы сделали, вы потратили полмиллиона долларов на то, чтобы ее сделать, на кучу серверов, мощный интернет, проиндексировали два миллиарда картинок. Дальше возникает вопрос «Откуда берутся деньги?». Ты начинаешь общаться с людьми и понимаешь, что, скорее всего, денег нет, или они есть, но для того чтобы они появились, тебе нужно найти еще несколько десятков миллионов долларов инвестиций, чтобы начать закупать трафик, заводить людей, показывать большой неорганический рост, и, возможно, это кого-то привлечет. Получается велосипед. В тот момент у нас не было инвестиционных денег, которые нам могли бы дать на то, чтобы мы могли это сделать, и не было четкого понимания, что даже если мы всё это сделаем, то это привлечет какие-то инвестиции или какую-то рекламную модель, которая позволит нам монетизировать проект.
М.СПИРИДОНОВ: Лавры Гугла вас не прельщали? Они же тоже начинали с того, что просто аккумулировали аудиторию под качественный поиск и потом уже начали ее монетизировать.
М.ПОГРЕБНЯК: Нет, это совершенно не так. Наверное, вы просто плохо знаете историю Гугла. Гугл начал с того, что он ходил и всем предлагал свой движок в модели B2B. В какой-то момент времени они четко поняли, что аудиторию им не привлечь, а в качестве Value change они могут представлять интерес. Если вы знаете, они предлагали себя продать Excite, он их не купил, и они пошли к Yahoo. Еще до 2000-х годов Yahoo использовал движок Гугла в качестве своего поискового.
М.СПИРИДОНОВ: При этом параллельно существовал и B2B, и Гугл как поисковая система.
М.ПОГРЕБНЯК: Деньги-то они зарабатывали в Yahoo и реинвестировали их в Гугл.ком. Надо помнить еще о том, что рынок США и рынок, который был в конце 20-ого века – начале 21, был более бурлящим, на нем было большее количество денег, интернет становился горячей темой для инвестиций. Инвестиционные деньги в Америке ищутся немного по-другому, нежели здесь, и у них это гораздо проще. Конечно, классно себя сравнивать с Гуглом, и мы внутри себя это делали, но мы четко понимали, что ошибка приведет нас к кладбищу стартапов.
М.СПИРИДОНОВ: Несомненно.
М.ПОГРЕБНЯК: Мы решили, что лучше двигаться перед, но живыми, чем иметь красивый памятник, но на могиле.
М.СПИРИДОНОВ: Если представить, что такой проект был бы сделан, он бы был заметно интереснее и эффективнее, чем тот же самый поиск по картинкам, который есть у Гугла?
М.ПОГРЕБНЯК: Вы задаете классные вопросы. Нам часто задают этот вопрос. Гугл и Яндекс имеют очень большой поисковый индекс, то есть когда работает их поиск, он перелопачивает весь интернет, и кроме самой картинки он еще знает огромное количество информации, которая относится к этой картинке, но записана в тексте. Каждый раз когда вы ищете картинку в интернете, будьте уверены, что Гугл найдет всё, что относится к ней, он найдет первоисточник, покажет вам Википедию, где будет всё объяснено и так далее. Если вы возьмете картинку, которую вы сделали своим смартфоном или которую вы сделали во время выходных, и попробуете что-то поискать, загрузив ее в поисковик изображений в Гугле, скорее всего, вас постигнет большое разочарование. Причина этого разочарования заключается во многом, но скорее всего, дело в том, что для Гугла или Яндекса поиск изображений не является целевой экспертизой, и они не занимаются монетизацией картинок. Их целевая история – это монетизация поисковых запросов и продажа ключевых слов. Мы же, как компания, специализируемся именно на поиске и обработке изображений и видео, и это наша ключевая экспертиза. Мы в какой-то момент времени поняли для себя, что на текущем этапе развития нам интереснее свою технологию продавать как некий white label, который крупные клиенты могли бы встраивать внутрь существующих процессов, тем самым, оптимизируя их, делая их более эффективными под нашей лицензией. Наша текущая бизнес-стратегия заключается в том, что мы перешли от модели B2C к модели B2B, и мы предлагаем другим бизнесам различные сервисы, которые делают их бизнес более эффективным.
М.СПИРИДОНОВ: Как я понимаю, в B2C вы так и не пошли, вы просто подумали об этом и отказались от этой идеи, да?
М.ПОГРЕБНЯК: Да, на текущий момент это так.
М.СПИРИДОНОВ: Есть какие-то знаковые большие и известные всем клиенты, кроме Одноклассников?
М.ПОГРЕБНЯК: Да. Mail.ru Group.
М.СПИРИДОНОВ: Одноклассники к нему относятся.
М.ПОГРЕБНЯК: Да. Кто еще относится?
М.СПИРИДОНОВ: Перечислять все части Mail.ru Group можно долго. Скажите, кто еще есть.
М.ПОГРЕБНЯК: Все 3 социальные сети, которые относятся к Mail.ru Group, являются нашими клиентами. Я не могу прямо их называть, но таким образом я могу о них сказать. Я думаю, если вы сами их назовете, то я ничего не нарушу.
М.СПИРИДОНОВ: Вконтакте и Мой Мир, видимо, тоже есть у вас.
М.ПОГРЕБНЯК: Да.
М.СПИРИДОНОВ: Насколько я знаю, ИТАР-ТАСС работает с вами, и работали РИА-Новости.
М.ПОГРЕБНЯК: С РИА-Новости мы были в долгих разговорах, и мы проговорили до того момента пока РИА-Новости не расформировали. Толком работы не получилось, но было много пиар-активностей. Говорить о том, что работа была, язык не поворачивается. Что касается ИТАР-ТАССа, да, мы довольно долго разговаривали, долго запрягали, но в результате поехали, и мы предложили им сервис, который связан с поиском нарушений их прав на фотографии, и поиск тех, кто нелегально использует их фотоконтент в интернете.
М.СПИРИДОНОВ: Правильно ли я понимаю, что главная проблема поиска по изображениям и видео в целом заключается в том, что эти файлы гораздо большего размера, чем текстовые файлы, индексирующиеся тем же Яндексом и Гуглом?
М.ПОГРЕБНЯК: Конечно, абсолютно верно.
М.СПИРИДОНОВ: И у вас есть подход, который позволяет создать индекс гораздо меньшего размера по объему?
М.ПОГРЕБНЯК: Да. Когда мы говорим о поиске, это всегда создание индекса. Чем больше индекс, тем лучше будет поиск. Всегда можно либо делать больший индекс и искать лучше, либо делать меньший индекс, но получать менее хорошие результаты поиска. В зависимости от задачи, которую нужно решать, мы выбираем разные варианты. В самом начале сотрудничества с клиентом мы предлагаем ему провести небольшое исследование для того чтобы понять, что оптимально для него подойдет. Так мы минимизируем временные затраты и затраты на аппаратную часть для того чтобы клиент получил результаты, которые будут его наибольшим образом устраивать.
М.СПИРИДОНОВ: Расскажите в двух словах о технологии.
М.ПОГРЕБНЯК: У нас есть две технологии, которые мы используем. Первая технология подразумевает, что мы генерируем некие фингерпринты, основываясь на различных характеристиках изображений или видео, и эти фингерпринты мы храним в виде индексов, по которым мы ищем изображения, используя механизмы кластеризации для того чтобы понимать, какие изображения похожи друг на друга. Вторая технология связана с распознаванием классификации, это технология сверточных нейронных сетей.
М.СПИРИДОНОВ: Как она работает?
М.ПОГРЕБНЯК: Это нейронная сеть, которой мы даем определенный набор одних и тех же изображений, то есть мы обучаем ее, и после того как она обучится, мы можем ее использовать, и как обученная сеть, она занимается распознаванием или классификацией.
М.СПИРИДОНОВ: Понятнее стало несильно, но тем не менее.
М.ПОГРЕБНЯК: Хорошо. Всё, что относится к поиску лиц, детектированию лиц, рекламы внутри видео, порно внутри видео, поиску каких-то марок автомобилей и так далее – это технология, связанная с нейронными сетями. Всё, что относится к поиску похожих изображений, кропов – это технология, связанная с фингерпринтами.
М.СПИРИДОНОВ: То есть с некими отпечатками, которые содержат в себе набор характеристик, уникальных для этого изображения?
М.ПОГРЕБНЯК: Да.
М.СПИРИДОНОВ: Этот подход одинаковый у всех компаний, занимающихся подобным, или подходы разнятся от компании к компании?
М.ПОГРЕБНЯК: Все эти идеи были высказаны еще в 60-е годы. В течение долгого времени они никак не реализовывались, потому что не было достаточно мощных компьютеров, памяти и жестких дисков, которые бы стоили вразумительных денег. Когда всё это появилось на рынке, произошел бурный рост этих технологий, появилось много различных работ, стало понятно, что разные типы изображений, разные типы контента требуют немного разных подходов. Всё это довольно хорошо отражено в научных работ, которые появляются в этой тематике в последние 5-10 лет. Безусловно, у нас тоже есть свой подход. Мы изначально ориентировались на определенный класс изображений. Этот подход показал свою правильность, потому что мы получили результаты с точки зрения точности, которые находятся на одном уровне с мировыми лидерами. Здесь гораздо важнее не научная составляющая, а понимание того, как эту научную составляющую в узкой рыночной нише предъявить рынку, и научиться с помощью этой научной новизны что-то зарабатывать. Начиная работать и анализируя компании, которые были до нас и которые находятся вместе с нами, мы выяснили, что на своеобразном кладбище стартапов находится больше 100 компаний. Они занимались теми или иными технологиями в области поиска похожих изображений и распознавания образов. Каждый год всё новые и новые компании пополняют эту аллею стартапов, безвременно погибших. Мы решили, что, с одной стороны, необходимо находиться на хорошем уровне с точки зрения научной новизны. С другой стороны, не надо бросать все силы на это, необходимо одновременно постоянно мониторить рынок, постоянно получать от него обратную связь для того чтобы понимать, что именно нужно рынку, чтобы иметь возможность это монетизировать и зарабатывать на этом.
М.СПИРИДОНОВ: Вы упомянули мощность компьютеров и наличие мощности для хранения данных. Сейчас они подошли к тому уровню, когда их хватает, или всё еще необходимо больше для того чтобы индексация и поиск по изображениям, детектирование различных объектов происходили более эффективно и могли быть применимы в разных областях жизни?
М.ПОГРЕБНЯК: Мне кажется, что да. Сейчас мощностей, которые есть, более чем хватает. Можно пойти в магазин Metro и купить компьютеры, которые стоят вместе с хлебом и памперсами на соседних полках, и на них построить вычислительный кластер, который будет искать изображения или индексировать видео. Это более чем реально. Безусловно, есть специализированные вещи, которые выпускаются компаниями, платы графических ускорителей, очень быстрые жесткие диски, и они делают нашу жизнь проще и интереснее. В целом, всего того, что каждый из нас может купить в магазине, достаточно, и из этого можно собрать достаточно серьезную систему, которая сможет решать коммерческие задачи.
М.СПИРИДОНОВ: Я так понимаю, что довольно важный этап – это эффективное распознавание образов с мобильных устройств. Я как конечный потребитель, думаю о том, зачем мне это может быть нужно, и я понимаю, что, увидев какую-то вещь, я хотел бы, чтобы распознавание происходило как можно быстрее и точнее. Сейчас то, что я вижу в мобильных исполнениях, находится на начальной стадии, не является полноценным эффективным продуктом. Как-то прокомментируйте эту ситуацию. Когда это может измениться? Как продвигаются ваши разработки в этом направлении?
М.ПОГРЕБНЯК: Это очень интересный вопрос. Мне кажется, что на текущий момент мы очень приблизились к тому, чтобы получить достаточно хорошее мобильное распознавание. Понятно, что в момент когда мы начинаем обсуждать это направление, возникает вопрос, что именно мы хотим распознавать. Мне кажется, что путь, по которому идут крупные компании типа Амазона, будет превалировать в ближайшем будущем. Что предлагает Амазон? Он предлагает скачать свое приложение на мобильный телефон и использовать технологию Amazon Flow. Вы наводите свой iPhone или Андроид на какой-то товар, например, книжку или DVD-диск, и через пару-тройку секунд Амазон, если сможет распознать объект, скажет, что вы то же самое сейчас можете купить одним кликом в Амазоне, и завтра вам товар придет. С точки зрения клиентского использования, мне кажется, в этом довольно глубокий смысл. Все хотят упрощения, создания одной большой красной кнопки, которая позволит уменьшить время на поиск, выбор, принятие решения, и можно будет воспользоваться вау-эффектом, который есть у потенциального покупателя. Человеку что-то понравилось, и он на волне этой эйфории, нажимая на кнопку iPhone, может быстро купить товар.
М.СПИРИДОНОВ: Я коротко встряну. Мне кажется, что есть несколько вопросов, которые можно было бы решить, они достаточно насущны для любого человека при использовании мобильного устройства и распознавании образов и видео. Важен поиск товара, поиск информации о человеке и поиск информации о товаре. Человек хочет узнать, что это вообще. Этот вопрос очень широкий, однако он именно так и возникает. Например, я вижу перед собой дом или какой-то объект и не понимаю, что это. Мне бы хотелось, чтобы поисковая система, распознав изображение, дала мне какой-то релевантный ответ.
М.ПОГРЕБНЯК: Всё, что вы говорите, абсолютно правдиво, и всё это имеет право на существование. Единственный вопрос заключается в том, что история с мобильным распознаванием людей противоречит известному закону о хранении персональных данных. Все компании, которые что-то делают в этой области, боятся судебных исков, потому что это внедрение в частную жизнь. Можно рассказывать много историй про тот же Гугл, который делает фотографии городов и удаляет и ретуширует лица людей, которые попадают на фотографии, потому что с точки зрения закона это вторжение в частную жизнь. Я сомневаюсь, что в ближайшее время появятся сервисы, которые позволят при наведении на человека сразу найти его профайл в Facebook, Вконтакте или Одноклассниках.
М.СПИРИДОНОВ: Технологически это возможно?
М.ПОГРЕБНЯК: Да, это самое простое из того, что есть. И Одноклассники, и Вконтакте, и Facebook думают о том, что всё закончится судебными исками к ним, а этого никому не хочется.
М.СПИРИДОНОВ: С распознаванием человека разобрались. Что относительно распознавания товара? То, что есть у Амазона, я не видел. Насколько это эффективно работает?
М.ПОГРЕБНЯК: Это работает. С нашей точки зрения, это одна из потенциальных зон роста. У нас у самих есть такое решение для американского магазина, который торгует запасными частями для ресторанов, баров и других пунктов общественного питания. Мы тоже движемся в этом направлении, мы пробуем разные модели. Есть два больших подхода – обрабатывание изображений на сотовом телефоне и обрабатывание изображений на сервере. Оба подхода имеют свои плюсы и минусы. Мы видим, что рынок развивается в сторону так называемого «тяжелого клиента», когда у вас большое количество обработки происходит на клиентской части и уже наполовину обработанные полуфабрикаты данных передаются на сервер, где они подвергаются специализированной обработке. Я думаю, что текущие сотовые телефоны, которыми мы пользуемся сейчас, уже близки к тому, что выпускают крупные компании типа NVIDIA для решения профессиональных задач. Например, у NVIDIA есть система Jetson, внутри ее находится 192 вычислительных ядра, и она дает производительность около 300 гигафлопсов, а этого более чем достаточно для того чтобы налету распознавать предметы и тегировать их. Я думаю, что с точки зрения телефонов мы уже находимся в той области, когда смартфон дает сравнимую производительность. Другой вопрос, что если он с утра до вечера будет заниматься распознаванием, батарейка быстро кончится.
М.СПИРИДОНОВ: При этом скорость распознавания на стороне клиента будет выше, верно?
М.ПОГРЕБНЯК: Она будут сравнима. Здесь вы имеете производительность 300 гигафлопсов, а если вы поставите NVIDIA Kepler K80б она будет 8,74 терафлопсов. Получается, она в 30 раз больше. Основной момент заключается в том, что все равно необходимо хранить либо нейронную сеть, либо описание, либо фингерпринты в телефоне. Насколько это правильно делать, ведь это постоянно будет с вами? Мне кажется, что все равно большая часть бизнес-логики будет находиться на серверной стороне в сети, и поставщики будут разными. Кто-то хорошо умеет детектировать автомобили, кто-то хорошо разбирается в еде, кто-то может по фотографии блюда, которое вам дали в ресторане, на лету посчитать его калорийность и сообщить вам. Мне кажется, что скоро мир превратится в поставщиков разнообразной информации, которую будут классифицировать и распознавать на лету по изображениям.
М.СПИРИДОНОВ: Мы коротко прошлись по разным вариантам коммерческого использования технологии поиска по изображениям и распознавания изображений. Безусловно, огромным направлением является B2G. Несомненно, это интересно государству. Есть ли у вас опыт сотрудничества с госструктурами? Как вы думаете, как это будет развиваться? Спецслужбам в принципе можно распознавать лица и, наверное, можно получать информацию после этого распознавания.
М.ПОГРЕБНЯК: Наверное, да. Я понимаю, о чем вы говорите, и я уверен, что такие системы уже есть
М.СПИРИДОНОВ: У вас нет опыта работы с правительством или какими-то структурами?
М.ПОГРЕБНЯК: Нет.
М.СПИРИДОНОВ: Наверняка вы читали об этом. Насколько глубоко сейчас визуальный поиск, поиск по видео интегрирован в работу систем транспорта, спецслужб и так далее? Насколько мы под колпаком?
М.ПОГРЕБНЯК: Я могу судить по сериалам. Я иногда включаю телевизор, и там показывают сериалы про шпионов, разведчиков и так далее.
М.СПИРИДОНОВ: Лучше обсудим это со стороны вашего профессионального знания и опыта.
М.ПОГРЕБНЯК: У меня нет опыта работы со спецслужбами, и у меня нет понимания того, что у них есть, потому что я никогда этим не интересовался. Может быть, я делал это сознательно, потому что меньше знаешь, лучше спишь. Мы всегда делали всё возможное, чтобы наша технология не рассматривалась в качестве биометрической, которая может как-то заинтересовать спецслужбы с точки зрения анализа реального изображения, того, что снимают видеокамеры на улице с утра до вечера. Если говорить о технологиях, которые могут быть похожи, то наблюдается бум технологий, которые связаны с возможностью распознавания лиц у ритейлеров. Вы заходите в магазин, в который постоянно ходите, система вас каким-то образом идентифицирует, возможно, подключает CRM, которая выполняет какой-то сценарий и вспоминает, что вы покупали в прошлый раз. Также есть какие-то системы, которые позволяют понимать, что к данной полке с товаром больше подходят мужчины или женщины. Это говорит о том, что мы рассматриваем эту технологию, и она, скорее всего, рассматривается рынком, как некая штуковина, которая увеличивает value существующих процессов. Мы получаем дополнительную информацию, которая позволяет нам лучше таргетировать потенциального клиента, и пользуемся этим для увеличения конверсии при продаже.
М.СПИРИДОНОВ: Рассказ про распознавание клиентов в магазине интересен. Могли бы вы как-то продолжить эту картинку, которая будет некоторым футурологическим прогнозом? Где еще и как может использоваться эта технология?
М.ПОГРЕБНЯК: Мне кажется, что в ближайшем будущем всё это должно каким-то образом совпасть с дополненной реальностью. Она может использоваться в профессиональной деятельности, например, подсказывать автомеханикам, как надо чинить автомобиль, врачам, как надо оперировать, специалистам, которые делают анализы, помогать увидеть хорошие или плохие клетки, которые у вас есть. Если говорить об учащихся и тех, кто что-то изучает, эта технология позволяет показывать какие-то данные или эксперименты, то есть делать обучение более интерактивным и интересным. С другой стороны, совершенно очевидно, что, используя эту же технологию, мы можем залезать всё глубже и глубже в информацию, которая содержится не в текстовом виде, а в виде изображений, и анализируя то, что находится внутри контекста изображения, мы можем получать больший объем аналитики, который мы можем использовать в своей повседневной жизни. Например, мы сейчас активно обсуждаем с ритейлерами возможность автоматического мерчендайзинга. У вас стоят товары на полках, и вы автоматически, анализируя изображение этих полок, понимаете, какие товары чаще покупают, какие товары стоят в соответствии с расстановкой. Опять-таки всё это ведет к тому, что цикл продаж уменьшается, становится понятно, что рынок лучше поедает, кто какой товар лучше покупает. Всё это увеличивает эффективность. Мы в данном случае не являемся технологией, которая находится на самом конце, мы не являемся вершиной пищевой цепи, мы находимся в середине.
М.СПИРИДОНОВ: Насколько сам рынок находится в стадии зрелости? Как далеко еще будут развиваться технологии, которыми вы занимаетесь?
М.ПОГРЕБНЯК: Я думаю, что рынок находится в стадии начала роста. Я исхожу из двух вещей. Количество цифрового контента в интернете непрерывно растет, количество людей, которое пользуется смартфонами, непрерывно увеличивается, объемы покупок смартфонов по сравнению с традиционными телефонами тоже увеличиваются, люди начинают загружать фото и видео экспоненциально больше год от года. Всё это востребовано, все хотят этим пользоваться, все хотят понимать, что находится внутри.
М.СПИРИДОНОВ: Понятно. Михаил, в целом, мы осветили те вопросы, которые нам хотелось поднять. Традиционно в конце программы я уточню, есть ли еще что-то, что мы не затронули. Если есть, то мы можем в резюме этого коснуться. Если нет, то ставим точку и заканчиваем разговор.
М.ПОГРЕБНЯК: Если мы вернемся к этому разговору через полгода или год, проведем еще одну беседу для того чтобы я вам рассказал, насколько мы продвинулись вперед, то это будет очень интересно нашим слушателям.
М.СПИРИДОНОВ: Интересно, потому что вы ожидаете каких-то прорывов?
М.ПОГРЕБНЯК: Интересно, потому что на всё интересно смотреть в динамике, неинтересно просто смотреть на точку, интересно смотреть на вектор.
М.СПИРИДОНОВ: Определенную динамику мы проследили в вашем рассказе об истории компании. Однако мы будем иметь в виду возможность пообщаться еще раз. На этом все. Спасибо. Вы слушали программу «Рунетология», у нас в гостях был со-основатель и генеральный директор компании Kuznech Михаил Погребняк.
Ровно через две недели в эфир выйдет выпуск с участием основателя компании Netcat Дмитрия Васильева. Не пропустите!
Редакция выпуска – Андрей Митрохин, Станислав Жураковский, Юрий Берингов, Надежда Гусарова. Вел программу Максим Спиридонов. Пока!