Президент и генеральный директор группы компаний ABBYY о том, как и почему надо вести передовые разработки | Большие Идеи

? Управление инновациями

Президент и генеральный директор группы компаний ABBYY о том, как и почему надо вести
передовые разработки

Если вам удалось собрать сильную команду и завоевать рынок, надо и дальше ставить перед ней сложнейшие задачи.

Автор: Андреев Сергей

Президент и генеральный директор группы компаний ABBYY о том, как и почему надо вести передовые разработки

читайте также

Антискандальное покрытие для вашего бизнеса

Джордж Серафейм,  Пол Хили

Цифровые продажи в эпоху кризиса

Игорь Глоткин

Коммуникабельные интеллектуалы или тугодумы с хаосом в голове?

Принятие решений на основе данных: что может пойти не так?

Редакция «Больших идей»

Про нас говорят, что мы редкий пример успеха российского ИТ на мировом рынке, и задают вопрос, как нам это удалось. Наш рецепт: уникальная команда, труд, бессонные ночи, непоколебимая уверенность, что все получится, идеализм и, конечно, немного везения. Мы всегда были необычной компанией: существенную часть дохода, около четверти, мы вкладываем в разработку. Это очень много! И еще: нам никогда не было интересно создавать стандартные ИТ-системы. Мы разрабатываем сложные решения, лежащие в области искусственного интеллекта, а это большой и долгий труд.

Увидели перспективу

Все, кто в России начала девяностых пытался работать на рынке информационных технологий, были какие-то странные. Ну как можно продавать программы, если все вокруг пиратское? Но тогда мы не задумывались об этом. Все началось с того, что студенту физтеха Давиду Яну после экзамена по французскому пришла в голову мысль: жить было бы проще, если бы у него был электронный словарь, — вбиваешь незнакомое слово и моментально получаешь перевод. И эта идея переросла в софтверный бизнес, который всего через пару лет вышел на зарубежные рынки.

Выпуская свой первый продукт — словари Lingvo, мы уже понимали, что это только часть решения. На самом деле людям нужен не словарь, а такая прог­рамма, чтобы, переслав в компьютер отсканированную страницу текста, тут же получить ее перевод. И нам довольно быстро удалось скомпоновать комплект ПО для этой задачи. Конечно, перевод был корявым, но для понимания смысла вроде бы его хватало. В этом комплекте часть программ были наши собственные, а часть — чужие. И слабым звеном была программа распознавания (OCR), превращающая компьютерную скан-картинку в текст, который можно редактировать. Ее нужно было долго «обу­чать» каждому шрифту, но даже после этого качество оставляло желать лучшего. Мы поняли, что распознавание текста — перспективное направление, потому что такой софт требуется для множества задач, а не только для перевода. Тогда перед нами встал выбор: ждать, пока кто-то другой сделает хорошую программу, или разработать собственную. И, хотя тогда этой задачей занялись несколько компаний, отпочковавшихся от разных НИИ, мы решили рискнуть и создали свой FineReader.

Вначале денег у нас было немного, и потому первую версию мы задумали как упрощенную. Разработать такую сложную технологию с нуля, да еще в сжатый срок невозможно, так что мы приобрели наработки у молодого ученого, занимавшегося этой задачей. А потом несколько месяцев просиживали дни и ночи, чтобы довести продукт до ума и начать продажи. Мы приступили к разработке в январе 1993 года, а в августе FineReader был уже упакован в коробки. По нынешним меркам такие сроки просто немыслимы.

Параллельно с работой над первой версией мы продолжали изучать теорию распознавания образов и познакомились с Александром Львовичем Шамисом — выдающимся ученым, который разрабатывал технологии в области машинного восприятия.

И к выпуску FineReader 1.0 мы знали, какой должна быть следующая­ версия. Программы-конкуренты неплохо справлялись с текстами на русском и английском, но полностью терялись, когда в русском описании попадались иноязычные вкрапления. Таких текстов было очень много, и мы решили делать наш FineReader мультиязычным. А еще мы добились того, что программа «читала» символы независимо от их размеров и начертаний, то есть ей не нужна была настройка под каждый новый шрифт. Эти, казалось бы, незначительные пре­имущества оказались ключевыми.FineReader 1 была не идеальной, но лучшей среди аналогов.

Нечаянно вышли в лидеры

И тут у нас с конкурентом произошла великая публичная битва. В то время мы активно размещали рекламу в популярной компьютерной прессе. Журналы тогда печатались за границей, поэтому оригинал-макет готовился очень загодя. Мы отдавали свою рекламу чуть ли не за полгода до выхода журнала и, поскольку программа наша была действительно очень хороша, всегда подчеркивали, что она единственная, которая распознает смешанные англо-русские тексты и любые шрифты. В общем, единственная, лучшая, единственная... Мы и не заметили, что в какой-то момент наш конкурент поднапрягся и выпустил альтернативный продукт. Он нас в чем-то перегнал, и поэтому нельзя было говорить, что только наша программа умеет все. А рекламу о том, какие мы герои, единственные в своем роде, мы остановить не могли. И все эти полгода они громко кричали, что мы негодяи и всех вводим в заблуждение.

Конкуренция в истеричном режиме не помешала нам заниматься новой версией — той, на которую мы исходно закладывались, но на которую нужно было больше времени. Когда же она вышла, мы провели сравнительное тестирование с продуктом ближайшего конкурента и убедились, что на голову его опередили. С тех пор он уже не мог нас догнать, и мы за год заняли 70—80% рынка. Тогда же, кстати, мы поняли, что отнять оставшиеся 20% гораздо труднее, чем первые 80%, ведь когда ты хочешь выбить соперника с какого-то поля совсем, уровень его сопротивления сильно возрастает.

Мы решили не дожимать здесь, а посмотреть на мировой рынок. Был уже 1995 год. Мы поехали, купили программы, которые продавались за границей, посмотрели, протестировали. Обнаружилось, что в дыму местной конкуренции сделали программу, которая намного лучше всех зарубежных.

И мы активно двинулись на западные рынки, но, поскольку денег еще не было, опирались на местные компании, которые умели торговать на своих рынках. Мы лицензировали свой продукт, а они занимались организацией продаж, рекламой и даже тиражированием, а нам начисляли royalty, которые мы направляли на разработку. Такая стратегия выхода на международный рынок оказалась очень правильной. Сегодня наши офисы в 13 странах — это сильные и довольно самостоятельные единицы. Сейчас 80% дохода ABBYY получает с международного рынка.

Вышли на рынки B2B

Существенное преимущество ABBYY в том, что мы разрабатываем не просто программы, а базовые технологии, на основе которых можно создавать различные решения. Окрыленные успехом FineReader, мы стали внедрять технологии потокового ввода данных на основе нашего FineReader — в российских компаниях, которые оперируют большими объемами документов. Сегодня ABBYY — лидер на этом рынке в России, а всего в мире наши решения применяют около 90 тысяч коммерческих и государственных структур. Но этот бизнес не состоялся бы, не будь мы такими упертыми.

Вспоминается эпизод. Пенсионному фонду РФ из 150 млн заполненных бланков с анкетами: ФИО, паспортные данные, сведения о работе — надо было сформировать базу, чтобы потом по ней выдавать свидетельства соцстраха. Мы убеждали руководителей фонда, что вводить информацию надо при помощи сканера и компьютера. Сделали для них презентацию, а после нее выступил влиятельный чиновник: «Вы нам тут предлагаете использовать программу автоматического распознавания текстов. Но она же делает ошибки. Вы не представляете, насколько важным делом мы здесь занимаемся. Ошибки недопустимы, и поэтому ваше предложение абсурдно». Мы ответили: «Точно. Вы уловили самое главное: прог­рамма делает ошибки, но забыли, что люди их тоже делают. Давайте проведем простой эксперимент. Посадим пять человек, которые будут вколачивать эти анкеты, а рядом поставим сканер и компьютер с программой распознавания. И посмотрим, сколько времени уйдет у людей и у компьютера и сколько ошибок они сделают». Они согласились, и оказалось, что компьютер работает быстрее и делает меньше ошибок, чем профессиональные машинистки.

Наши технологии используют и при проверке ЕГЭ. Как вы понимаете, по ЕГЭ надо примерно за месяц проанализировать десятки миллионов листов. Ошибиться нельзя: если выпускнику выставят неправильную оценку и он не поступит в институт, начнется страшное. Мы выстроили не только программу проверки ответов, но целую систему, благодаря которой легко следить за качеством самой автоматической проверки.

Сегодня наши клиенты в России — Cбербанк, ВТБ, Райффайзенбанк, Альфа-Банк, Allianz, «Транснефть», «МРСК Сибири», ОАО «Востокгазпром», СИБУР и другие. Они обрабатывают финансовые и бухгалтерские документы, обращения клиентов, повышая скорость и качество ввода данных в свои электронные архивы. Но есть и более масштабные задачи. Например, наши технологии распознавания применяются для обработки бланков переписей населения и выборов в Саудовской Аравии, Кувейте, Индии, Туркменистане, ­Таджикистане, а также Греции, Чили, Колумбии и других странах.

Теряли надежду и меняли вектор

Конкуренция в России, а потом выход на зарубежные рынки отвлекли нас от перевода, но мы продолжали думать об этой задаче и внимательно смотрели, как устроены существующие программы — не только в России, но и в мире. Везде применялись довольно упрощенные подходы с невысоким потолком качества. Мы стали присматриваться к научным концепциям и заделам работ и обратили внимание на лингвистический подход. Он основан на полном анализе предложения: от морфологии и синтаксиса переходит к семантике. Разбирает, как слова связаны друг ­с ­другом­, а потом приводит эти слова к понятиям, которые за ними стоят.

И получается некое семантическое дерево, которое универсально, то есть мало зависит от выбранного языка.

Было немало рисков, которые были нам вначале не ясны и требовали исследований. Например, можно ли решить проблему комбинаторного взрыва при анализе, ведь чем длиннее предложение, тем больше, соответственно, количество возможных деревьев. Можно ли погасить этот взрыв? Для начала мы постарались оценить реализуемость разных подходов и концепций и поручили относительно небольшой группе людей выстроить архитектуру всей будущей системы. За несколько лет было подтверждено, что она жизнеспособна, и тогда мы подошли к стадии производства, что означало более масштабное и точное описание языков. В 2006—2007 году мы начали набирать лингвистов и людей из смежных областей под этот проект (его назвали Compreno). Мы были уверены, что этот подход приведет к качественному машинному переводу, который можно использовать в коммерческих целях.

В те же годы свои разработки, основанные на совсем другом, статистическом подходе, начал вести Google, который накопил очень большую базу параллельных текстов (оригинал и перевод). Без такой базы «статистический» перевод построить нельзя, а была она только у Google. ­У­­ ­статистического­ подхода есть существенные ограничения: приемлемое качество перевода получается, только когда у интересующей вас языковой пары есть очень много параллельных текстов. Например, в интернете много англо-русских текстов общей тематики, и их перевод с помощью статистической системы получается вполне пристойным. Но если переходишь в специализированную область, где параллельных текстов меньше, качество перевода падает очень быстро. А если работаешь с непопулярной парой языков, то перевод плох всегда. Русско-немецких переводов в десять раз меньше, чем русско-английских, и поэтому Google, когда переводит с немецкого на русский, делает это в два этапа: сначала c немецкого на английский, а потом с английского на русский. Появляется много смешных ошибок — как в игре в испорченный телефон.

Тем не менее для массового пользователя все это не так важно, ведь Google Translate — бесплатный сервис. И мы поняли, что наша бизнес-логика ломается, так как объем платежеспособного спроса бесплатный аналог выжигает, как напалмом. Даже если ваш продукт лучше, вы не выручите столько денег, сколько нужно для поддержания разработки. Мы проанализировали, сколько еще усилий нам потребуется, чтобы люди захотели платить за нашу программу, имея бесплатный Google Translate, и оказалось, что экономика не срабатывает. Так несколько лет назад мы поняли, что это не самое интересное дело с точки зрения бизнеса. Но мы задумывались над тем, что будет, если переводчик не выстрелит еще раньше. И знали, что положение наше неплохое, потому что наша базовая технология универсальна.

Научились извлекать смысл

Расчет был на то, что если ты подобрался к смыслу, который стоит за словами и буквами, то, конечно, сможешь использовать этот анализ не только для перевода. Объем информации в современных ИТ-системах растет с непостижимой скоростью, и пользоваться ею все труднее. Притом, если работать со структурированной информацией хоть как-то научились, то с неструктурированной (а ее в корпоративных системах около 80%) провал полный. Даже найти документ внутри одной компании довольно сложно, не говоря уж о том, чтобы извлечь или сопоставить разные сведения.

Известные всем поисковики помогают мало. Они используют данные по предыдущим запросам и ранжируют результаты в зависимости от того, на что больше кликали. Это хороший трюк, если тебя интересует то же самое, что большинство людей, но для содержательных исследовательских целей он не срабатывает. Чтобы не утонуть в информации, человечеству придется рано или поздно подняться над статистикой и обратиться к смыслу, стоящему за словами.

Убежденность в этом поддерживала нас все это время. Мы отчетливо видели коммерческую логику в направлении, которое можно назвать управлением знаниями или интеллектуальной обработкой информации. Здесь много разных задач, и одна из простых — автоматическая сор­тировка. Допустим, к вам идут платежки, в которых написано: «оплата по договору номер Х за электроэнергию в апреле», или «плата за подключение мощности Y», или «аванс за Z», и ваши бухгалтеры разносят их постатейно. Почему бы не классифицировать платежи автоматически, сэкономив на ручном труде и ускорив процесс? Наша программа справляется с этим отлично.

Мы ведем пилотный проект с Госдумой: здесь требуется распределить по департаментам обращения граждан. Люди часто адресуют их не тем специалистам, и, чтобы выбрать правильного «ответчика», надо прочитать и понять текст обращения. Технология делает это быстрее. Ее применяют и службы технической поддержки разных компаний. К ним поступает много однотипных запросов, и система, получив и проанализировав письмо клиента, определяет, требует ли вопрос внимания специалиста или ответ уже был когда-то дан и его можно извлечь из базы.

Банкам, чтобы принять решение о выдаче кредита какому-нибудь предприятию, нужно собрать о нем все сведения: от службы судебных приставов, из Высшего арбитражного суда и судов общей юрисдикции, из СМИ и социальных сетей. ИТ-решение умеет извлекать и анализировать разные сведения и тем самым экономит часы, а то и дни рутинной работы и уменьшает финансовые риски банка.

Наше движение от массового рынка в сторону корпоративного совершенно закономерно: как заказчик организация внятно формулирует, что она хочет делать со своей информацией. Рынок B2B гораздо проще понять и занять новой технологией. К тому же на него редко проникают «бесплатники»: они в основном ориентируются на усредненную массу.

Вначале наша Compreno воспринималась, как первые самолеты. Люди видели волшебство, но сообразить, что это будущий бизнес, могли не все. Этажерка братьев Райт тоже не выглядела как бизнес, но история показывает, что, если что-то взлетает, оно постепенно собирает всю нужную инфраструктуру. Сейчас у нас в России более 25 пилотных проектов. Перспективы и задачи бизнеса понятны.

У истоков компании стояли выпускники Московского физико-технического института, и наша альма-матер дала нам способность и желание самостоятельно учиться, ставить большие задачи и решать их. Для любой ИТ-компании самое важное — это люди. Наши сотрудники особенные, работа требует от них не только серьезных знаний и терпения, но и готовности к марафонским забегам. Руководить ими, используя директивные методы, просто невозможно. Эти люди должны верить в идеи компании и в ее лидеров. У нас работают инженеры такого уровня, что их надо занимать нестандартными сложными задачами; именно это их мотивирует. Этих людей нельзя использовать, чтобы производить, скажем, базы данных: они заскучают и разбегутся. А этого как раз допустить нельзя.

Выбирая, чем заниматься дальше, мы смотрим, что способно вырасти в нечто очень большое. Наша история причудлива, но нам удалось создать прочную компанию. Текущий бизнес подрастает на 10­—15% в год, растет и уровень прибыльности. Мы могли бы просто наслаждаться ею, но нам это неинтересно: мы можем себе позволить инвестировать в разработки и стремимся быть первыми.