Цифровой журнал «Компьютерра» 2013 № 07 (160) - страница 7

стр.

Если коротко, то суть подхода ABBYY к решению вопроса сводится к дистанционному делегированию услуг. Выглядит это следующим образом:

1) Мы фотографируем встроенной в айфон камерой любой текстовых документ:


Очень удобный момент: электронную кнопку затвора можно нажимать сколько угодно раз — FineReader Touch автоматически добавляет всё новые и новые страницы до тех пор, пока вы не дадите программе понять, что съемка завершена. Это очень удобно, скажем, в ситуации, когда вы заглянули в книжный магазин, зачитались журнальной статьей (или книгой :) и решили отложить чтение, либо просто сохранить текст в электронном виде. В этом случае вы фотографируете нужные страницы и сохраняете их в FineReader Touch.

2) Проводим предварительную обработку изображения (ротация и обрезка):


Обратите внимание: изображения в техническом отношении очень сложные. FineReader Touch автоматически пытается поймать верную проекцию изображения, учитывая оптическое искажение. После обрезки видно, что «рыбий глаз» сильный и движку OCR придется серьезно попотеть.


3) Нажимаем кнопку «Распознать» и программа FineReader Touch … отсылает изображения на специальный сервер ABBYY!


Да, я понимаю ваше разочарование: подлинного чуда не происходит — могучее железо айфона не задействуется для непосредственного распознания текстовой графики и волшебной придачи ему оцифрованного вида. Зато происходит чудо поменьше: наша задача так или иначе выполняется, причем с минимальной для конечного пользователя головной болью!

Вспомните, сколько времени у нас уходило для OCR в программе FineReader! Сколько кнопочек приходилось нажимать, сколько настроек подкручивать, сколько исправлений вносить в выданный компьютером результат. Делегируя услуги на сервер ABBYY, мы экономим уйму времени. При условии, разумеется, что полученный с сервера результат окажется как минимум пристойным (а как максимум — безупречным).

Сервер ABBYY вернул обработанный и распознанный документ через четыре минуты. Следить за окончанием работы не обязательно: отчет о результате поступит в приложение в принудительном режиме, а результат распознавание будет безвозмездно храниться на сервере 14 дней:


Обратите внимание на изменение цифры «баланса» — было 97, стало 94. FineReader Touch изначально позволяет бесплатно распознать 100 страниц текста. После исчерпания лимита, вы пополняете баланс, докупая пакеты по 100 страниц.

Поглядим теперь на распознание текста из нашего примера (программа выдает результат в формате DOCX):


Тот же текст, открытый в читалке GoodReader:


Общее впечатление: один в один «сырой вариант» после обработки стационарным FineReader’ом, после которого текст доводится до ума уже ручками. В мобильных условиях fine tuning выполняется в любом редакторе, установленном на смартфоне:


По гамбургскому счету полностью автономное приложение для распознавания текста на смартфоне в функциональном отношении было бы предпочтительнее. Но это лишь в том случае, если для вас работа с OCR является важным элементом жизни (профессии). При возникновении потребности в распознании текста от случая к случаю вариант с делегированием услуг серверу, реализованный ABBYY в FineReader Touch, явно предпочтительнее. И для пользователя, и — уж подавно! — для разработчика, поскольку встроенные продажи 100-страничных пакетов распознавания открывает приятный канал для денежных поступлений.

Подводим теперь итоги нашей лингвистической викторины. Сложность с определением языка в квизе, на мой взгляд, заключалась только в деталях. То, что перед нами язык скандинавской группы, видно было невооруженным глазом. Тем удивительнее взятые с неведомого потолка версии вроде венгерского, африкаанс, баскский и т.п.

Итак, язык в клипе — фарерский (føroyskt), на котором разговаривает народ-душегуб с Фарерских островов (если кто-то забыл про ту мою «Голубятню» — напоминаю: «Grindadrap«). Кстати, за четыре года после откровения китовых бойнь к моим познаниям прибавилось еще много показательного из жизни последних варваров Европы. Любимое лакомство бесов — овечья голова (жрут глаза, мозги и щеки). Воспитание будущих менгеле начинают с раннего детства («За неделю до нашего приезда, двенадцатилетняя дочь Биргира привела в класс живую овцу, прямо в классе убила её при помощи специального пневматического пистолета и в классе же выпотрошила. Остальные дети помогали ей по мере сил: на Фарерах это никого не шокирует» — из