$ 00,00
€ 00,00

Test-drive: Сканирующий маркер C-Pen 600mx -ручка, которая читает

7 мая 2012

История

История этого занятного устройства началась с того, что один из отцов-основателей фирмы-изготовителя (кстати, я рассказываю историю с его слов), будучи студентом, осознал, что надо бы как-то ускорить процесс подготовки выписок из литературы. Книги из университетской библиотеки домой не давали, поэтому просто сосканировать текст было невозможно. Помечтав, студент снова принялся переписывать текст из книги и курсовой проект, наверное, так и сдал в виде рукописи. Потом студент понял, что среди его сокурсников есть много таких, кто тоже предпочел бы ускорить столь утомительную процедуру, и осознал, что это — пусть и небольшой, но перспективный рынок. Посчитав расходы и оценив доходы, практичный студент принялся разрабатывать модель и искать инвесторов.

Инвесторы прониклись идеей, и была создана компания C Technologies, которая приступила к разработке «сканирующей ручки», названной C-Pen.

Мое знакомство с этим «маркером» началось с того, что некоторое время назад возникла необходимость перенести в суперпортативный ПК Psion Series 5mx коллекцию визитных карточек. Карточек было много — более 1 тыс., примерно поровну русских и английских. После того как в адресную книгу был «вбит» первый десяток, появилась мысль, что к тому моменту, когда титанический труд будет закончен, информация полностью устареет. Начались поиски методов, которые позволили бы ускорить процедуру. Сначала был сканер, на котором визитки раскладывались, сканировались и передавались в пакет ABBYY FineReader, однако проблемы это не решило — из-за дизайнерских изысков приходилось вручную контролировать корректность распознавания, иногда (качество распознавания у FineReader как-никак достаточно высокое) исправлять и вручную переносить в поля базы данных адресов. Я сдался на первой сотне и, в общем, бросил эту затею в принципе. Новую информацию вводил сразу в Psion Series 5mx, а с собой носил барсетку, забитую визитками. Потом попробовал «сканирующий переводчик» Quicktionary, который позволял отсканировать слово и перевести его. Несмотря на достаточно мощный словарь, проблемы этот предмет тоже не решил. Quicktionary не позволял передавать информацию во внешний мир (только посмотреть перевод сосканированного слова), однако база данных переводов английских фамилий мне была не нужна.

Потом (по-моему, на одном из «Комтеков») в руки попался C-Pen 200. Не питая особенных иллюзий, я тем не менее решил попробовать использовать его, предполагая при необходимости поручить сканирование визиток знакомой (обучать ее работе с FineReader не было ни времени, ни желания). Однако затем, развлекаясь с новой игрушкой, за полдня я обработал около сотни визиток, причем без каких-либо заметных усилий… Остальное потом ввела упомянутая знакомая. Правда, «запихать» в ПК с помощью C-Pen 200 удалось только английские карточки — русского та модель не понимала.

Коллекция визиток была «добита» в январе этого года, когда появилась «русская» модель C-Pen — 600mx. Главное ее преимущество — возможность работы с кириллицей, в принципе,это специальная модификация C-Pen, созданная специально для восточноевропейских стран и их постоянных проблем с национальными языками. Меня, по понятным причинам, интересовал русский (проект C-Pen 600mx начался года полтора назад, когда ABBYY и C Technologies начали разработку специальной версии пакета FineReader).

173950C-Pen изнутри

С технической точки зрения, C-Pen представляет собой миниатюрный ПК, оснащенный сенсором, который фиксирует изображение строки. Роль «сканера» играет цифровой микрофотоаппарат, для распознавания используется специальная версия пакета FineReader. Когда пользователь «протягивает» C-Pen по строке, цифровая камера фиксирует изображение (100 кадр/с), затем из отснятых кусочков в памяти C-Pen создается графическое изображение строки и начинается процедура распознавания. Метод, на первый взгляд, странный, но эффективный — в отличие от Quicktionary, где для сканирования надо провести по строке роликом, C-Pen работает быстрее, при этом можно сканировать, даже не дотрагиваясь до поверхности бумаги (для визиток это, в общем, не имеет значения, но для сканирования книг иногда очень даже нужно).

В модели C-Pen 600mx применяется процессор StrongArm/100 МГц (этот процессор, кстати, сегодня используется во многих суперпортативных изделиях, поскольку обеспечивает оптимальное соотношение мощности и энергопотребления), 512-кбайт ОЗУ, 8-Мбайт флэш-памяти, графический дисплей (168×33 пикс.), ИК- и последовательный порт.

Номинальная скорость сканирования C-Pen составляет 15 см/с, скорость считывания информации несколько ниже. С учетом пауз, в течение которых происходит распознавание, она снижается до 8-10 см/c, а когда пользователь неудачно отсканировал текст (дрогнула рука, отвлекся и проч.), система распознавания пытается распознавать текст довольно долго, до 10-30 с. Сканируя текст, нужно помнить, что интересующая строка должна быть точно посередине сенсора C-Pen, причем, разумно поэкспериментировав, сделать на «острие» маркера контрольный штрих, который позволил бы правильно позиционировать сканер. Однако навыки работы с C-Pen появляются примерно через 10 минут работы.

55451253835Сканер

«Маркер» позволяет считывать текст размером 5 до 22 пунктов, с разными начертаниями (полужирный, курсив, комбинации). Собственно, сканирование визитных карточек, как оказалось, — очень жесткий тест, поскольку двух одинаковых (когда речь идет о разных компаниях) среди них нет. Мы отметили только одну проблему — малоконтрастные тексты распознаются заметно хуже, иногда приходится по нескольку раз сканировать одну и ту же строку, чтобы добиться результата. Можно переключить режим сканирования с «позитивного» на инверсный, чтобы считывать, соответственно, светлые символы на темном фоне — правда, странно, что C-Pen не учитывает это без вмешательства пользователя.

При сканировании текстов с книг проблем не возникает никаких. Работать можно в одном из трех режимов — «непрерывно» (сканирование, пока пользователь не отпустит триггер или не обнаружится пустое белое поле, которое маркер принимает за конец строки). В режиме «считывания строк» маркер игнорирует пустые промежутки, в режиме «табличного сканирования» считывается строка в предположении, что она представляет собой строку таблицы, причем линии разделения распознаются в виде символов псевдографики.

Кроме того, C-Pen позволяет вводить текст, рисуя символы на бумаге. Нарисованный символ передается подсистеме рукописного ввода и преобразуется в букву, что позволяет, например, изменять имена файлов или редактировать тексты. Правда, эта подсистема нерусифицирована.

Для управления используются кнопки активации сканера, Esc, специальный роликовый манипулятор (нажатие которого играет роль клавиши Enter, а поворот — клавиш управления курсором).

На экран C-Pen выводится строка пиктограмм, каждая из них предоставляет доступ к конкретным функциям. Методы работы вполне интуитивны, интерфейс полностью переведен на русский язык, для сканирования нажимается триггер (кнопка на передней панели C-Pen), неправильно распознанный блок текста можно стереть нажатием клавиши Esc, если просто продолжить сканирование, то новый текст добавится в конец. Кроме основных функций, в «маркере» предусматривается и некоторое количество дополнительных программ, например, C-Direct (связь с ПК) и C-Dictionary («сканирующий словарь»).

C-Direct (как раз та программа, благодаря которой удалось быстро ввести информацию с россыпи визиток) позволяет C-Pen пересылать распознанный текст сразу в ПК, причем так, что он появляется в любой программе Windows. Соответственно, метод сканирования адресной книги был прост: ставим курсор в поле ввода, считываем данные, повторяем процесс.

d_5601Словарь

«Русский» C-Dictionary представляет собой программу-оболочку для словарных баз ABBYY, использованных в словаре Lingvo. Идея проста и понятна — пользователь сканирует интересующее его слово, «маркер» распознает его, превращая в текст, однако вместо того чтобы сразу показать слово пользователю, результаты распознавания передаются в словарь. На экране появляется не то слово, которое было распознано, а его перевод. Когда пользователь сканирует не одно слово, а предложение, то предлагается выбрать конкретное слово, которое потом и ищется в словаре.

Правда, заметим, что шаг, который стал бы логичным продолжением этой идеи, — интеграция не только словаря, но и программы автоматического перевода (сразу переводить строку) — так и не был сделан. Это можно понять, поскольку памяти (даже 8 Мбайт) для того, чтобы инсталлировать систему распознавания текстов, словарь и переводчик, в общем, маловато. Тем более что пользователю из этих 8 Мбайт предоставлен только 1 Мбайт.

Как бы то ни было, словарь полезен. Правда, как и многие другие словари, он рассчитан на наиболее используемые термины. Это стандартная проблема, мало кто из разработчиков словарей понимает, что пользователям суперпортативных устройств нужен не столько перевод общеупотребительных терминов, сколько переводы менее распространенных терминов — в словарь «лезут» только тогда, когда пользователь не может припомнить забытое слово.

Словарная база «микроLingvo» составляет 62 тыс. англо-русских словарных статей и более 50 тыс. русско-английских, онa занимает 4 Мбайт памяти — рекорд по плотности упаковки слов, принадлежащий русско-английскому словарю Paragon Software «СловоЕд» (100 тыс. статей, примерно по 50 тыс. для каждого направления, «втиснутых» в 640 кбайт памяти), не превзойден.

Предусматривается возможность инсталлировать толковые словари (на web-узле компании предлагается Webster), пока русских среди них нет, но и англоязычные могут быть интересны — просмотрев толкования незнакомого слова, при некотором знакомстве с английским языком можно понять его даже без русско-английского словаря (по правде сказать, знание иных значений привычного термина иногда много полезнее, нежели знание пусть и точного, но одного перевода — в переговорах это иногда просто неоценимо).

Тексты, распознанные C-Pen, можно передавать по инфракрасному или последовательному порту, используя пакет C-Win (в комплекте). После его инсталляции на «рабочем столе» Windows появляется пиктограмма C-Pen, работать с содержимым «маркера» можно, просто «перетаскивая» файлы с «псевдодиска» My C-Pen в окне Windows Explorer на дисковые накопители. Пакет совместим с Windows ME и Windows 2000, причем предусматривается работа не только со стандартными протоколами инфракрасной связи Windows, но и с фирменными, которые гарантированно работают с C-Pen.

В комплект поставки входят C-Pen 600mx, кабель, компакт-диск и инструкция. Изделие работает от батарей AAA, «3-4 недели в режиме нормального использования», причем, поскольку тексты записываются в энергонезависимую память, пользователь не рискует потерять данные при отключении питания.

К сожалению, в «русской» модели нет программы C-Address, которая позволяет считывать информацию в интегрированную адресную книгу C-Pen. Кроме того, можно пожелать увеличения скорости. Несмотря на то, что пользователь C-Pen может работать с вполне приличным «быстродействием», скорость лишней не бывает. Кроме того, работать было бы приятнее, когда можно сканировать строку, не дожидаясь результатов распознавания предыдущей, а результаты неплохо бы размещать на плате памяти, например, MemoryStick. Можно пожелать и функцию сканирования картинок (как картинок), например, для считывания схем или логотипов на визитках, режим, когда сканируется по строкам большое изображение, потом эти кусочки собираются в одну картинку, и система распознавания текста работает уже с ней — это позволит сканировать большие (более 22 пунктов) тексты. Кроме того, неплохо бы предусмотреть возможность не только вводить с помощью C-Pen текст, но и рисовать…

Итог

Впрочем, размечтались мы прямо-таки неприлично… Это несколько специализированное, однако крайне интересное изделие, цена которого вполне разумна. Жалко, что «маркер» C-Pen 600mx появился только в январе — я бы не мучился с поиском подарка на Новый год. «Сканирующий маркер» C-Pen 600mx

Реальная розничная цена: 260 долл.

В Москве: Galaxy Computers, (095) 243-1635, тел./факс (095) 243-2063;

е-mail: bmv@aha.ru; www.c-en.ru.

Похожие новости