При словах “голосовое управление” воображение обычно рисует диалог с машиной, будь то компьютер или мобильный телефон. Знак равенства между такими разными, на первый взгляд, устройствами в данном случае оправдан, так как оба они — цифровые и оба сегодня не могут распознавать речь. Полноценный диалог с машиной пока невозможен. Ни один компьютер не поймет ваши команды, оформленные так, как их отдают живому секретарю: “А найди-ка мне, уважаемый, номер телефона Петра… черт… фамилию забыл: то ли Смирнов, то ли Симаков? Номер должен на “девятку” начинаться, если я ничего не путаю…”.
Мощность имеющихся процессоров — даже могучих “числодробилок” Intel Pentium 4, не говоря уже о менее мощных чипах, используемых в мобильных телефонах, недостаточна для распознавания голоса в реальном времени. Пока не существует и эффективных алгоритмов распознавания голоса. Более того, некоторые аналитики считают, что такие и не могут быть созданы. Проблема тут не столько в сложностях многочисленных вариантов произношения, акцента, сленга, сколько в построении фраз. Большинство людей строит разговорную речь несколько неправильно. Правильно это делают лишь говорящие на неродном языке… Но и это еще не все: слишком много информации оказывается “между строк”, понимается из контекста. Как, например, формализовать распознавание логического ударения в вопросе: “Пионеры сегодня пойдут в поход?” Ведь каждый человек может произнести эту фразу так, чтобы она означала пять (!) различных вопросов: “ПИОНЕРЫ сегодня пойдут в поход?”, “Пионеры СЕГОДНЯ пойдут в поход?” и так далее. Значительную часть нечетко поставленных задач — аналогичных нарисованной в классической чеховской “Лошадиной фамилии” — компьютеры решать в принципе не в состоянии.
Тем не менее голосовое управление компьютером возможно, причем в мобильных телефонах оно применяется чаще, чем на настольных системах и в ноутбуках.
Продолжение следует…