При словах «голосовое управление» воображение обычно рисует диалог с машиной, будь то компьютер или мобильный телефон. Знак равенства между такими разными, на первый взгляд, устройствами в данном случае оправдан, так как оба они — цифровые и оба сегодня не могут распознавать речь. Полноценный диалог с машиной пока невозможен. Ни один компьютер не поймет ваши команды, оформленные так, как их отдают живому секретарю: «А найди-ка мне, уважаемый, номер телефона Петра… черт… фамилию забыл: то ли Смирнов, то ли Симаков? Номер должен на «девятку» начинаться, если я ничего не путаю…».
Мощность имеющихся процессоров — даже могучих «числодробилок» Intel Pentium 4, не говоря уже о менее мощных чипах, используемых в мобильных телефонах, недостаточна для распознавания голоса в реальном времени. Пока не существует и эффективных алгоритмов распознавания голоса. Более того, некоторые аналитики считают, что такие и не могут быть созданы. Проблема тут не столько в сложностях многочисленных вариантов произношения, акцента, сленга, сколько в построении фраз. Большинство людей строит разговорную речь несколько неправильно. Правильно это делают лишь говорящие на неродном языке… Но и это еще не все: слишком много информации оказывается «между строк», понимается из контекста. Как, например, формализовать распознавание логического ударения в вопросе: «Пионеры сегодня пойдут в поход?» Ведь каждый человек может произнести эту фразу так, чтобы она означала пять (!) различных вопросов: «ПИОНЕРЫ сегодня пойдут в поход?», «Пионеры СЕГОДНЯ пойдут в поход?» и так далее. Значительную часть нечетко поставленных задач — аналогичных нарисованной в классической чеховской «Лошадиной фамилии» — компьютеры решать в принципе не в состоянии.
Тем не менее голосовое управление компьютером возможно, причем в мобильных телефонах оно применяется чаще, чем на настольных системах и в ноутбуках.
Продолжение следует…