Аудиотекс или телефонные интерактивные службы
Голосовая телефонная служба может рассматриваться как система телематики, где пользователь ведет диалог через телефон с “голосовой машиной”, способной принимать, передавать и обрабатывать звуковую информацию. Рассматривая далее эту технологию, в ней мы увидим нюансы, которые позволяют ее характеризовать как “голосовую телематику” или “аудиотекс”.
Аудиотекс не является чем-то очень новым. Говорящие часы или телефонный будильник — вот конкретные виды аудиотекса, весьма старые, чтобы кого-либо ими можно было удивить. Но сегодня аудиотекс имеет гораздо больше возможностей, чем 10-15 лет назад. Приведем один пример. В 1995 году по телефону жители Франции наговорили с различными компьютерами более 20 миллионов часов.
Причем Франция начала использовать аудиотекс с опозданием: он более развит в англосаксонских странах. Франс Телеком долгое время помогал развиваться видиотексу, не давая при этом другим телематическим медиа конкурировать с ним.
Как функционирует голосовая телефонная служба?
Технически аудиотекс состоит из голосового сервера, как правило, интерактивного, соединенного с сетями телекоммуникаций. Голосовой сервер способен передавать звуковые послания либо предварительно записанные, либо созданные в процессе голосового синтеза, в индивидуальной манере и большому количеству потребителей одновременно. Компьютер может управляться с помощью клавиатуры телефона или даже голосом.
В широком смысле, в понятие аудиотекс можно включать и иные способы использования телефонных технологий, имеющих связь с сервером: автоматическую передачу вызова, службы факса и т.д. И это не будет преувеличением: голосовой сервер может встраиваться в систему телекоммуникаций предприятий для того, чтобы, например, принимать сообщения пользователей и передавать вызов конкретному оператору, принимать персональные сообщения и т.д. Голосовой сервер — это разумная машина, состоящая либо из компьютера, способного принимать голосовые сообщения, которые поступают по линиям связи; распознавать голос или воспринимать сигналы от кнопок телефона, соответственно голосом отвечать, либо из усовершенствованного автокоммуникатора, имеющего программу, позволяющую выполнять команды, и жесткий диск, предназначенный для цифровой записи звуковых сообщений.
|
Запись и возвращение звука. Голосовой синтез, который имеет ввиду превращение в искусственный голос письменных текстов, на сегодня еще очень мало используется в аудиотексе и не предназначается для массового потребителя: несмотря на большой прогресс в этой области, ответ получается не всегда точным, понятным, не считая того, что еще практически невозможно синтезировать красивый женский или мужской голос. Для ответа потребителям звук предварительно записывается, как правило, в цифровой форме и затем преобразуется в аналоговый сигнал. Запись может осуществляться в обычных условиях, даже по телефону. Но запись в студии, осуществленная профессиональными дикторами, остается предпочтительной, особенно если нужно гарантировать естественность и использовать в максимальной мере человеческий характер аудиотекса.
При необходимости ответ потребителю может быть прямым. При этом используются либо полностью записанные стандартные ответы, либо они составляются по определенной программе, но компьютер ведет диалог с помощью отдельных частей (фраз), предварительно записанных. Эти программы могут использоваться для сообщения цифр (например, состояние банковского счета), дат или времени (говорящие часы) и т.д. Соединение отдельных частей должно быть осуществлено с предельной точностью и быстротой, чтобы гарантировать естественный ответ, несмотря на операцию соединения, проводимую компьютером.
|
Факт записи и передачи звуковых сообщений по технологии аудиотекса остается более дорогим, чем его аналог по видеотексу. Одна секунда звука представляет собой объем записи и передачи в 32000 бит/с, тогда как видеотекс начинал работать со скоростью 1200 бит/с, в 24 раза медленней. И если говорить об эквивалентном числе одновременных пользователей, то возможность обрабатывать сигнал у сервера аудиотекса должна быть намного выше, чем у сервера видеотекса.
В 1993 году средняя плата видеотекса в компьютере позволяла вести диалог одновременно с 64 пользователями, а средняя звуковая карта не более, чем с 8. Однако с развитием компьютерных технологий эта разница быстро стиралась. Сегодня, когда компьютерные сети используются для передачи не только текстов, но и звука, изображений и видео, т.е. стали мультимедийными, возможности аудиотекса и видеотекса взаимодополняются.
Виды интерактивности
Многие конкретные службы аудиотекса не могут вести настоящий интерактивный диалог с пользователем. В своей массе они просто содержат предварительно записанные сообщения, которые передаются потребителю после набора определенного количества цифр на клавиатуре телефона. Но интерактивные системы все более и более развиваются и уже заняли весьма значительный сектор данного рынка информационных услуг.
|
Развитие аудиотекса во многом определяется системой телефонной связи, которая существует в той или иной стране. Если в странах Западной Европы и Северной Америки телефонные сети имеют высокий технологический уровень, то наша страна остается на весьма скромном месте в мире. Сравним эти цифры: в 1994 году на 100 жителей в США приходилось 60 телефонных аппаратов, в Швеции — 70, Германии — 50, России — 16,2, Польше — 13,1, Индии — 1,1. Очевидно, что до уровня развитых стран мира нам необходимо как минимум утроить количество телефонов на душу населения. Но наличие телефонного аппарата само по себе не решает проблему. В Беларуси большинство телефонных станций работает по принципу импульсного сигнала, точность соединения при этом не превышает 80-85%. Если вы набираете длинный номер, 10-15 цифр, то вероятность ошибки еще более возрастает, что не позволяет вести действительно интерактивный диалог с сервером и искать необходимую информацию. Кроме того, до сих пор во многих домах, на предприятиях и учреждениях телефонные аппараты имеют не кнопки, а барабан для набора номера. В таких телефонах, как правило, отсутствуют кнопки повторного набора номера, автодозвона и т.д., которые используются при получении услуг аудиотекса.
В развитых странах “барабанные” телефоны практически не используются. Переход от “импульсного” к “тоновому” (или “частотному”) набору номера здесь произошел в 70-80 годы. На некоторых АТС и в нашей стране уже используется эта технология. Когда при наборе номера телефона в трубке звучат звуки, похожие на ноты, то вы пользуетесь современной технологией. Если же раздается потрескивание-постукивание, то технология остается традиционной.
Используется и иная технология управления сервером — голосовая. Сервер распознает команды — ключевые слова, произнесенные пользователем и соответственно на них реагирует. Но если эта технология хороша для отдельных ключевых слов (более 95% точности), то для настоящего диалога она еще не готова. Сервер пока не “умеет” понимать сложные фразы (“Я хотел бы, если это возможно, узнать состояние моего депозитного счета”).
В принципе, уже сегодня технологически это реально. Но компьютер можно обучить “реагировать” на голос конкретного пользователя. Но если у банка десятки тысяч клиентов, то подобное маловероятно. Кроме того, очень часто иностранный акцент, дефект речи пользователя становятся непреодолимой преградой для машины. Исследователи рассчитывают, что через 5-6 лет эти чисто технологические проблемы будут решены и аудиотекс еще более закрепит свои позиции на информационном рынке.