Для взаимодействия с приложениями «1С:Предприятия» пользователи могут применять не только визуальный графический интерфейс (формы, кнопки, графики, отчеты), но и интерфейс, основанный на человеческой речи. Вводить информацию в приложение можно голосом, а результат получать в виде звукового сообщения.
Таким образом работу с речью можно разделить на две части: распознавание речи и ее синтез.
Распознавание речи — это процесс автоматического преобразования человеческой речи (как звукового сигнала) в текстовые данные. Распознавание речи может использоваться, например, для ввода информации в текстовое поле или для расшифровки записей разговоров службы поддержки для упрощения контроля качества и разбора конфликтных ситуаций.
Также, например, можно разместить в почтовом приложении на форме письма кнопку, при нажатии на которую активируется распознавание речи, и тогда текст письма можно надиктовать голосом. Аналогичным образом можно заполнять, например, и адресатов письма.
Распознавание речи может выполняться как в потоковом варианте (с микрофона в реальном режиме времени), так и в режиме «офлайн» (в этом случае для распознавания используется файл с записанной речью). Распознавание речи возможно как в локальном варианте (на компьютере пользователя, без соединения с интернетом), так и с использованием облачного сервиса фирмы «1С».
Подробнее об облачном сервисе «1С:Распознавание речи» читайте здесь.
С помощью синтеза речи в приложениях 1С можно создать речь из заданного текста, воспроизвести ее или сохранить в .wav-файл. Воспроизведение речи начинается с минимальной задержкой, без ожидания, пока текст синтезируется до конца. Платформа синтезирует речь, используя облачный сервис 1С. Можно выбрать голос из коллекции голосов, доступных на сервере.
Это позволяет поддерживать множество сценариев работы, например:
Подробнее об облачном сервисе «1С:Синтез речи» читайте здесь.