1С:Предприятие 8
Система программ
Архитектура платформы 1С:Предприятие
(версия 8.3.25)

Работа с речью

Для взаимодействия с приложениями «1С:Предприятия» пользователи могут применять не только визуальный графический интерфейс (формы, кнопки, графики, отчеты), но и интерфейс, основанный на человеческой речи. Вводить информацию в приложение можно голосом, а результат получать в виде звукового сообщения.

Таким образом работу с речью можно разделить на две части: распознавание речи и ее генерация.

Распознавание речи

Реализовано в версии 8.3.23

Распознавание речи — это процесс автоматического преобразования человеческой речи (как звукового сигнала) в текстовые данные. Распознавание речи может использоваться, например, для ввода информации в текстовое поле или для расшифровки записей разговоров службы поддержки для упрощения контроля качества и разбора конфликтных ситуаций.

Также, например, можно разместить в почтовом приложении на форме письма кнопку, при нажатии на которую активируется распознавание речи, и тогда текст письма можно надиктовать голосом. Аналогичным образом можно заполнять, например, и адресатов письма.

Распознавание речи может выполняться как в потоковом варианте (с микрофона в реальном режиме времени), так и в режиме «офлайн» (в этом случае для распознавания используется файл с записанной речью). Распознавание речи возможно как в локальном варианте (на компьютере пользователя, без соединения с интернетом), так и с использованием облачного сервиса фирмы «1С».

Генерация речи

Реализовано в версии 8.3.25

С помощью генерации речи в приложениях 1С можно синтезировать речь из заданного текста, воспроизвести ее или сохранить в .wav-файл. Воспроизведение речи начинается с минимальной задержкой, без ожидания, пока текст синтезируется до конца. Платформа генерирует речь, используя облачный сервис 1С. Можно выбрать голос из коллекции голосов, доступных на сервере.

Это позволяет поддерживать множество сценариев работы, например:

  • Складской рабочий или монтажник работает с наушником и микрофоном;
  • Клиент магазина взаимодействует с «говорящим» кассовым оборудованием;
  • Система «зачитывает» отправителя и тему пришедшего письма и, если пользователь скажет «Прочесть», «зачитывает» текст письма целиком;
  • Можно создавать полноценные голосовые ассистенты, голосовое управление приложением, интерактивное заполнение форм (например, врачом при осмотре пациента).