Здравствуйте! Если у вас возникли какие-либо вопросы или пожелания по сайту, напишите нам.

Ваше имя:

E-Mail адрес:

Тема сообщения:

Текст сообщения:

Вы так-же можете написать письмо на адрес a.fadeev@speereo.com

Скидка 50% на Speaky

НОВОСТИ
Подключаем Speaky к системе управления освещением.
Подключаем контроллер z-wave Vera Lite. Накладки на розетки TKB.
Читать далее >>
Речевые интерфейсы Speereo
Статья "Речевые интерфейсы Speereo" в февральском номере журнала Control Engineereing Russia
Читать далее >>
Speereo начинает продажи речевого пульта Speaky
Российская компаний Speereo завершила работы над речевым пультом SPEAKY и произвела первую партию устройств.
Читать далее >>

Технология распознавания речи SPEEREO

Технология распознавания речи Speereo изначально создавалась для использования в интерфейсах к различной технике. Эта задача предъявляет особые требования к технологии:

  • Высокая точность распознавания.
  • Сравнительно небольшое количество командных фраз, имеющих смысл в каждый момент времени. Мы оцениваем это количество в 10 000 фраз по сравнению с полумиллионом в системах интернет-поиска или диктовки.
  • Высокая скорость обработки. Желательно, чтобы команда распознавалась практически сразу, без задержек более 1,5 секунд.
  • Высокая устойчивость к шумам. Система должна работать с высокой точностью при стандартных бытовых шумах, а не только в полной тишине.

Наша компания добилась успеха в создании такой системы.

Точность. Самая высокая в мире для этого класса задач. В диапазоне 97-99,9%. То есть до одной ошибки на тысячу команд.

тест Google Nuance Speereo
Короткие слова. Использовался цифровой словарь (цифры от 0 до 9 + слово "clear") всего произнесений 1542, английский язык база записей Intel. Разные условия и уровень шумов SNR 5-30. 51% 64,8% 99,2%
Короткие слова. Числовой словарь. 11 уникальных слов, включая невнятные произнесения. Русский язык. 84% - 98,5%
Командные фразы. 600 фраз, 70 дикторов. Язык английский 62% 64% 99,9%

При использовании ASR Google, Nuance, Apple в задачах диктовки и интернет-поиска невысокое качество распознавания маскируется с помощью мощных систем статистической и семантической постобработки. Однако, непосредственно в задачах управления техникой такие системы неприменимы. Именно поэтому нет речевых универсальных пультов от этих компаний. Мы – единственные, кто может на сегодня реализовать эту идею с высоким качеством.

Общий словарь нашей системы неограничен. Это значит, что системы с большим, но фиксированным словарем (Google, Nuance, Apple), всё же могут «не знать» определенные слова или имена собственные. Наша система включает в себя автоматический транскриптор, то есть можно вносить в неё новые слова «на лету», без участия разработчика. Практика показывает, что динамический словарь в 10 000 уникальных для каждого пользователя фраз для задач управления - более чем достаточное решение. В процессе использования большим количеством пользователей, выбранные ими фразы накапливаются и создают базу данных для новых апдейтов системы. Со временем это приведет к тому, что все возможные командные фразы для бытовой техники будут входить в доступный для всех массив. И тогда получится «SIRI для бытовой техники», только работающая с меньшим количеством ошибок.

Скорость работы нашего решения полностью удовлетворяет условиям. Распознавание начинается уже в тот момент, когда пользователь еще говорит команду. Умение российских программистов создавать эффективный код, а не решать задачи «грубой силой» давно всем известно. Для пользователей это выливается в минимизацию стоимости поддержки серверов «облака».

Устойчивость системы к шумам наглядно демонстрирует таблица.

SNR (db) 0 10 15 20 25 >50
Точность (%) 98,2 98,4 98,3 98,6 98,7 99,2

SNR – соотношение сигнал/шум, чем этот показатель ниже – тем шумнее.

Резюмируя, можно сказать, что система распознавания речи Speereo намного лучше подходит для речевого управления, чем системы от известных мировых корпораций.