Системы распознавания голоса

← →
stas © (2008-12-11 09:50) [0]

Никогда не сталкивался. т.к. считал их бесполезными.
А тут вот интересуются насколько мощная система от майкрософт SAPI.
Подскажите кто сталкивался:
-принцип работы
-Нужно ли ее обучать (насколько мне известно то эти системы все обучаются конкретному голосу)
-Есть ли смысл в использовании
-Есть ли альтернатива SAPI

← →
DVM © (2008-12-11 10:43) [1]

> stas ©

Не фига они не работают. Замумукаешься учить.

← →
Ega23 © (2008-12-11 10:54) [2]

> -принцип работы

Погугли. Наверняка, как-нибудь также, как распознавание лиц: 40 точек на фотографии, строится некая система векторов (уже не помню название).
Так же и с голосом, только не фотография а АЧХ какая-нибудь берётся.

> -Есть ли смысл в использовании

Ненадёжно. Самый простой тест: научить систему своему голосу. Потом записать его на (блин, по старой привычке магнитофон хотел сказать. А их-то уже и фиг найдёшь... :) ) диктофон, а потом с диктофона отдай команду.

← →
Юрий Зотов © (2008-12-11 10:55) [3]

Была такая буржуйская программа "Dragon", в русском варианте - "Горыныч". Учил я ее своему голосу, учил... учил... учил... пока не понял, что не зря она так называется.

← →
DVM © (2008-12-11 11:03) [4]

> Учил я ее своему голосу, учил... учил... учил...

я тоже учил :) особых успехов в обучении она не достигла у меня

← →
KSergey © (2008-12-11 12:16) [5]

знавал парня (ну просто давно это было), который хорошо отзывался о "Горыныче".
По его словам основную ошибку, которую делают при обучении - произношение (дикция, интонация, четкость, паузы, громкость и т.д.) разительно отличаются от тех, которыми потом наговаривают текст. Т.е. важно при обучении "не выпендриваться" и не стараться, говорить как при обычном разговоре. Ну либо при задиктовке - так же четко, громко и т.д.

← →
stas © (2008-12-11 13:49) [6]

Ясно спасибо. Я так и думал :)
Работают они по принципу нейронных сетей.

← →
Ega23 © (2008-12-11 13:56) [7]

> Работают они по принципу нейронных сетей.

AFAIK, они не по принципу нейронных сетей работают. По принципу нейронных сетей может быть хранилище словарей устроено.

← →
stas © (2008-12-11 14:22) [8]

Ega23 © (11.12.08 13:56) [7]
Сравнение со словарем

Даже не пробуй заменить человека.

> Была такая буржуйская программа "Dragon",

Действительно, помнится была. В русском варианте её я не видел, но в английском поставил себе на Цырикс166+ с 8 метрами симов. Пытался приучить к своему голосу. Контрольный текст содержал какое-то незнакомое слово, которого не было в словаре, и правильное произношение я не знал. После десятой попытки мне это надоело и я изрёк фразу, которую здесь привести категорически недопустимо. О, чудо! Программа выдала на экран надпись, типа ол-райт, ваш голос записан!...

> Dimka Maslov © (11.12.08 16:52) [10]
> Действительно, помнится была.

Ну почему же была, совсем недавно вышла новая версия.

Очень давно слежу за этим делом.
Самые приятные впечатления оставила программа
VoiceNet2000

Много чего умеет...
Но отказался пока от управления голосом по двумя причинам:
1) Любой фоновый шум мешает распознаванию голоса... А фон - неотъемлемая часть окружения, мыже не в звукозаписывающих студиях работаем - где идеальная тищина.
2) Она требует схожей интонации произношения. А это - не реально. попил чаю - голос один, поспал - другой, с прогулки пришел - третий. Плюс произношение отличается... В общем фразы идеально распознаются в течении 10 минут после обучения... А дальше - фиг заставишь...

Системы распознавания голоса Найти похожие ветки