Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.02.08;
Скачать: CL | DM;

Вниз

Системы распознавания голоса   Найти похожие ветки 

 
stas ©   (2008-12-11 09:50) [0]

Никогда не сталкивался. т.к. считал их бесполезными.
А тут вот интересуются насколько мощная система от майкрософт SAPI.
Подскажите кто сталкивался:
-принцип работы
-Нужно ли ее обучать (насколько мне известно то эти системы все обучаются конкретному голосу)
-Есть ли смысл в использовании
-Есть ли альтернатива SAPI


 
DVM ©   (2008-12-11 10:43) [1]


> stas ©

Не фига они не работают. Замумукаешься учить.


 
Ega23 ©   (2008-12-11 10:54) [2]


> -принцип работы


Погугли. Наверняка, как-нибудь также, как распознавание лиц: 40 точек на фотографии, строится некая система векторов (уже не помню название).
Так же и с голосом, только не фотография а АЧХ какая-нибудь берётся.


> -Есть ли смысл в использовании


Ненадёжно. Самый простой тест: научить систему своему голосу. Потом записать его на (блин, по старой привычке магнитофон хотел сказать. А их-то уже и фиг найдёшь... :) ) диктофон, а потом с диктофона отдай команду.


 
Юрий Зотов ©   (2008-12-11 10:55) [3]

Была такая буржуйская программа "Dragon", в русском варианте - "Горыныч". Учил я ее своему голосу, учил... учил... учил... пока не понял, что не зря она так называется.


 
DVM ©   (2008-12-11 11:03) [4]


> Учил я ее своему голосу, учил... учил... учил...

я тоже учил :) особых успехов в обучении она не достигла у меня


 
KSergey ©   (2008-12-11 12:16) [5]

знавал парня (ну просто давно это было), который хорошо отзывался о "Горыныче".
По его словам основную ошибку, которую делают при обучении - произношение (дикция, интонация, четкость, паузы, громкость и т.д.) разительно отличаются от тех, которыми потом наговаривают текст. Т.е. важно при обучении "не выпендриваться" и не стараться, говорить как при обычном разговоре. Ну либо при задиктовке - так же четко, громко и т.д.


 
stas ©   (2008-12-11 13:49) [6]

Ясно спасибо. Я так и думал :)
Работают они по принципу нейронных сетей.


 
Ega23 ©   (2008-12-11 13:56) [7]


> Работают они по принципу нейронных сетей.


AFAIK, они не по принципу нейронных сетей работают. По принципу нейронных сетей может быть хранилище словарей устроено.


 
stas ©   (2008-12-11 14:22) [8]

Ega23 ©   (11.12.08 13:56) [7]
Сравнение со словарем


 
Jeer ©   (2008-12-11 15:12) [9]

Даже не пробуй заменить человека.


 
Dimka Maslov ©   (2008-12-11 16:52) [10]


> Была такая буржуйская программа "Dragon",

Действительно, помнится была. В русском варианте её я не видел, но в английском поставил себе на Цырикс166+ с 8 метрами симов. Пытался приучить к своему голосу. Контрольный текст содержал какое-то незнакомое слово, которого не было в словаре, и правильное произношение я не знал. После десятой попытки мне это надоело и я изрёк фразу, которую здесь привести категорически недопустимо. О, чудо! Программа выдала на экран надпись, типа ол-райт, ваш голос записан!...


 
Andy BitOff ©   (2008-12-11 17:33) [11]

> Dimka Maslov ©   (11.12.08 16:52) [10]
> Действительно, помнится была.

Ну почему же была, совсем недавно вышла новая версия.


 
@!!ex ©   (2008-12-11 21:39) [12]

Очень давно слежу за этим делом.
Самые приятные впечатления оставила программа
VoiceNet2000

Много чего умеет...
Но отказался пока от управления голосом по двумя причинам:
1) Любой фоновый шум мешает распознаванию голоса... А фон - неотъемлемая часть окружения, мыже не в звукозаписывающих студиях работаем - где идеальная тищина.
2) Она требует схожей интонации произношения. А это - не реально. попил чаю - голос один, поспал - другой, с прогулки пришел - третий. Плюс произношение отличается... В общем фразы идеально распознаются в течении 10 минут после обучения... А дальше - фиг заставишь...



Страницы: 1 вся ветка

Текущий архив: 2009.02.08;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.013 c
15-1228978208
stas
2008-12-11 09:50
2009.02.08
Системы распознавания голоса


3-1214294131
Oleg_teacher
2008-06-24 11:55
2009.02.08
Експорт из базы.


15-1229401940
Клод
2008-12-16 07:32
2009.02.08
Видео на двд


2-1230381853
smi
2008-12-27 15:44
2009.02.08
Маскировка


2-1229938772
poops89
2008-12-22 12:39
2009.02.08
как перенести тексти с Edit в TSeSkinEdit