Форум: "Прочее";
Текущий архив: 2009.02.08;
Скачать: [xml.tar.bz2];
ВнизСистемы распознавания голоса Найти похожие ветки
← →
stas © (2008-12-11 09:50) [0]Никогда не сталкивался. т.к. считал их бесполезными.
А тут вот интересуются насколько мощная система от майкрософт SAPI.
Подскажите кто сталкивался:
-принцип работы
-Нужно ли ее обучать (насколько мне известно то эти системы все обучаются конкретному голосу)
-Есть ли смысл в использовании
-Есть ли альтернатива SAPI
← →
DVM © (2008-12-11 10:43) [1]
> stas ©
Не фига они не работают. Замумукаешься учить.
← →
Ega23 © (2008-12-11 10:54) [2]
> -принцип работы
Погугли. Наверняка, как-нибудь также, как распознавание лиц: 40 точек на фотографии, строится некая система векторов (уже не помню название).
Так же и с голосом, только не фотография а АЧХ какая-нибудь берётся.
> -Есть ли смысл в использовании
Ненадёжно. Самый простой тест: научить систему своему голосу. Потом записать его на (блин, по старой привычке магнитофон хотел сказать. А их-то уже и фиг найдёшь... :) ) диктофон, а потом с диктофона отдай команду.
← →
Юрий Зотов © (2008-12-11 10:55) [3]Была такая буржуйская программа "Dragon", в русском варианте - "Горыныч". Учил я ее своему голосу, учил... учил... учил... пока не понял, что не зря она так называется.
← →
DVM © (2008-12-11 11:03) [4]
> Учил я ее своему голосу, учил... учил... учил...
я тоже учил :) особых успехов в обучении она не достигла у меня
← →
KSergey © (2008-12-11 12:16) [5]знавал парня (ну просто давно это было), который хорошо отзывался о "Горыныче".
По его словам основную ошибку, которую делают при обучении - произношение (дикция, интонация, четкость, паузы, громкость и т.д.) разительно отличаются от тех, которыми потом наговаривают текст. Т.е. важно при обучении "не выпендриваться" и не стараться, говорить как при обычном разговоре. Ну либо при задиктовке - так же четко, громко и т.д.
← →
stas © (2008-12-11 13:49) [6]Ясно спасибо. Я так и думал :)
Работают они по принципу нейронных сетей.
← →
Ega23 © (2008-12-11 13:56) [7]
> Работают они по принципу нейронных сетей.
AFAIK, они не по принципу нейронных сетей работают. По принципу нейронных сетей может быть хранилище словарей устроено.
← →
stas © (2008-12-11 14:22) [8]Ega23 © (11.12.08 13:56) [7]
Сравнение со словарем
← →
Jeer © (2008-12-11 15:12) [9]Даже не пробуй заменить человека.
← →
Dimka Maslov © (2008-12-11 16:52) [10]
> Была такая буржуйская программа "Dragon",
Действительно, помнится была. В русском варианте её я не видел, но в английском поставил себе на Цырикс166+ с 8 метрами симов. Пытался приучить к своему голосу. Контрольный текст содержал какое-то незнакомое слово, которого не было в словаре, и правильное произношение я не знал. После десятой попытки мне это надоело и я изрёк фразу, которую здесь привести категорически недопустимо. О, чудо! Программа выдала на экран надпись, типа ол-райт, ваш голос записан!...
← →
Andy BitOff © (2008-12-11 17:33) [11]> Dimka Maslov © (11.12.08 16:52) [10]
> Действительно, помнится была.
Ну почему же была, совсем недавно вышла новая версия.
← →
@!!ex © (2008-12-11 21:39) [12]Очень давно слежу за этим делом.
Самые приятные впечатления оставила программа
VoiceNet2000
Много чего умеет...
Но отказался пока от управления голосом по двумя причинам:
1) Любой фоновый шум мешает распознаванию голоса... А фон - неотъемлемая часть окружения, мыже не в звукозаписывающих студиях работаем - где идеальная тищина.
2) Она требует схожей интонации произношения. А это - не реально. попил чаю - голос один, поспал - другой, с прогулки пришел - третий. Плюс произношение отличается... В общем фразы идеально распознаются в течении 10 минут после обучения... А дальше - фиг заставишь...
Страницы: 1 вся ветка
Форум: "Прочее";
Текущий архив: 2009.02.08;
Скачать: [xml.tar.bz2];
Память: 0.47 MB
Время: 0.005 c