Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2009.02.08;
Скачать: [xml.tar.bz2];

Вниз

Системы распознавания голоса   Найти похожие ветки 

 
stas ©   (2008-12-11 09:50) [0]

Никогда не сталкивался. т.к. считал их бесполезными.
А тут вот интересуются насколько мощная система от майкрософт SAPI.
Подскажите кто сталкивался:
-принцип работы
-Нужно ли ее обучать (насколько мне известно то эти системы все обучаются конкретному голосу)
-Есть ли смысл в использовании
-Есть ли альтернатива SAPI


 
DVM ©   (2008-12-11 10:43) [1]


> stas ©

Не фига они не работают. Замумукаешься учить.


 
Ega23 ©   (2008-12-11 10:54) [2]


> -принцип работы


Погугли. Наверняка, как-нибудь также, как распознавание лиц: 40 точек на фотографии, строится некая система векторов (уже не помню название).
Так же и с голосом, только не фотография а АЧХ какая-нибудь берётся.


> -Есть ли смысл в использовании


Ненадёжно. Самый простой тест: научить систему своему голосу. Потом записать его на (блин, по старой привычке магнитофон хотел сказать. А их-то уже и фиг найдёшь... :) ) диктофон, а потом с диктофона отдай команду.


 
Юрий Зотов ©   (2008-12-11 10:55) [3]

Была такая буржуйская программа "Dragon", в русском варианте - "Горыныч". Учил я ее своему голосу, учил... учил... учил... пока не понял, что не зря она так называется.


 
DVM ©   (2008-12-11 11:03) [4]


> Учил я ее своему голосу, учил... учил... учил...

я тоже учил :) особых успехов в обучении она не достигла у меня


 
KSergey ©   (2008-12-11 12:16) [5]

знавал парня (ну просто давно это было), который хорошо отзывался о "Горыныче".
По его словам основную ошибку, которую делают при обучении - произношение (дикция, интонация, четкость, паузы, громкость и т.д.) разительно отличаются от тех, которыми потом наговаривают текст. Т.е. важно при обучении "не выпендриваться" и не стараться, говорить как при обычном разговоре. Ну либо при задиктовке - так же четко, громко и т.д.


 
stas ©   (2008-12-11 13:49) [6]

Ясно спасибо. Я так и думал :)
Работают они по принципу нейронных сетей.


 
Ega23 ©   (2008-12-11 13:56) [7]


> Работают они по принципу нейронных сетей.


AFAIK, они не по принципу нейронных сетей работают. По принципу нейронных сетей может быть хранилище словарей устроено.


 
stas ©   (2008-12-11 14:22) [8]

Ega23 ©   (11.12.08 13:56) [7]
Сравнение со словарем


 
Jeer ©   (2008-12-11 15:12) [9]

Даже не пробуй заменить человека.


 
Dimka Maslov ©   (2008-12-11 16:52) [10]


> Была такая буржуйская программа "Dragon",

Действительно, помнится была. В русском варианте её я не видел, но в английском поставил себе на Цырикс166+ с 8 метрами симов. Пытался приучить к своему голосу. Контрольный текст содержал какое-то незнакомое слово, которого не было в словаре, и правильное произношение я не знал. После десятой попытки мне это надоело и я изрёк фразу, которую здесь привести категорически недопустимо. О, чудо! Программа выдала на экран надпись, типа ол-райт, ваш голос записан!...


 
Andy BitOff ©   (2008-12-11 17:33) [11]

> Dimka Maslov ©   (11.12.08 16:52) [10]
> Действительно, помнится была.

Ну почему же была, совсем недавно вышла новая версия.


 
@!!ex ©   (2008-12-11 21:39) [12]

Очень давно слежу за этим делом.
Самые приятные впечатления оставила программа
VoiceNet2000

Много чего умеет...
Но отказался пока от управления голосом по двумя причинам:
1) Любой фоновый шум мешает распознаванию голоса... А фон - неотъемлемая часть окружения, мыже не в звукозаписывающих студиях работаем - где идеальная тищина.
2) Она требует схожей интонации произношения. А это - не реально. попил чаю - голос один, поспал - другой, с прогулки пришел - третий. Плюс произношение отличается... В общем фразы идеально распознаются в течении 10 минут после обучения... А дальше - фиг заставишь...



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2009.02.08;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.006 c
15-1229002101
Ru
2008-12-11 16:28
2009.02.08
PGP Virtual Disk


2-1230373858
antonn
2008-12-27 13:30
2009.02.08
создание переменных в cmd


4-1204690650
soi.hash
2008-03-05 07:17
2009.02.08
Multimedia Keys


15-1229321392
Slider007
2008-12-15 09:09
2009.02.08
С днем рождения ! 13 декабря 2008 суббота


2-1229958159
Broflovski
2008-12-22 18:02
2009.02.08
Занят ли файл другим приложением





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский