Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2007.09.23;
Скачать: [xml.tar.bz2];

Вниз

Помогите с матстатистикой   Найти похожие ветки 

 
Unknown user ©   (2007-07-12 17:14) [0]

Задача такая: есть набор значений параметра, которые соответствуют верному решению и есть текущее значение параметра, о принадлежности к верному решению которого нам ничего не известно. Вопрос: как определить вероятность того, что текущее значение параметра соответствует верному решению?

Предполагаю, что действует закон нормального распределения, формула для нахождения которого есть, например, в Excel.


 
Вася Правильный   (2007-07-12 17:35) [1]

верное решение - вектор или скаляр?


 
Unknown user ©   (2007-07-12 17:48) [2]

скаляр, а точнее булева величина.


 
palva ©   (2007-07-12 22:12) [3]

> как определить вероятность того, что текущее значение параметра соответствует верному решению?
Без всяких вероятностей. Если текущее значение совпадает с одним из значений набора, который у нас, как вы пишете, есть, то текущее значение соответствует верному решению. Если не совпадает ни с каким значением из набора, то не соответствует.


 
Unknown user ©   (2007-07-13 13:26) [4]

набор значений -это не ряд натуральных чисел, это вещественные числа, то есть если к примеру наибольшая плотность значений в интервале 3..3.8, то для значения 3.4 должна быть максимальная вероятность того что оно соответствует верному решению.


 
Jeer ©   (2007-07-13 14:15) [5]


> Unknown user ©   (13.07.07 13:26) [4]


Ясность изложения вопроса определяет точность ответа (С)


> есть набор значений параметра, которые соответствуют верному
> решению


Это определение предполагает точное попадание текущего значения в известные верные. А раз так - см palva


> набор значений -это не ряд натуральных чисел, это вещественные
> числа, то есть если к примеру наибольшая плотность значений
> в интервале 3..3.8, то для значения 3.4 должна


В этом случае должен быть указан закон распределения и пределы верного решения. Если закон не известен, то необходима реализация процесса с неизвестным законом и классифицирование закона на основе данных.
Но, опять таки, необходимы пределы верных решений.

Если же известна реализация процесса состоящая только из верных решений, то говорить о возможности классификации закона распределения опять таки невозможно.

В общем, советую подумать еще раз и переформулировать вопрос.


 
Unknown user ©   (2007-07-13 15:14) [6]

Попытаюсь разъяснить свою задачу:

Программа-векторизатор, а именно полуавтоматическая векторизация горизонталей на сканированных картах. Сейчас трассировка останавливается на любом препятствии или обрыве. Работаю над алгоритмами поиска продолжения пути трассировки. Нынешняя реализация выдает список полилиний, обозначающих все возможные продолжения трассировки, эти полилинии сравниваются по нескольким критериям с основной полилинией (путь трассировщика до останова). Критерии: разница дирекционных углов, расстояние до последней точки основной полилинии, разница в толщине линии, разница в средней кривизне линии, разница в цвете. Значений этих критериев я и называл параметрами, каждый из которых при многократных указаниях правильного пути оператором должен составить свой набор значений соответствующих верному решению.

Надеюсь теперь моя задача понятна. Что еще посоветуете?


 
Jeer ©   (2007-07-13 15:48) [7]

Это называется многомерная кластеризация (классификация)

В твоем случае - выявление всех возможных вариантов, группировка их по степени похожести, определение минимального "расстояния" до текущей ситуации.

Вариантов решений масса:
- деревья решений
- байесовская
- нейронные сети
- статистические
- метод соседа
- генетика


 
Unknown user ©   (2007-07-13 15:58) [8]

to Jeer

если можно подробнее о вариантах:

- байесовская
- статистические

это я так понимаю одно и тоже, я как раз собирался использовать формулу Байеса для нахождения полной вероятности события. предварительно считать вероятности события для каждого параметра независимо.


 
Jeer ©   (2007-07-13 16:49) [9]

Hекомендую погрузится в технологии Data mining
Кластеризация один из их методов
Ищи "байесовские сети"
"Статистические" - например, использование линейной регрессии по МНК, а дальше последовательными if then else отсекается лишнее

http://irtc.org.ua/image/Files/Schles/esh10.pdf
http://www.cs.msu.su/jetspeed/PH/4WQ7Y45D.pdf
http://www.citforum.ru/consulting/BI/data_mining/



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2007.09.23;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.053 c
15-1187811709
Vlad Oshin
2007-08-22 23:41
2007.09.23
Великое Северное море.


15-1187530257
THandle
2007-08-19 17:30
2007.09.23
Какой смартфон/коммуникатор выбрать


4-1175102152
Express
2007-03-28 21:15
2007.09.23
Как посласть сообщение о нажатие кнопки "Отмена" в MessageDLG?


1-1184053838
Кирилл_А
2007-07-10 11:50
2007.09.23
Массив строк и Dll


2-1188472359
kudatsky
2007-08-30 15:12
2007.09.23
Можно-ли ввести данные в TStringGrid в Design Time ?





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский