Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2007.09.23;
Скачать: [xml.tar.bz2];

Вниз

Помогите с матстатистикой   Найти похожие ветки 

 
Unknown user ©   (2007-07-12 17:14) [0]

Задача такая: есть набор значений параметра, которые соответствуют верному решению и есть текущее значение параметра, о принадлежности к верному решению которого нам ничего не известно. Вопрос: как определить вероятность того, что текущее значение параметра соответствует верному решению?

Предполагаю, что действует закон нормального распределения, формула для нахождения которого есть, например, в Excel.


 
Вася Правильный   (2007-07-12 17:35) [1]

верное решение - вектор или скаляр?


 
Unknown user ©   (2007-07-12 17:48) [2]

скаляр, а точнее булева величина.


 
palva ©   (2007-07-12 22:12) [3]

> как определить вероятность того, что текущее значение параметра соответствует верному решению?
Без всяких вероятностей. Если текущее значение совпадает с одним из значений набора, который у нас, как вы пишете, есть, то текущее значение соответствует верному решению. Если не совпадает ни с каким значением из набора, то не соответствует.


 
Unknown user ©   (2007-07-13 13:26) [4]

набор значений -это не ряд натуральных чисел, это вещественные числа, то есть если к примеру наибольшая плотность значений в интервале 3..3.8, то для значения 3.4 должна быть максимальная вероятность того что оно соответствует верному решению.


 
Jeer ©   (2007-07-13 14:15) [5]


> Unknown user ©   (13.07.07 13:26) [4]


Ясность изложения вопроса определяет точность ответа (С)


> есть набор значений параметра, которые соответствуют верному
> решению


Это определение предполагает точное попадание текущего значения в известные верные. А раз так - см palva


> набор значений -это не ряд натуральных чисел, это вещественные
> числа, то есть если к примеру наибольшая плотность значений
> в интервале 3..3.8, то для значения 3.4 должна


В этом случае должен быть указан закон распределения и пределы верного решения. Если закон не известен, то необходима реализация процесса с неизвестным законом и классифицирование закона на основе данных.
Но, опять таки, необходимы пределы верных решений.

Если же известна реализация процесса состоящая только из верных решений, то говорить о возможности классификации закона распределения опять таки невозможно.

В общем, советую подумать еще раз и переформулировать вопрос.


 
Unknown user ©   (2007-07-13 15:14) [6]

Попытаюсь разъяснить свою задачу:

Программа-векторизатор, а именно полуавтоматическая векторизация горизонталей на сканированных картах. Сейчас трассировка останавливается на любом препятствии или обрыве. Работаю над алгоритмами поиска продолжения пути трассировки. Нынешняя реализация выдает список полилиний, обозначающих все возможные продолжения трассировки, эти полилинии сравниваются по нескольким критериям с основной полилинией (путь трассировщика до останова). Критерии: разница дирекционных углов, расстояние до последней точки основной полилинии, разница в толщине линии, разница в средней кривизне линии, разница в цвете. Значений этих критериев я и называл параметрами, каждый из которых при многократных указаниях правильного пути оператором должен составить свой набор значений соответствующих верному решению.

Надеюсь теперь моя задача понятна. Что еще посоветуете?


 
Jeer ©   (2007-07-13 15:48) [7]

Это называется многомерная кластеризация (классификация)

В твоем случае - выявление всех возможных вариантов, группировка их по степени похожести, определение минимального "расстояния" до текущей ситуации.

Вариантов решений масса:
- деревья решений
- байесовская
- нейронные сети
- статистические
- метод соседа
- генетика


 
Unknown user ©   (2007-07-13 15:58) [8]

to Jeer

если можно подробнее о вариантах:

- байесовская
- статистические

это я так понимаю одно и тоже, я как раз собирался использовать формулу Байеса для нахождения полной вероятности события. предварительно считать вероятности события для каждого параметра независимо.


 
Jeer ©   (2007-07-13 16:49) [9]

Hекомендую погрузится в технологии Data mining
Кластеризация один из их методов
Ищи "байесовские сети"
"Статистические" - например, использование линейной регрессии по МНК, а дальше последовательными if then else отсекается лишнее

http://irtc.org.ua/image/Files/Schles/esh10.pdf
http://www.cs.msu.su/jetspeed/PH/4WQ7Y45D.pdf
http://www.citforum.ru/consulting/BI/data_mining/



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2007.09.23;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.47 MB
Время: 0.043 c
15-1188267255
Slider007
2007-08-28 06:14
2007.09.23
С днем рождения ! 28 августа 2007 вторник


10-1136960796
pavel_guzhanov
2006-01-11 09:26
2007.09.23
Как в Excel открыть файл, находящийся в директории


2-1188485653
пАзер
2007-08-30 18:54
2007.09.23
изменение рисунка рабочего стола


15-1187936522
leonidus
2007-08-24 10:22
2007.09.23
Глюки при отображении формы в D6


2-1188218829
tMx
2007-08-27 16:47
2007.09.23
Как организовать связь между двумя процессами





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский