Помогите с матстатистикой

← →
Unknown user © (2007-07-12 17:14) [0]

Задача такая: есть набор значений параметра, которые соответствуют верному решению и есть текущее значение параметра, о принадлежности к верному решению которого нам ничего не известно. Вопрос: как определить вероятность того, что текущее значение параметра соответствует верному решению?

Предполагаю, что действует закон нормального распределения, формула для нахождения которого есть, например, в Excel.

← →
Вася Правильный (2007-07-12 17:35) [1]

верное решение - вектор или скаляр?

← →
Unknown user © (2007-07-12 17:48) [2]

скаляр, а точнее булева величина.

← →
palva © (2007-07-12 22:12) [3]

> как определить вероятность того, что текущее значение параметра соответствует верному решению?
Без всяких вероятностей. Если текущее значение совпадает с одним из значений набора, который у нас, как вы пишете, есть, то текущее значение соответствует верному решению. Если не совпадает ни с каким значением из набора, то не соответствует.

← →
Unknown user © (2007-07-13 13:26) [4]

набор значений -это не ряд натуральных чисел, это вещественные числа, то есть если к примеру наибольшая плотность значений в интервале 3..3.8, то для значения 3.4 должна быть максимальная вероятность того что оно соответствует верному решению.

← →
Jeer © (2007-07-13 14:15) [5]

> Unknown user © (13.07.07 13:26) [4]

Ясность изложения вопроса определяет точность ответа (С)

> есть набор значений параметра, которые соответствуют верному
> решению

Это определение предполагает точное попадание текущего значения в известные верные. А раз так - см palva

> набор значений -это не ряд натуральных чисел, это вещественные
> числа, то есть если к примеру наибольшая плотность значений
> в интервале 3..3.8, то для значения 3.4 должна

В этом случае должен быть указан закон распределения и пределы верного решения. Если закон не известен, то необходима реализация процесса с неизвестным законом и классифицирование закона на основе данных.
Но, опять таки, необходимы пределы верных решений.

Если же известна реализация процесса состоящая только из верных решений, то говорить о возможности классификации закона распределения опять таки невозможно.

В общем, советую подумать еще раз и переформулировать вопрос.

← →
Unknown user © (2007-07-13 15:14) [6]

Попытаюсь разъяснить свою задачу:

Программа-векторизатор, а именно полуавтоматическая векторизация горизонталей на сканированных картах. Сейчас трассировка останавливается на любом препятствии или обрыве. Работаю над алгоритмами поиска продолжения пути трассировки. Нынешняя реализация выдает список полилиний, обозначающих все возможные продолжения трассировки, эти полилинии сравниваются по нескольким критериям с основной полилинией (путь трассировщика до останова). Критерии: разница дирекционных углов, расстояние до последней точки основной полилинии, разница в толщине линии, разница в средней кривизне линии, разница в цвете. Значений этих критериев я и называл параметрами, каждый из которых при многократных указаниях правильного пути оператором должен составить свой набор значений соответствующих верному решению.

Надеюсь теперь моя задача понятна. Что еще посоветуете?

Это называется многомерная кластеризация (классификация)

В твоем случае - выявление всех возможных вариантов, группировка их по степени похожести, определение минимального "расстояния" до текущей ситуации.

Вариантов решений масса:
- деревья решений
- байесовская
- нейронные сети
- статистические
- метод соседа
- генетика

to Jeer

если можно подробнее о вариантах:

- байесовская
- статистические

это я так понимаю одно и тоже, я как раз собирался использовать формулу Байеса для нахождения полной вероятности события. предварительно считать вероятности события для каждого параметра независимо.

Hекомендую погрузится в технологии Data mining
Кластеризация один из их методов
Ищи "байесовские сети"
"Статистические" - например, использование линейной регрессии по МНК, а дальше последовательными if then else отсекается лишнее

http://irtc.org.ua/image/Files/Schles/esh10.pdf
http://www.cs.msu.su/jetspeed/PH/4WQ7Y45D.pdf
http://www.citforum.ru/consulting/BI/data_mining/

Помогите с матстатистикой Найти похожие ветки