Задачка

← →
Alx2 © (2005-02-16 12:45) [40]

Думкин © (16.02.05 12:41) [38]

Дим, чутье подсказывает, что других (хороших) экспертов со счета сбрасывать не стоит. Если эксперт с p = 0.9 говорит, что не спам. А десяток с p=0.85 говорит, что спам - есть резон верить им.

← →
kaif © (2005-02-16 12:50) [41]

Все рассуждения неверны.
Из оценок экспертов никак не вытекает "правильная" оценка вероятности A.
Нужен еще критерий оценки.
Если использовать критерий максправдоподобия, то вероятность того, что нечто - СПАМ должна зависеть в большей степени от априорной вероятности того, что это СПАМ. нежели от мнения экспертов, анализирующих сами письма на "СПАМ"-ность.
Если же использовать критерий минимального риска, то все зависит от "цены ошибки".
Одно дело - фильтровать на "СПАМ"ность письма от читателей газеты СПИДИНФО, другое дело - фильтровать на "СПАМ"ность письма с сообщениями агентов эпидемологической службы, когда не столько важно отсеять СПАМ, сколько нельзя ни в коем случае загубить важное письмо.

← →
Думкин © (2005-02-16 12:52) [42]

> [40] Alx2 © (16.02.05 12:45)

Я тебе и говорю про локоть. Вот сможешь ли ты посторить такого обобщенного эксперта который будет определять с вероятностью большей чем самый умный - тут и задача. Ведь с этого началось и продолжилось.
Потому что сам понимаешь, что Сигма(положительных)/(их количество)<= максимального.
А вот теперь и задача есть. Теперь от укуса локтя, мождно перейти к ручке и бумаге. Верно?

← →
Думкин © (2005-02-16 12:54) [43]

> [41] kaif © (16.02.05 12:50)

Это не важно. Речь об ином. Это уже другая задача. В этом случае берем стопроцентного эксперта - себя и все. Иначе - ошибки все одно не избежны.

← →
kaif © (2005-02-16 12:56) [44]

Нужно:
1. Выбрать метод принятия решения (максправдоподобие/минимизация риска)
2. Иметь весовые коэффициенты для экспертов, которые должны уточняться со временем, в зависимости от того, насколько успешно отдельные эксперты решают конечную задачу, то есть система должна самообучаться.
3. Потом уже садиться и рисовать формулы, которые могут оказаться не совсем тривиальными, если, например, кроме СПАМ-а и не-СПАМа существуют еще какие-то вещи, например, вирусы или еще что-то. Представим себе, что эксперты "в среднем" оценили вероятность того, что письмо A:
СПАМ 10%
ВИРУС 20%
Обычное письмо 90%
-------------------------
Итого 120%

Как Вам такой результат? А он будет именно таким, если брать "тупое среднее".

← →
Думкин © (2005-02-16 13:00) [45]

> [44] kaif © (16.02.05 12:56)

?! Ты решаешь другую задачу и уже предугадываешь действия среднего. Так нельзя. Не пиши никогда что ВСЕ рассуждения неверны кроме твоего - это ...

← →
марсианин © (2005-02-16 13:03) [46]

2[41] kaif ©

> сколько нельзя ни в коем случае загубить важное письмо.

ну дык, это просто задача.. абстрактная.

в реальности и речи нет о вероятностях, такую гарантию может дать только отсутсвие фильтра.

ИМХО, спам никогда не следует фильтровать по содержанию..
я от спама никогда не страдал (тьфу-тьфу-тьфу), а от антиспама иногда приходилось..
одной своей подруге я не могу писать из дома потому, что у нее провайдер занес моего районного провайдера в черный список.

← →
kaif © (2005-02-16 13:10) [47]

Если это абстрактная задача, то она вообще некорректна.

Если же это реальная задача (а я так именно подумал, что речь шла о СПАМ-фильтре), то я дал свои рекомендации - подходить к этой задаче, как к задаче распознавания, а не задаче расчета вероятностей.
Если бы здесь сказали, что нужно предсказать какое решение принял Юлия Цезарь (начинать сражение или не начинать), когда авгуры сообщили о том, что священные куры (тогдашние "эксперты") "сегодня плохо ели червяков", то я бы предложил какой-то иной подход. Например:
Решение Цезаря всегда обратно "среднему" решению кур.

← →
Alx2 © (2005-02-16 13:30) [48]

Блин. Сам так и недопер. Пришлось в инете найти :)

http://www.mathpages.com/home/kmath267.htm

← →
Alx2 © (2005-02-16 13:50) [49]

А вот ее применение в спам-фильтрах:
http://www.eserv.ru/StatisticalSpamFiltering

← →
марсианин © (2005-02-16 14:05) [50]

where
p0 + p1 + p2 + p3 + p4 + p5 + p6 + p7 = 1

это-то ты и забыл написать

← →
Alx2 © (2005-02-16 14:07) [51]

марсианин © (16.02.05 14:05) [50]

Вовсе не от тех "p" идет речь .

В том примере "Mr. Smith, who is correct 75% of the time"
и "Mr. Jones, who is correct 60% of the time" вместе = 1.35

← →
Alx2 © (2005-02-16 14:23) [52]

Думкин © (16.02.05 12:52) [42]

По линку, что давал в [48] видно, что построение такого эксперта возможно при условии независимости экспертов и симметричности наступления/ненаступления события о котором судят эксперты.

← →
имя (2005-02-16 15:42) [53]

Удалено модератором

← →
имя (2005-02-16 15:44) [54]

Удалено модератором

← →
default © (2005-02-16 17:03) [55]

а по-моему здесь работает формула полной вероятности

← →
kaif © (2005-02-16 17:12) [56]

2 Телевизор -)) (16.02.05 15:44) [54]
Причем здесь ПОЛИТИЧЕСКАЯ или РЕЛИГИОЗНАЯ?
Я думал здесь "Потрепаться".
В любом случае я никого не задевал и не понимаю, откуда такой наезд. Вы хотите сказать, что я не умею говорить ни о чем, кроме религии или политики? А Вы типа умные и здесь вообще пипл хавает лишь математически точные вещи?
Вам не стыдно в такой манере разговаривать с человеком, с которым Вы не знакомы и уж вряд ли имеете понятие о том, насколько он сведущ в математике?
Если нужно, я могу прокомментировать статью, на которую Alx2 © нашел ссылку. Если немного вникнуть в смысл постановки там, то это совсем другая задача:

Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur. It would seem on this basis that the probability of X ocurring is 0.25. On the other hand, Mr. Jones, who is correct 60% of the time, claims that X WILL occur. Given both of these predictions, with their respective reliabilities, what is the probability that X will occur?

Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...
С другой стороны мистер Джонс оказывается прав в 60% случаев, когда говорит, что событие X наступит.

Это не то же самое, как когда эксперт Смит предсказывает, что событие X должно наступить с вероятностью 25%. А именно так и я и все остальные поняли постановку задачи:

На основании предсказаний всех экспертов нужно дать оценку вероятности события

И поэтому я сказал, что задача поставлена некорректно.
Одно дело, когда эксперты с какой-то верорятностью ошибаются. Тогда мы можем построить все пространство событий с вероятностями p1 ... p8, комбинируя все сочитания событий типа "эксперт ошибся". А совсем иное, когда мы имеем экспертов, которые заявляют о вероятностях и неизвестно с какой вероятностью при этом ошибаются.

В данном случае автор ветки задачу поставил в виде поиска функции зависимости вероятности события от мнений экспертов о вероятности этого события, а не как функцию от вероятности того, что эксперты правы, говоря, что A наступит обязательно, о чем идет речь в приведенной статье.

Так что сначала сами разберитесь с тем, какую задачу здесь решают, а уже затем переходите на личности.

:(

← →
Alx2 © (2005-02-16 17:20) [57]

kaif © (16.02.05 17:12) [56]

>А именно так и я и все остальные поняли постановку задачи:

Я везде писал про вероятности того, что эксперт дал правильный (не правильный) ответ. А подробнее пояснил в посте [2]

Какая моя фраза сбила с толку, если читать в контексте постов, где она употребляется?

← →
Alx2 © (2005-02-16 17:24) [58]

Вдогонку: перечитал наискосок ветку. Про "все остальные" - тоже не согласен. Везде речь идет о вероятности ошибки (или правоты) именно эксперта, а не о том, какую вероятность эксперт приписывает событию

← →
Sandman25 © (2005-02-16 17:26) [59]

[56] kaif © (16.02.05 17:12)

Вы неверно перевели первое предложение, по-моему.

2 Sandman25 © (16.02.05 17:26) [59]

Я верно перевел. Могу перевести дословно:

Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur.

Предположим, что мр. Смит, который оказывается корректен 75% времени, заявляет, что определенное событие X не произойдет.

Просто это не по-русски, поэтому я и перевожу как оказывается прав в 75% случаев, так как это, ИМХО, по-русски лучше звучит.

2 Alx2 ©
Согласен, Вы во втором постинге изменили постановку задачи, но я подумал, что Вы изменили постановку, так как решаете реальную задачу по построению анитиспам-фильтра и потому счел важным напомнить о том, что это задача распознавания и нужно сначала выбирать метод (максправдоподобия или минимального риска), прежде чем задачу ставить в том или ином виде.

Впрочем, если Вы полагаете, что Телевизор вправе говорить мне, что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное хавает", то мне нечего к сказанному добавить.

Обсуждайте что хотите и как хотите. Я буду обсуждать РЕЛИГИЮ, ПОЛИТИКУ и ФИЛОСОФИЮ, по крайней мере "пипл" в тех ветках не так часто хамит без всякой причины.

kaif © (16.02.05 17:55) [60]

>Впрочем, если Вы полагаете, что Телевизор вправе говорить мне,
>что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное
>хавает", то мне нечего к сказанному добавить.

Видимо, именно это было поводом, чтобы зацепить постановку задачи.

А насчет Телевизора - понятия не имею: вправе он так говорить, или нет.

kaif © (16.02.05 17:55) [60]

>Вы во втором постинге изменили постановку задачи, но я подумал,
>что Вы изменили постановку, так как решаете реальную задачу по
>построению анитиспам-фильтра и потому счел важным напомнить о
>том, что это задача распознавания и нужно сначала выбирать метод
>(максправдоподобия или минимального риска), прежде чем задачу
>ставить в том или ином виде.

Нет, Ашот. фильтры такие уже давно есть. У меня не получалось (и не получилось, в итоге - ответ к задачке подсмотрел) самостоятельно вывести оценку вероятности.

вот кстати интересная задача про монету:

Имеется несимметричная монета, для которой вероятность
выпадения орла есть неизвестное нам число p (0 < p < 1).
Покажите, как с её помощью можно имитировать симметричную
монету, сделав несколько бросаний.

да.. не вчитался я внимательно в буржуйский текст сначала.. поторопился :)

да и вообще. чего спорить, правильный ответ (для оценки вероятности, а не спама) - [35], имхо :)

[60] kaif © (16.02.05 17:55)

Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...

Вот это был неправильный перевод. Мистер Смит оказывается прав в 75% случаев всегда, независимо от того, что он говорит. То есть по-русски это предложение не должно иметь деепричастие "говоря", которое относится к "оказывается прав".
Предположим, что мистер Смит, который оказывается прав в 75% случаев, говорит, что событие X не наступит... То есть если он говорит, что не наступит, то он оказывается прав тоже в 75% случаев. Из Вашего перевода это вовсе не следует.

Задачка Найти похожие ветки