Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.03.06;
Скачать: CL | DM;

Вниз

Задачка   Найти похожие ветки 

 
Alx2 ©   (2005-02-16 12:45) [40]

Думкин ©   (16.02.05 12:41) [38]

Дим, чутье подсказывает, что других (хороших) экспертов со счета сбрасывать не стоит. Если эксперт с p = 0.9 говорит, что не спам. А десяток с p=0.85 говорит, что спам - есть резон верить им.


 
kaif ©   (2005-02-16 12:50) [41]

Все рассуждения неверны.
 Из оценок экспертов никак не вытекает "правильная" оценка вероятности A.
 Нужен еще критерий оценки.
 Если использовать критерий максправдоподобия, то вероятность того, что нечто - СПАМ должна зависеть в большей степени от априорной вероятности того, что это СПАМ. нежели от мнения экспертов, анализирующих сами письма на "СПАМ"-ность.
 Если же использовать критерий минимального риска, то все зависит от "цены ошибки".
 Одно дело - фильтровать на "СПАМ"ность письма от читателей газеты СПИДИНФО, другое дело - фильтровать на "СПАМ"ность письма с сообщениями агентов эпидемологической службы, когда не столько важно отсеять СПАМ, сколько нельзя ни в коем случае загубить важное письмо.


 
Думкин ©   (2005-02-16 12:52) [42]

> [40] Alx2 ©   (16.02.05 12:45)

Я тебе и говорю про локоть. Вот сможешь ли ты посторить такого обобщенного эксперта который будет определять с вероятностью большей чем самый умный - тут и задача. Ведь с этого началось и продолжилось.
Потому что сам понимаешь, что Сигма(положительных)/(их количество)<= максимального.
А вот теперь и задача есть. Теперь от укуса локтя, мождно перейти к ручке и бумаге. Верно?


 
Думкин ©   (2005-02-16 12:54) [43]

> [41] kaif ©   (16.02.05 12:50)

Это не важно. Речь об ином. Это уже другая задача. В этом случае берем стопроцентного эксперта - себя и все. Иначе - ошибки все одно не избежны.


 
kaif ©   (2005-02-16 12:56) [44]

Нужно:
1. Выбрать метод принятия решения (максправдоподобие/минимизация риска)
2. Иметь весовые коэффициенты для экспертов, которые должны уточняться со временем, в зависимости от того, насколько успешно отдельные эксперты решают конечную задачу, то есть система должна самообучаться.
3. Потом уже садиться и рисовать формулы, которые могут оказаться не совсем тривиальными, если, например, кроме СПАМ-а и не-СПАМа существуют еще какие-то вещи, например, вирусы или еще что-то. Представим себе, что эксперты "в среднем" оценили вероятность того, что письмо A:
  СПАМ 10%
  ВИРУС 20%
  Обычное письмо 90%
-------------------------
  Итого 120%

Как Вам такой результат? А он будет именно таким, если брать "тупое среднее".


 
Думкин ©   (2005-02-16 13:00) [45]

> [44] kaif ©   (16.02.05 12:56)

?! Ты решаешь другую задачу и уже предугадываешь действия среднего. Так нельзя. Не пиши никогда что ВСЕ рассуждения неверны кроме твоего - это ...


 
марсианин ©   (2005-02-16 13:03) [46]

2[41] kaif ©

> сколько нельзя ни в коем случае загубить важное письмо.

ну дык, это просто задача.. абстрактная.

в реальности и речи нет о вероятностях, такую гарантию может дать только отсутсвие фильтра.

ИМХО, спам никогда не следует фильтровать по содержанию..
я от спама никогда не страдал (тьфу-тьфу-тьфу), а от антиспама иногда приходилось..
одной своей подруге  я не могу писать из дома потому, что у нее провайдер занес моего районного провайдера в черный список.


 
kaif ©   (2005-02-16 13:10) [47]

Если это абстрактная задача, то она вообще некорректна.

Если же это реальная задача (а я так именно подумал, что речь шла о СПАМ-фильтре), то я дал свои рекомендации - подходить к этой задаче, как к задаче распознавания, а не задаче расчета вероятностей.
Если бы здесь сказали, что нужно предсказать какое решение принял Юлия Цезарь (начинать сражение или не начинать), когда авгуры сообщили о том, что священные куры (тогдашние "эксперты") "сегодня плохо ели червяков", то я бы предложил какой-то иной подход. Например:
 Решение Цезаря всегда обратно "среднему" решению кур.


 
Alx2 ©   (2005-02-16 13:30) [48]

Блин. Сам так и недопер.  Пришлось в инете найти :)

http://www.mathpages.com/home/kmath267.htm


 
Alx2 ©   (2005-02-16 13:50) [49]

А вот ее применение в спам-фильтрах:
http://www.eserv.ru/StatisticalSpamFiltering


 
марсианин ©   (2005-02-16 14:05) [50]

where
         p0 + p1 + p2 + p3 + p4 + p5 + p6 + p7 = 1


это-то ты и забыл написать


 
Alx2 ©   (2005-02-16 14:07) [51]

марсианин ©   (16.02.05 14:05) [50]

Вовсе не от тех "p" идет речь .

В том примере "Mr. Smith, who is correct 75% of the time"
и "Mr. Jones, who is correct 60% of the time" вместе  = 1.35


 
Alx2 ©   (2005-02-16 14:23) [52]

Думкин ©   (16.02.05 12:52) [42]

По линку, что давал в [48] видно, что построение такого эксперта возможно при условии независимости экспертов и симметричности наступления/ненаступления события о котором судят эксперты.


 
имя   (2005-02-16 15:42) [53]

Удалено модератором


 
имя   (2005-02-16 15:44) [54]

Удалено модератором


 
default ©   (2005-02-16 17:03) [55]

а по-моему здесь работает формула полной вероятности


 
kaif ©   (2005-02-16 17:12) [56]

2 Телевизор -))   (16.02.05 15:44) [54]
 Причем здесь ПОЛИТИЧЕСКАЯ или РЕЛИГИОЗНАЯ?
 Я думал здесь "Потрепаться".
 В любом случае я никого не задевал и не понимаю, откуда такой наезд. Вы хотите сказать, что я не умею говорить ни о чем, кроме религии или политики? А Вы типа умные и здесь вообще пипл хавает лишь математически точные вещи?
 Вам не стыдно в такой манере разговаривать с человеком, с которым Вы не знакомы и уж вряд ли имеете понятие о том, насколько он сведущ в математике?  
 Если нужно, я могу прокомментировать статью, на которую Alx2 © нашел ссылку. Если немного вникнуть в смысл постановки там, то это совсем другая задача:

Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur.  It would seem on this basis that the probability of X ocurring is 0.25.  On the other hand, Mr. Jones, who is correct 60% of the time, claims that X WILL occur.  Given both of these predictions, with their respective reliabilities, what is the probability that X will occur?

Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...
С другой стороны мистер Джонс оказывается прав в 60% случаев, когда говорит, что событие X наступит.

Это не то же самое, как когда эксперт Смит предсказывает, что событие X должно наступить с вероятностью 25%. А именно так и я и все остальные поняли постановку задачи:

На основании предсказаний всех экспертов нужно дать оценку вероятности события

И поэтому я сказал, что задача поставлена некорректно.
Одно дело, когда эксперты с какой-то верорятностью ошибаются. Тогда мы можем построить все пространство событий с вероятностями p1 ... p8, комбинируя все сочитания событий типа "эксперт ошибся". А совсем иное, когда мы имеем экспертов, которые заявляют о вероятностях и неизвестно с какой вероятностью при этом ошибаются.

В данном случае автор ветки задачу поставил в виде поиска функции зависимости вероятности события от мнений экспертов о вероятности этого события, а не как функцию от вероятности того, что эксперты правы, говоря, что A наступит обязательно, о чем идет речь в приведенной статье.

Так что сначала сами разберитесь с тем, какую задачу здесь решают, а уже затем переходите на личности.

:(


 
Alx2 ©   (2005-02-16 17:20) [57]

kaif ©   (16.02.05 17:12) [56]

>А именно так и я и все остальные поняли постановку задачи:

Я везде писал про вероятности того, что эксперт дал правильный (не правильный) ответ. А подробнее пояснил в посте [2]

Какая моя фраза сбила с толку, если читать в контексте постов, где она употребляется?


 
Alx2 ©   (2005-02-16 17:24) [58]

Вдогонку: перечитал наискосок ветку. Про "все остальные" - тоже не согласен. Везде речь идет о вероятности ошибки (или правоты) именно эксперта, а не о том, какую вероятность эксперт приписывает событию


 
Sandman25 ©   (2005-02-16 17:26) [59]

[56] kaif ©   (16.02.05 17:12)

Вы неверно перевели первое предложение, по-моему.


 
kaif ©   (2005-02-16 17:55) [60]

2 Sandman25 ©   (16.02.05 17:26) [59]

Я верно перевел. Могу перевести дословно:

Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur.  

Предположим, что мр. Смит, который оказывается корректен 75% времени, заявляет, что определенное событие X не произойдет.

Просто это не по-русски, поэтому я и перевожу как оказывается прав в 75% случаев, так как это, ИМХО, по-русски лучше звучит.

 2 Alx2 ©  
 Согласен, Вы во втором постинге изменили постановку задачи, но я подумал, что Вы изменили постановку, так как решаете реальную задачу по построению анитиспам-фильтра и потому счел важным напомнить о том, что это задача распознавания и нужно сначала выбирать метод (максправдоподобия или минимального риска), прежде чем задачу ставить в том или ином виде.

 Впрочем, если Вы полагаете, что Телевизор вправе говорить мне, что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное хавает", то мне нечего к сказанному добавить.

 Обсуждайте что хотите и как хотите. Я буду обсуждать РЕЛИГИЮ, ПОЛИТИКУ и ФИЛОСОФИЮ, по крайней мере "пипл" в тех ветках не так часто хамит без всякой причины.


 
Alx2 ©   (2005-02-16 18:13) [61]

kaif ©   (16.02.05 17:55) [60]

>Впрочем, если Вы полагаете, что Телевизор вправе говорить мне,
>что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное
>хавает", то мне нечего к сказанному добавить.

Видимо, именно это было поводом, чтобы зацепить постановку задачи.

А насчет Телевизора - понятия не имею: вправе он так говорить, или нет.


 
KSergey ©   (2005-02-16 18:22) [62]

> [56] kaif ©   (16.02.05 17:12)
> А именно так и я и все остальные поняли постановку задачи:

За всех не надо, ага?


 
Alx2 ©   (2005-02-16 18:32) [63]

kaif ©   (16.02.05 17:55) [60]

>Вы во втором постинге изменили постановку задачи, но я подумал,
>что Вы изменили постановку, так как решаете реальную задачу по
>построению анитиспам-фильтра и потому счел важным напомнить о
>том, что это задача распознавания и нужно сначала выбирать метод
>(максправдоподобия или минимального риска), прежде чем задачу
>ставить в том или ином виде.

Нет, Ашот. фильтры такие уже давно есть. У меня не получалось (и не получилось, в итоге - ответ к задачке подсмотрел) самостоятельно вывести оценку вероятности.


 
default ©   (2005-02-16 19:35) [64]

вот кстати интересная задача про монету:

Имеется несимметричная монета, для которой вероятность
выпадения орла есть неизвестное нам число p (0 < p < 1).
Покажите, как с её помощью можно имитировать симметричную
монету, сделав несколько бросаний.


 
марсианин ©   (2005-02-16 20:45) [65]

да.. не вчитался я внимательно в буржуйский текст сначала.. поторопился :)

да и вообще. чего спорить, правильный ответ (для оценки вероятности, а не спама)  - [35], имхо :)


 
Alx2 ©   (2005-02-16 21:04) [66]

марсианин ©   (16.02.05 20:45) [65]

Кстати, да. Сумму на произведение заменить - и все ok!


 
Sandman25 ©   (2005-02-17 08:55) [67]

[60] kaif ©   (16.02.05 17:55)

Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...

Вот это был неправильный перевод. Мистер Смит оказывается прав в 75% случаев всегда, независимо от того, что он говорит. То есть по-русски это предложение не должно иметь деепричастие "говоря", которое относится к "оказывается прав".
Предположим, что мистер Смит, который оказывается прав в 75% случаев, говорит, что событие X не наступит... То есть если он говорит, что не наступит, то он оказывается прав тоже в 75% случаев. Из Вашего перевода это вовсе не следует.



Страницы: 1 2 вся ветка

Текущий архив: 2005.03.06;
Скачать: CL | DM;

Наверх




Память: 0.62 MB
Время: 0.052 c
3-1107506997
Yasik
2005-02-04 11:49
2005.03.06
Двойной вопрос


1-1108629913
Slaga
2005-02-17 11:45
2005.03.06
Плагины для дельфи


8-1100436588
frEEstyler
2004-11-14 15:49
2005.03.06
Как узнать длину проигрываемого фильма???


14-1108129970
Antonn
2005-02-11 16:52
2005.03.06
Сетевые подключения


1-1108728732
Cosinus
2005-02-18 15:12
2005.03.06
Обращение к объектам, расположенным на MDIChild из MdiMain