Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2005.03.06;
Скачать: [xml.tar.bz2];

Вниз

Задачка   Найти похожие ветки 

 
Alx2 ©   (2005-02-16 12:45) [40]

Думкин ©   (16.02.05 12:41) [38]

Дим, чутье подсказывает, что других (хороших) экспертов со счета сбрасывать не стоит. Если эксперт с p = 0.9 говорит, что не спам. А десяток с p=0.85 говорит, что спам - есть резон верить им.


 
kaif ©   (2005-02-16 12:50) [41]

Все рассуждения неверны.
 Из оценок экспертов никак не вытекает "правильная" оценка вероятности A.
 Нужен еще критерий оценки.
 Если использовать критерий максправдоподобия, то вероятность того, что нечто - СПАМ должна зависеть в большей степени от априорной вероятности того, что это СПАМ. нежели от мнения экспертов, анализирующих сами письма на "СПАМ"-ность.
 Если же использовать критерий минимального риска, то все зависит от "цены ошибки".
 Одно дело - фильтровать на "СПАМ"ность письма от читателей газеты СПИДИНФО, другое дело - фильтровать на "СПАМ"ность письма с сообщениями агентов эпидемологической службы, когда не столько важно отсеять СПАМ, сколько нельзя ни в коем случае загубить важное письмо.


 
Думкин ©   (2005-02-16 12:52) [42]

> [40] Alx2 ©   (16.02.05 12:45)

Я тебе и говорю про локоть. Вот сможешь ли ты посторить такого обобщенного эксперта который будет определять с вероятностью большей чем самый умный - тут и задача. Ведь с этого началось и продолжилось.
Потому что сам понимаешь, что Сигма(положительных)/(их количество)<= максимального.
А вот теперь и задача есть. Теперь от укуса локтя, мождно перейти к ручке и бумаге. Верно?


 
Думкин ©   (2005-02-16 12:54) [43]

> [41] kaif ©   (16.02.05 12:50)

Это не важно. Речь об ином. Это уже другая задача. В этом случае берем стопроцентного эксперта - себя и все. Иначе - ошибки все одно не избежны.


 
kaif ©   (2005-02-16 12:56) [44]

Нужно:
1. Выбрать метод принятия решения (максправдоподобие/минимизация риска)
2. Иметь весовые коэффициенты для экспертов, которые должны уточняться со временем, в зависимости от того, насколько успешно отдельные эксперты решают конечную задачу, то есть система должна самообучаться.
3. Потом уже садиться и рисовать формулы, которые могут оказаться не совсем тривиальными, если, например, кроме СПАМ-а и не-СПАМа существуют еще какие-то вещи, например, вирусы или еще что-то. Представим себе, что эксперты "в среднем" оценили вероятность того, что письмо A:
  СПАМ 10%
  ВИРУС 20%
  Обычное письмо 90%
-------------------------
  Итого 120%

Как Вам такой результат? А он будет именно таким, если брать "тупое среднее".


 
Думкин ©   (2005-02-16 13:00) [45]

> [44] kaif ©   (16.02.05 12:56)

?! Ты решаешь другую задачу и уже предугадываешь действия среднего. Так нельзя. Не пиши никогда что ВСЕ рассуждения неверны кроме твоего - это ...


 
марсианин ©   (2005-02-16 13:03) [46]

2[41] kaif ©

> сколько нельзя ни в коем случае загубить важное письмо.

ну дык, это просто задача.. абстрактная.

в реальности и речи нет о вероятностях, такую гарантию может дать только отсутсвие фильтра.

ИМХО, спам никогда не следует фильтровать по содержанию..
я от спама никогда не страдал (тьфу-тьфу-тьфу), а от антиспама иногда приходилось..
одной своей подруге  я не могу писать из дома потому, что у нее провайдер занес моего районного провайдера в черный список.


 
kaif ©   (2005-02-16 13:10) [47]

Если это абстрактная задача, то она вообще некорректна.

Если же это реальная задача (а я так именно подумал, что речь шла о СПАМ-фильтре), то я дал свои рекомендации - подходить к этой задаче, как к задаче распознавания, а не задаче расчета вероятностей.
Если бы здесь сказали, что нужно предсказать какое решение принял Юлия Цезарь (начинать сражение или не начинать), когда авгуры сообщили о том, что священные куры (тогдашние "эксперты") "сегодня плохо ели червяков", то я бы предложил какой-то иной подход. Например:
 Решение Цезаря всегда обратно "среднему" решению кур.


 
Alx2 ©   (2005-02-16 13:30) [48]

Блин. Сам так и недопер.  Пришлось в инете найти :)

http://www.mathpages.com/home/kmath267.htm


 
Alx2 ©   (2005-02-16 13:50) [49]

А вот ее применение в спам-фильтрах:
http://www.eserv.ru/StatisticalSpamFiltering


 
марсианин ©   (2005-02-16 14:05) [50]

where
         p0 + p1 + p2 + p3 + p4 + p5 + p6 + p7 = 1


это-то ты и забыл написать


 
Alx2 ©   (2005-02-16 14:07) [51]

марсианин ©   (16.02.05 14:05) [50]

Вовсе не от тех "p" идет речь .

В том примере "Mr. Smith, who is correct 75% of the time"
и "Mr. Jones, who is correct 60% of the time" вместе  = 1.35


 
Alx2 ©   (2005-02-16 14:23) [52]

Думкин ©   (16.02.05 12:52) [42]

По линку, что давал в [48] видно, что построение такого эксперта возможно при условии независимости экспертов и симметричности наступления/ненаступления события о котором судят эксперты.


 
имя   (2005-02-16 15:42) [53]

Удалено модератором


 
имя   (2005-02-16 15:44) [54]

Удалено модератором


 
default ©   (2005-02-16 17:03) [55]

а по-моему здесь работает формула полной вероятности


 
kaif ©   (2005-02-16 17:12) [56]

2 Телевизор -))   (16.02.05 15:44) [54]
 Причем здесь ПОЛИТИЧЕСКАЯ или РЕЛИГИОЗНАЯ?
 Я думал здесь "Потрепаться".
 В любом случае я никого не задевал и не понимаю, откуда такой наезд. Вы хотите сказать, что я не умею говорить ни о чем, кроме религии или политики? А Вы типа умные и здесь вообще пипл хавает лишь математически точные вещи?
 Вам не стыдно в такой манере разговаривать с человеком, с которым Вы не знакомы и уж вряд ли имеете понятие о том, насколько он сведущ в математике?  
 Если нужно, я могу прокомментировать статью, на которую Alx2 © нашел ссылку. Если немного вникнуть в смысл постановки там, то это совсем другая задача:

Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur.  It would seem on this basis that the probability of X ocurring is 0.25.  On the other hand, Mr. Jones, who is correct 60% of the time, claims that X WILL occur.  Given both of these predictions, with their respective reliabilities, what is the probability that X will occur?

Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...
С другой стороны мистер Джонс оказывается прав в 60% случаев, когда говорит, что событие X наступит.

Это не то же самое, как когда эксперт Смит предсказывает, что событие X должно наступить с вероятностью 25%. А именно так и я и все остальные поняли постановку задачи:

На основании предсказаний всех экспертов нужно дать оценку вероятности события

И поэтому я сказал, что задача поставлена некорректно.
Одно дело, когда эксперты с какой-то верорятностью ошибаются. Тогда мы можем построить все пространство событий с вероятностями p1 ... p8, комбинируя все сочитания событий типа "эксперт ошибся". А совсем иное, когда мы имеем экспертов, которые заявляют о вероятностях и неизвестно с какой вероятностью при этом ошибаются.

В данном случае автор ветки задачу поставил в виде поиска функции зависимости вероятности события от мнений экспертов о вероятности этого события, а не как функцию от вероятности того, что эксперты правы, говоря, что A наступит обязательно, о чем идет речь в приведенной статье.

Так что сначала сами разберитесь с тем, какую задачу здесь решают, а уже затем переходите на личности.

:(


 
Alx2 ©   (2005-02-16 17:20) [57]

kaif ©   (16.02.05 17:12) [56]

>А именно так и я и все остальные поняли постановку задачи:

Я везде писал про вероятности того, что эксперт дал правильный (не правильный) ответ. А подробнее пояснил в посте [2]

Какая моя фраза сбила с толку, если читать в контексте постов, где она употребляется?


 
Alx2 ©   (2005-02-16 17:24) [58]

Вдогонку: перечитал наискосок ветку. Про "все остальные" - тоже не согласен. Везде речь идет о вероятности ошибки (или правоты) именно эксперта, а не о том, какую вероятность эксперт приписывает событию


 
Sandman25 ©   (2005-02-16 17:26) [59]

[56] kaif ©   (16.02.05 17:12)

Вы неверно перевели первое предложение, по-моему.


 
kaif ©   (2005-02-16 17:55) [60]

2 Sandman25 ©   (16.02.05 17:26) [59]

Я верно перевел. Могу перевести дословно:

Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur.  

Предположим, что мр. Смит, который оказывается корректен 75% времени, заявляет, что определенное событие X не произойдет.

Просто это не по-русски, поэтому я и перевожу как оказывается прав в 75% случаев, так как это, ИМХО, по-русски лучше звучит.

 2 Alx2 ©  
 Согласен, Вы во втором постинге изменили постановку задачи, но я подумал, что Вы изменили постановку, так как решаете реальную задачу по построению анитиспам-фильтра и потому счел важным напомнить о том, что это задача распознавания и нужно сначала выбирать метод (максправдоподобия или минимального риска), прежде чем задачу ставить в том или ином виде.

 Впрочем, если Вы полагаете, что Телевизор вправе говорить мне, что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное хавает", то мне нечего к сказанному добавить.

 Обсуждайте что хотите и как хотите. Я буду обсуждать РЕЛИГИЮ, ПОЛИТИКУ и ФИЛОСОФИЮ, по крайней мере "пипл" в тех ветках не так часто хамит без всякой причины.


 
Alx2 ©   (2005-02-16 18:13) [61]

kaif ©   (16.02.05 17:55) [60]

>Впрочем, если Вы полагаете, что Телевизор вправе говорить мне,
>что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное
>хавает", то мне нечего к сказанному добавить.

Видимо, именно это было поводом, чтобы зацепить постановку задачи.

А насчет Телевизора - понятия не имею: вправе он так говорить, или нет.


 
KSergey ©   (2005-02-16 18:22) [62]

> [56] kaif ©   (16.02.05 17:12)
> А именно так и я и все остальные поняли постановку задачи:

За всех не надо, ага?


 
Alx2 ©   (2005-02-16 18:32) [63]

kaif ©   (16.02.05 17:55) [60]

>Вы во втором постинге изменили постановку задачи, но я подумал,
>что Вы изменили постановку, так как решаете реальную задачу по
>построению анитиспам-фильтра и потому счел важным напомнить о
>том, что это задача распознавания и нужно сначала выбирать метод
>(максправдоподобия или минимального риска), прежде чем задачу
>ставить в том или ином виде.

Нет, Ашот. фильтры такие уже давно есть. У меня не получалось (и не получилось, в итоге - ответ к задачке подсмотрел) самостоятельно вывести оценку вероятности.


 
default ©   (2005-02-16 19:35) [64]

вот кстати интересная задача про монету:

Имеется несимметричная монета, для которой вероятность
выпадения орла есть неизвестное нам число p (0 < p < 1).
Покажите, как с её помощью можно имитировать симметричную
монету, сделав несколько бросаний.


 
марсианин ©   (2005-02-16 20:45) [65]

да.. не вчитался я внимательно в буржуйский текст сначала.. поторопился :)

да и вообще. чего спорить, правильный ответ (для оценки вероятности, а не спама)  - [35], имхо :)


 
Alx2 ©   (2005-02-16 21:04) [66]

марсианин ©   (16.02.05 20:45) [65]

Кстати, да. Сумму на произведение заменить - и все ok!


 
Sandman25 ©   (2005-02-17 08:55) [67]

[60] kaif ©   (16.02.05 17:55)

Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...

Вот это был неправильный перевод. Мистер Смит оказывается прав в 75% случаев всегда, независимо от того, что он говорит. То есть по-русски это предложение не должно иметь деепричастие "говоря", которое относится к "оказывается прав".
Предположим, что мистер Смит, который оказывается прав в 75% случаев, говорит, что событие X не наступит... То есть если он говорит, что не наступит, то он оказывается прав тоже в 75% случаев. Из Вашего перевода это вовсе не следует.



Страницы: 1 2 вся ветка

Форум: "Потрепаться";
Текущий архив: 2005.03.06;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.6 MB
Время: 0.035 c
1-1108641174
DimonNew
2005-02-17 14:52
2005.03.06
DBGrid + OnCellClick + Application.MessageBox


1-1109098654
Breakmaster
2005-02-22 21:57
2005.03.06
virtual key code


14-1108508124
GanibalLector
2005-02-16 01:55
2005.03.06
Дайджесты форумов


1-1109155988
Trajor
2005-02-23 13:53
2005.03.06
кодировки


11-1089967844
Falcon
2004-07-16 12:50
2005.03.06
ImageList и динамическая загрузка.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский