Форум: "Потрепаться";
Текущий архив: 2005.03.06;
Скачать: [xml.tar.bz2];
ВнизЗадачка Найти похожие ветки
← →
Alx2 © (2005-02-16 12:45) [40]Думкин © (16.02.05 12:41) [38]
Дим, чутье подсказывает, что других (хороших) экспертов со счета сбрасывать не стоит. Если эксперт с p = 0.9 говорит, что не спам. А десяток с p=0.85 говорит, что спам - есть резон верить им.
← →
kaif © (2005-02-16 12:50) [41]Все рассуждения неверны.
Из оценок экспертов никак не вытекает "правильная" оценка вероятности A.
Нужен еще критерий оценки.
Если использовать критерий максправдоподобия, то вероятность того, что нечто - СПАМ должна зависеть в большей степени от априорной вероятности того, что это СПАМ. нежели от мнения экспертов, анализирующих сами письма на "СПАМ"-ность.
Если же использовать критерий минимального риска, то все зависит от "цены ошибки".
Одно дело - фильтровать на "СПАМ"ность письма от читателей газеты СПИДИНФО, другое дело - фильтровать на "СПАМ"ность письма с сообщениями агентов эпидемологической службы, когда не столько важно отсеять СПАМ, сколько нельзя ни в коем случае загубить важное письмо.
← →
Думкин © (2005-02-16 12:52) [42]> [40] Alx2 © (16.02.05 12:45)
Я тебе и говорю про локоть. Вот сможешь ли ты посторить такого обобщенного эксперта который будет определять с вероятностью большей чем самый умный - тут и задача. Ведь с этого началось и продолжилось.
Потому что сам понимаешь, что Сигма(положительных)/(их количество)<= максимального.
А вот теперь и задача есть. Теперь от укуса локтя, мождно перейти к ручке и бумаге. Верно?
← →
Думкин © (2005-02-16 12:54) [43]> [41] kaif © (16.02.05 12:50)
Это не важно. Речь об ином. Это уже другая задача. В этом случае берем стопроцентного эксперта - себя и все. Иначе - ошибки все одно не избежны.
← →
kaif © (2005-02-16 12:56) [44]Нужно:
1. Выбрать метод принятия решения (максправдоподобие/минимизация риска)
2. Иметь весовые коэффициенты для экспертов, которые должны уточняться со временем, в зависимости от того, насколько успешно отдельные эксперты решают конечную задачу, то есть система должна самообучаться.
3. Потом уже садиться и рисовать формулы, которые могут оказаться не совсем тривиальными, если, например, кроме СПАМ-а и не-СПАМа существуют еще какие-то вещи, например, вирусы или еще что-то. Представим себе, что эксперты "в среднем" оценили вероятность того, что письмо A:
СПАМ 10%
ВИРУС 20%
Обычное письмо 90%
-------------------------
Итого 120%
Как Вам такой результат? А он будет именно таким, если брать "тупое среднее".
← →
Думкин © (2005-02-16 13:00) [45]> [44] kaif © (16.02.05 12:56)
?! Ты решаешь другую задачу и уже предугадываешь действия среднего. Так нельзя. Не пиши никогда что ВСЕ рассуждения неверны кроме твоего - это ...
← →
марсианин © (2005-02-16 13:03) [46]2[41] kaif ©
> сколько нельзя ни в коем случае загубить важное письмо.
ну дык, это просто задача.. абстрактная.
в реальности и речи нет о вероятностях, такую гарантию может дать только отсутсвие фильтра.
ИМХО, спам никогда не следует фильтровать по содержанию..
я от спама никогда не страдал (тьфу-тьфу-тьфу), а от антиспама иногда приходилось..
одной своей подруге я не могу писать из дома потому, что у нее провайдер занес моего районного провайдера в черный список.
← →
kaif © (2005-02-16 13:10) [47]Если это абстрактная задача, то она вообще некорректна.
Если же это реальная задача (а я так именно подумал, что речь шла о СПАМ-фильтре), то я дал свои рекомендации - подходить к этой задаче, как к задаче распознавания, а не задаче расчета вероятностей.
Если бы здесь сказали, что нужно предсказать какое решение принял Юлия Цезарь (начинать сражение или не начинать), когда авгуры сообщили о том, что священные куры (тогдашние "эксперты") "сегодня плохо ели червяков", то я бы предложил какой-то иной подход. Например:
Решение Цезаря всегда обратно "среднему" решению кур.
← →
Alx2 © (2005-02-16 13:30) [48]Блин. Сам так и недопер. Пришлось в инете найти :)
http://www.mathpages.com/home/kmath267.htm
← →
Alx2 © (2005-02-16 13:50) [49]А вот ее применение в спам-фильтрах:
http://www.eserv.ru/StatisticalSpamFiltering
← →
марсианин © (2005-02-16 14:05) [50]where
p0 + p1 + p2 + p3 + p4 + p5 + p6 + p7 = 1
это-то ты и забыл написать
← →
Alx2 © (2005-02-16 14:07) [51]марсианин © (16.02.05 14:05) [50]
Вовсе не от тех "p" идет речь .
В том примере "Mr. Smith, who is correct 75% of the time"
и "Mr. Jones, who is correct 60% of the time" вместе = 1.35
← →
Alx2 © (2005-02-16 14:23) [52]Думкин © (16.02.05 12:52) [42]
По линку, что давал в [48] видно, что построение такого эксперта возможно при условии независимости экспертов и симметричности наступления/ненаступления события о котором судят эксперты.
← →
имя (2005-02-16 15:42) [53]Удалено модератором
← →
имя (2005-02-16 15:44) [54]Удалено модератором
← →
default © (2005-02-16 17:03) [55]а по-моему здесь работает формула полной вероятности
← →
kaif © (2005-02-16 17:12) [56]2 Телевизор -)) (16.02.05 15:44) [54]
Причем здесь ПОЛИТИЧЕСКАЯ или РЕЛИГИОЗНАЯ?
Я думал здесь "Потрепаться".
В любом случае я никого не задевал и не понимаю, откуда такой наезд. Вы хотите сказать, что я не умею говорить ни о чем, кроме религии или политики? А Вы типа умные и здесь вообще пипл хавает лишь математически точные вещи?
Вам не стыдно в такой манере разговаривать с человеком, с которым Вы не знакомы и уж вряд ли имеете понятие о том, насколько он сведущ в математике?
Если нужно, я могу прокомментировать статью, на которую Alx2 © нашел ссылку. Если немного вникнуть в смысл постановки там, то это совсем другая задача:Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur. It would seem on this basis that the probability of X ocurring is 0.25. On the other hand, Mr. Jones, who is correct 60% of the time, claims that X WILL occur. Given both of these predictions, with their respective reliabilities, what is the probability that X will occur?
Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...
С другой стороны мистер Джонс оказывается прав в 60% случаев, когда говорит, что событие X наступит.
Это не то же самое, как когда эксперт Смит предсказывает, что событие X должно наступить с вероятностью 25%. А именно так и я и все остальные поняли постановку задачи:
На основании предсказаний всех экспертов нужно дать оценку вероятности события
И поэтому я сказал, что задача поставлена некорректно.
Одно дело, когда эксперты с какой-то верорятностью ошибаются. Тогда мы можем построить все пространство событий с вероятностями p1 ... p8, комбинируя все сочитания событий типа "эксперт ошибся". А совсем иное, когда мы имеем экспертов, которые заявляют о вероятностях и неизвестно с какой вероятностью при этом ошибаются.
В данном случае автор ветки задачу поставил в виде поиска функции зависимости вероятности события от мнений экспертов о вероятности этого события, а не как функцию от вероятности того, что эксперты правы, говоря, что A наступит обязательно, о чем идет речь в приведенной статье.
Так что сначала сами разберитесь с тем, какую задачу здесь решают, а уже затем переходите на личности.
:(
← →
Alx2 © (2005-02-16 17:20) [57]kaif © (16.02.05 17:12) [56]
>А именно так и я и все остальные поняли постановку задачи:
Я везде писал про вероятности того, что эксперт дал правильный (не правильный) ответ. А подробнее пояснил в посте [2]
Какая моя фраза сбила с толку, если читать в контексте постов, где она употребляется?
← →
Alx2 © (2005-02-16 17:24) [58]Вдогонку: перечитал наискосок ветку. Про "все остальные" - тоже не согласен. Везде речь идет о вероятности ошибки (или правоты) именно эксперта, а не о том, какую вероятность эксперт приписывает событию
← →
Sandman25 © (2005-02-16 17:26) [59][56] kaif © (16.02.05 17:12)
Вы неверно перевели первое предложение, по-моему.
← →
kaif © (2005-02-16 17:55) [60]2 Sandman25 © (16.02.05 17:26) [59]
Я верно перевел. Могу перевести дословно:Suppose that Mr. Smith, who is correct 75% of the time, claims that a certain event X will NOT occur.
Предположим, что мр. Смит, который оказывается корректен 75% времени, заявляет, что определенное событие X не произойдет.
Просто это не по-русски, поэтому я и перевожу как оказывается прав в 75% случаев, так как это, ИМХО, по-русски лучше звучит.
2 Alx2 ©
Согласен, Вы во втором постинге изменили постановку задачи, но я подумал, что Вы изменили постановку, так как решаете реальную задачу по построению анитиспам-фильтра и потому счел важным напомнить о том, что это задача распознавания и нужно сначала выбирать метод (максправдоподобия или минимального риска), прежде чем задачу ставить в том или ином виде.
Впрочем, если Вы полагаете, что Телевизор вправе говорить мне, что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное хавает", то мне нечего к сказанному добавить.
Обсуждайте что хотите и как хотите. Я буду обсуждать РЕЛИГИЮ, ПОЛИТИКУ и ФИЛОСОФИЮ, по крайней мере "пипл" в тех ветках не так часто хамит без всякой причины.
← →
Alx2 © (2005-02-16 18:13) [61]kaif © (16.02.05 17:55) [60]
>Впрочем, если Вы полагаете, что Телевизор вправе говорить мне,
>что "здесь не ветка про РЕЛИГИЮ или ПОЛИТИКУ и здесь пипл иное
>хавает", то мне нечего к сказанному добавить.
Видимо, именно это было поводом, чтобы зацепить постановку задачи.
А насчет Телевизора - понятия не имею: вправе он так говорить, или нет.
← →
KSergey © (2005-02-16 18:22) [62]> [56] kaif © (16.02.05 17:12)
> А именно так и я и все остальные поняли постановку задачи:
За всех не надо, ага?
← →
Alx2 © (2005-02-16 18:32) [63]kaif © (16.02.05 17:55) [60]
>Вы во втором постинге изменили постановку задачи, но я подумал,
>что Вы изменили постановку, так как решаете реальную задачу по
>построению анитиспам-фильтра и потому счел важным напомнить о
>том, что это задача распознавания и нужно сначала выбирать метод
>(максправдоподобия или минимального риска), прежде чем задачу
>ставить в том или ином виде.
Нет, Ашот. фильтры такие уже давно есть. У меня не получалось (и не получилось, в итоге - ответ к задачке подсмотрел) самостоятельно вывести оценку вероятности.
← →
default © (2005-02-16 19:35) [64]вот кстати интересная задача про монету:
Имеется несимметричная монета, для которой вероятность
выпадения орла есть неизвестное нам число p (0 < p < 1).
Покажите, как с её помощью можно имитировать симметричную
монету, сделав несколько бросаний.
← →
марсианин © (2005-02-16 20:45) [65]да.. не вчитался я внимательно в буржуйский текст сначала.. поторопился :)
да и вообще. чего спорить, правильный ответ (для оценки вероятности, а не спама) - [35], имхо :)
← →
Alx2 © (2005-02-16 21:04) [66]марсианин © (16.02.05 20:45) [65]
Кстати, да. Сумму на произведение заменить - и все ok!
← →
Sandman25 © (2005-02-17 08:55) [67][60] kaif © (16.02.05 17:55)
Предположим, что мистер Смит оказывается прав в 75% случаев, говоря, что событие X не наступит...
Вот это был неправильный перевод. Мистер Смит оказывается прав в 75% случаев всегда, независимо от того, что он говорит. То есть по-русски это предложение не должно иметь деепричастие "говоря", которое относится к "оказывается прав".
Предположим, что мистер Смит, который оказывается прав в 75% случаев, говорит, что событие X не наступит... То есть если он говорит, что не наступит, то он оказывается прав тоже в 75% случаев. Из Вашего перевода это вовсе не следует.
Страницы: 1 2 вся ветка
Форум: "Потрепаться";
Текущий архив: 2005.03.06;
Скачать: [xml.tar.bz2];
Память: 0.6 MB
Время: 0.035 c