Форум: "Прочее";
Текущий архив: 2007.07.29;
Скачать: [xml.tar.bz2];
ВнизВремя наработки на отказ? Найти похожие ветки
← →
NailMan © (2007-06-27 10:07) [0]Возникла у меня тут такая непонятная хренатень.
Учавствую в тендере на поставку серверов(конфигурирую решение), и одним из главных интересов заказчика является сабж для сервера.
То есть ему интересно знать а какое же время наработки на отказ у всего сервера?
С моей точки зрения подобный вопрос вообще лищен смысла, так как сервер - это комплекс единичных устройств(которые имеют средний сабж сказанный производителем в оф. доках) и по идее должен ограничиваться минимальным временем наработки на отказ из всех его компонентов(скажем вентиляторов).
Как думаете, применим сабж к серверу в целом? Есть ли где че почитать в интете на конкретно эту тему? Нужно дать свои комменты для заказчика, но они должны быть чем-то мотивированны официально.
← →
de. (2007-06-27 10:16) [1]Если вы фирма официальная, то:
1) Объясняете заказчику, что с такой просьбой сталкиваетесь в первый раз
2) По его желанию и по его карману если ему так угодно, производите группой специалистов расчет "время наработки на отказ у всего сервера"
3) Да и вообще 8-) по идеи есть гарантийные сроки, вот эти сроки и будут определять "время наработки на отказ у всего сервера"...
:-)
← →
Ega23 © (2007-06-27 10:17) [2]Мутное это дело.
Вот реальный пример: на одном крупном объекте (запускали систему летом 2001) стояло 2 сервера (какие-то от HP, модель точно не помню, но могу уточнить).
Один - основной, второй - условно резервный.
Сервер выступал как в роли доменного контроллера, так и в роли сервера БД (MSSQL).
За 6 лет сервера ни разу не падали. Из "профилактических" работ проводились:
1. Где-то раз в год пылесосили
2. 2 года назад заменили винты на более объёмные
3. Год назад добавили памяти.
4. 2 года назад меняли операционку (NT 4 на 2003)
5. Где-то в то же время меняли MSSQL с 7.0 на 2000
6. Несколько раз накатывали сервис-паки, как на ОС, так и на MSSQL.
В среднем, перезагрузка серверов производилась раз в 3-4 месяца (ночью, естественно). Т.е. штатные регламентные работы.
Отказов железа, вроде как и не было за все 6 лет эксплуатации.
А вот как это в цифирьках озвучить - фиг его знает. По-идее, брать заводские вероятности поломки каждого элемента и перемножать их.
← →
TUser © (2007-06-27 11:02) [3]Такая цифирь не имеет практического смысла, когда речь идет об одном сервере. Потому что нельзя определить время, когда он сломается, можно только время полужизни для популяции серверов. А конкретный ящик может сломаться хоть через неделю.
Если же говорить о многих железках с врменами t1, t2, ..., то общее время полужизни не есть минимум, а определяется так. Допустим вероятность не сломаться за время t равна р. Тогда вероятность того, что ничего не сломалось равна p=1-(1-p1)*(1-p2)*...=1/2 (1). Очевидно, что p(T)=1-exp(-kT), где к - некоторый коэффициен, а Т - время. Из этого легко находятся временна полужизни. Теперь надо подставитьэти экспоненты в (1) и найти такое Т, чтобы выполнялось равенство, т.е. решить 0,5 = 1 - exp (-(k1+k2+...)*t) => t = -ln0.5/(k1+k2+...), где t - время полужизни сервера. Теперь, ясно, что k=-ln0.5/t, где t - время полужизни, если есть такие времена для деталек, то и для сервера можно посчитать. Не уверен, что нигде ничего не перепутал, но кажется что-то похожее на правду получилось. Результат ткого расчета будет больше, чем просто минимум, т.к. за время этого минимума может сломаться не только наименее живучая деталь, но и вообще все, что угодно.
Также надо определиться с тем, что значит "сломалось". Вот, если лампочка power перегорела, то это сломалось? Формально, да.
← →
NailMan © (2007-06-27 11:10) [4]TUser ©
Вобщем я это и предполагал :-/
> Также надо определиться с тем, что значит "сломалось". Вот,
> если лампочка power перегорела, то это сломалось? Формально,
> да.
отказ како-го либо компонента. Материнка, проц, кулера(они там гоняют воздух через все железки, а не на процах), контроллер, диски и т.д и т.п. Вобщем съемные части, без которых сервер не рабоатет
---
P.L.U.R. and WBR, NailMan aka 2:5020/3337.13
← →
tesseract © (2007-06-27 11:15) [5]
> отказ како-го либо компонента. Материнка, проц, кулера(они
> там гоняют воздух через все железки, а не на процах), контроллер,
> диски и т.д и т.п. Вобщем съемные части, без которых сервер
> не рабоатет
Теорию надёжности уже не помню, но это был мозголомный предмет.
книга :
http://www.kdu.ru/description.aspx?product_no=57549
что-то по теме :
http://vsestudentu.info/modules.php?name=Downloads&d_op=viewdownload&cid=1
← →
TUser © (2007-06-27 11:15) [6]> Результат ткого расчета будет больше, чем просто минимум
Меньше, разумеется, если говорить о времени полураспада сервера.
Мышка бежала, хвостиком махнула, проводочек питательный вытянула ... сервер не работает :) Ну ладно, фигня все это.
← →
tesseract © (2007-06-27 11:17) [7]
> Мышка бежала, хвостиком махнула, проводочек питательный
> вытянула ... сервер не работает :)
В реальной жизни мышек в серверной нет, там уборщицы - гроза интренета!
← →
Mystic © (2007-06-27 11:33) [8]Читай спецификацию железа, ищи параметр MTBF. Обычная офисная техника не является отказоустойчивой, поэтому если для заказчика важен этот параметр, то отметается.
Общая информация, например, тут:
http://www.icos.ru/distribution/production/fault-tolerant.html
← →
Kostafey © (2007-06-27 13:46) [9]А вот кстати, где можно найти характеристики надежности обычных
серверов. Скажем компании-производители предоставляют такие данные?
← →
TUser © (2007-06-27 13:50) [10]> tesseract © (27.06.07 11:17) [7]
Мышка - это форс-мажор, а уборщица - нарушение ТБ. :)
← →
TUser © (2007-06-27 13:51) [11]Точнее не ТБ, а условий эксплуатации.
← →
NailMan © (2007-06-27 13:58) [12][9] Kostafey ©
Как я ща прозондировал это дело - не всякий сервер у одного производителя может иметь MTBF в своих характеристиках открыто распространяемых. Скажем у НР(чьими серерами я занимаюсь) MTBF указан только для тяжелых 4процовых серверов, а для двухпроцовых фиг.
не у всякого производителя моников найдешь MTBF и если найдешь, то он двойной - на лампу и все остальное в монике.
---
P.L.U.R. and WBR, NailMan aka 2:5020/3337.13
Страницы: 1 вся ветка
Форум: "Прочее";
Текущий архив: 2007.07.29;
Скачать: [xml.tar.bz2];
Память: 0.48 MB
Время: 0.048 c