Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.07.29;
Скачать: CL | DM;

Вниз

Время наработки на отказ?   Найти похожие ветки 

 
NailMan ©   (2007-06-27 10:07) [0]

Возникла у меня тут такая непонятная хренатень.

Учавствую в тендере на поставку серверов(конфигурирую решение), и одним из главных интересов заказчика является сабж для сервера.

То есть ему интересно знать а какое же время наработки на отказ у всего сервера?

С моей точки зрения подобный вопрос вообще лищен смысла, так как сервер - это комплекс единичных устройств(которые имеют средний сабж сказанный производителем в оф. доках) и по идее должен ограничиваться минимальным временем наработки на отказ из всех его компонентов(скажем вентиляторов).

Как думаете, применим сабж к серверу в целом? Есть ли где че почитать в интете на конкретно эту тему? Нужно дать свои комменты для заказчика, но они должны быть чем-то мотивированны официально.


 
de.   (2007-06-27 10:16) [1]

Если вы фирма официальная, то:
1) Объясняете заказчику, что с такой просьбой сталкиваетесь в первый раз
2) По его желанию и по его карману если ему так угодно, производите группой специалистов расчет "время наработки на отказ у всего сервера"
3) Да и вообще  8-) по идеи есть гарантийные сроки, вот эти сроки и будут определять "время наработки на отказ у всего сервера"...
:-)


 
Ega23 ©   (2007-06-27 10:17) [2]

Мутное это дело.
Вот реальный пример: на одном крупном объекте (запускали систему летом 2001) стояло 2 сервера (какие-то от HP, модель точно не помню, но могу уточнить).
Один - основной, второй - условно резервный.
Сервер выступал как в роли доменного контроллера, так и в роли сервера БД (MSSQL).
За 6 лет сервера ни разу не падали. Из "профилактических" работ проводились:
1. Где-то раз в год пылесосили
2. 2 года назад заменили винты на более объёмные
3. Год назад добавили памяти.
4. 2 года назад меняли операционку (NT 4 на 2003)
5. Где-то в то же время меняли MSSQL с 7.0 на 2000
6. Несколько раз накатывали сервис-паки, как на ОС, так и на MSSQL.

В среднем, перезагрузка серверов производилась раз в 3-4 месяца (ночью, естественно). Т.е. штатные регламентные работы.

Отказов железа, вроде как и не было за все 6 лет эксплуатации.

А вот как это в цифирьках озвучить - фиг его знает. По-идее, брать заводские вероятности поломки каждого элемента и перемножать их.


 
TUser ©   (2007-06-27 11:02) [3]

Такая цифирь не имеет практического смысла, когда речь идет об одном сервере. Потому что нельзя определить время, когда он сломается, можно только время полужизни для популяции серверов. А конкретный ящик может сломаться хоть через неделю.

Если же говорить о многих железках с врменами t1, t2, ..., то общее время полужизни не есть минимум, а определяется так. Допустим вероятность не сломаться за время t равна р. Тогда вероятность того, что ничего не сломалось равна p=1-(1-p1)*(1-p2)*...=1/2 (1). Очевидно, что p(T)=1-exp(-kT), где к - некоторый коэффициен, а Т - время. Из этого легко находятся временна полужизни. Теперь надо подставитьэти экспоненты в (1) и найти такое Т, чтобы выполнялось равенство, т.е. решить 0,5 = 1 - exp (-(k1+k2+...)*t) => t = -ln0.5/(k1+k2+...), где t - время полужизни сервера. Теперь, ясно, что k=-ln0.5/t, где t - время полужизни, если есть такие времена для деталек, то и для сервера можно посчитать. Не уверен, что нигде ничего не перепутал, но кажется что-то похожее на правду получилось. Результат ткого расчета будет больше, чем просто минимум, т.к. за время этого минимума может сломаться не только наименее живучая деталь, но и вообще все, что угодно.

Также надо определиться с тем, что значит "сломалось". Вот, если лампочка power перегорела, то это сломалось? Формально, да.


 
NailMan ©   (2007-06-27 11:10) [4]

TUser ©
Вобщем я это и предполагал :-/


> Также надо определиться с тем, что значит "сломалось". Вот,
> если лампочка power перегорела, то это сломалось? Формально,
> да.

отказ како-го либо компонента. Материнка, проц, кулера(они там гоняют воздух через все железки, а не на процах), контроллер, диски и т.д и т.п. Вобщем съемные части, без которых сервер не рабоатет

---
P.L.U.R. and WBR, NailMan aka 2:5020/3337.13


 
tesseract ©   (2007-06-27 11:15) [5]


> отказ како-го либо компонента. Материнка, проц, кулера(они
> там гоняют воздух через все железки, а не на процах), контроллер,
>  диски и т.д и т.п. Вобщем съемные части, без которых сервер
> не рабоатет


Теорию надёжности уже не помню, но это был мозголомный предмет.
книга :
http://www.kdu.ru/description.aspx?product_no=57549

что-то по теме :
http://vsestudentu.info/modules.php?name=Downloads&d_op=viewdownload&cid=1


 
TUser ©   (2007-06-27 11:15) [6]

> Результат ткого расчета будет больше, чем просто минимум

Меньше, разумеется, если говорить о времени полураспада сервера.

Мышка бежала, хвостиком махнула, проводочек питательный вытянула ... сервер не работает :) Ну ладно, фигня все это.


 
tesseract ©   (2007-06-27 11:17) [7]


> Мышка бежала, хвостиком махнула, проводочек питательный
> вытянула ... сервер не работает :)


В реальной жизни мышек в серверной нет, там уборщицы - гроза интренета!


 
Mystic ©   (2007-06-27 11:33) [8]

Читай спецификацию железа, ищи параметр MTBF. Обычная офисная техника не является отказоустойчивой, поэтому если для заказчика важен этот параметр, то отметается.

Общая информация, например, тут:
http://www.icos.ru/distribution/production/fault-tolerant.html


 
Kostafey ©   (2007-06-27 13:46) [9]

А вот кстати, где можно найти характеристики надежности обычных
серверов. Скажем компании-производители предоставляют такие данные?


 
TUser ©   (2007-06-27 13:50) [10]

> tesseract ©   (27.06.07 11:17) [7]

Мышка - это форс-мажор, а уборщица - нарушение ТБ. :)


 
TUser ©   (2007-06-27 13:51) [11]

Точнее не ТБ, а условий эксплуатации.


 
NailMan ©   (2007-06-27 13:58) [12]

[9] Kostafey ©
Как я ща прозондировал это дело - не всякий сервер у одного производителя может иметь MTBF в своих характеристиках открыто распространяемых. Скажем у НР(чьими серерами я занимаюсь) MTBF указан только для тяжелых 4процовых серверов, а для двухпроцовых фиг.

не у всякого производителя моников найдешь MTBF и если найдешь, то он двойной - на лампу и все остальное в монике.

---
P.L.U.R. and WBR, NailMan aka 2:5020/3337.13



Страницы: 1 вся ветка

Текущий архив: 2007.07.29;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.019 c
5-1158051976
Alexey03
2006-09-12 13:06
2007.07.29
Как в эксперте создать кнопку на панели инструментов Delphi IDE?


15-1183008937
Slider007
2007-06-28 09:35
2007.07.29
С днем рождения ! 28 июня 2007 четверг


5-1158053164
demonnnn
2006-09-12 13:26
2007.07.29
тут вобще в создании компонентов кто нибудь понимает


2-1183623056
Vasyl
2007-07-05 12:10
2007.07.29
RxLookupEdit1


1-1179843462
olegz77
2007-05-22 18:17
2007.07.29
Компонент TChart - глюк при увеличении графика