Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2007.07.29;
Скачать: [xml.tar.bz2];

Вниз

Время наработки на отказ?   Найти похожие ветки 

 
NailMan ©   (2007-06-27 10:07) [0]

Возникла у меня тут такая непонятная хренатень.

Учавствую в тендере на поставку серверов(конфигурирую решение), и одним из главных интересов заказчика является сабж для сервера.

То есть ему интересно знать а какое же время наработки на отказ у всего сервера?

С моей точки зрения подобный вопрос вообще лищен смысла, так как сервер - это комплекс единичных устройств(которые имеют средний сабж сказанный производителем в оф. доках) и по идее должен ограничиваться минимальным временем наработки на отказ из всех его компонентов(скажем вентиляторов).

Как думаете, применим сабж к серверу в целом? Есть ли где че почитать в интете на конкретно эту тему? Нужно дать свои комменты для заказчика, но они должны быть чем-то мотивированны официально.


 
de.   (2007-06-27 10:16) [1]

Если вы фирма официальная, то:
1) Объясняете заказчику, что с такой просьбой сталкиваетесь в первый раз
2) По его желанию и по его карману если ему так угодно, производите группой специалистов расчет "время наработки на отказ у всего сервера"
3) Да и вообще  8-) по идеи есть гарантийные сроки, вот эти сроки и будут определять "время наработки на отказ у всего сервера"...
:-)


 
Ega23 ©   (2007-06-27 10:17) [2]

Мутное это дело.
Вот реальный пример: на одном крупном объекте (запускали систему летом 2001) стояло 2 сервера (какие-то от HP, модель точно не помню, но могу уточнить).
Один - основной, второй - условно резервный.
Сервер выступал как в роли доменного контроллера, так и в роли сервера БД (MSSQL).
За 6 лет сервера ни разу не падали. Из "профилактических" работ проводились:
1. Где-то раз в год пылесосили
2. 2 года назад заменили винты на более объёмные
3. Год назад добавили памяти.
4. 2 года назад меняли операционку (NT 4 на 2003)
5. Где-то в то же время меняли MSSQL с 7.0 на 2000
6. Несколько раз накатывали сервис-паки, как на ОС, так и на MSSQL.

В среднем, перезагрузка серверов производилась раз в 3-4 месяца (ночью, естественно). Т.е. штатные регламентные работы.

Отказов железа, вроде как и не было за все 6 лет эксплуатации.

А вот как это в цифирьках озвучить - фиг его знает. По-идее, брать заводские вероятности поломки каждого элемента и перемножать их.


 
TUser ©   (2007-06-27 11:02) [3]

Такая цифирь не имеет практического смысла, когда речь идет об одном сервере. Потому что нельзя определить время, когда он сломается, можно только время полужизни для популяции серверов. А конкретный ящик может сломаться хоть через неделю.

Если же говорить о многих железках с врменами t1, t2, ..., то общее время полужизни не есть минимум, а определяется так. Допустим вероятность не сломаться за время t равна р. Тогда вероятность того, что ничего не сломалось равна p=1-(1-p1)*(1-p2)*...=1/2 (1). Очевидно, что p(T)=1-exp(-kT), где к - некоторый коэффициен, а Т - время. Из этого легко находятся временна полужизни. Теперь надо подставитьэти экспоненты в (1) и найти такое Т, чтобы выполнялось равенство, т.е. решить 0,5 = 1 - exp (-(k1+k2+...)*t) => t = -ln0.5/(k1+k2+...), где t - время полужизни сервера. Теперь, ясно, что k=-ln0.5/t, где t - время полужизни, если есть такие времена для деталек, то и для сервера можно посчитать. Не уверен, что нигде ничего не перепутал, но кажется что-то похожее на правду получилось. Результат ткого расчета будет больше, чем просто минимум, т.к. за время этого минимума может сломаться не только наименее живучая деталь, но и вообще все, что угодно.

Также надо определиться с тем, что значит "сломалось". Вот, если лампочка power перегорела, то это сломалось? Формально, да.


 
NailMan ©   (2007-06-27 11:10) [4]

TUser ©
Вобщем я это и предполагал :-/


> Также надо определиться с тем, что значит "сломалось". Вот,
> если лампочка power перегорела, то это сломалось? Формально,
> да.

отказ како-го либо компонента. Материнка, проц, кулера(они там гоняют воздух через все железки, а не на процах), контроллер, диски и т.д и т.п. Вобщем съемные части, без которых сервер не рабоатет

---
P.L.U.R. and WBR, NailMan aka 2:5020/3337.13


 
tesseract ©   (2007-06-27 11:15) [5]


> отказ како-го либо компонента. Материнка, проц, кулера(они
> там гоняют воздух через все железки, а не на процах), контроллер,
>  диски и т.д и т.п. Вобщем съемные части, без которых сервер
> не рабоатет


Теорию надёжности уже не помню, но это был мозголомный предмет.
книга :
http://www.kdu.ru/description.aspx?product_no=57549

что-то по теме :
http://vsestudentu.info/modules.php?name=Downloads&d_op=viewdownload&cid=1


 
TUser ©   (2007-06-27 11:15) [6]

> Результат ткого расчета будет больше, чем просто минимум

Меньше, разумеется, если говорить о времени полураспада сервера.

Мышка бежала, хвостиком махнула, проводочек питательный вытянула ... сервер не работает :) Ну ладно, фигня все это.


 
tesseract ©   (2007-06-27 11:17) [7]


> Мышка бежала, хвостиком махнула, проводочек питательный
> вытянула ... сервер не работает :)


В реальной жизни мышек в серверной нет, там уборщицы - гроза интренета!


 
Mystic ©   (2007-06-27 11:33) [8]

Читай спецификацию железа, ищи параметр MTBF. Обычная офисная техника не является отказоустойчивой, поэтому если для заказчика важен этот параметр, то отметается.

Общая информация, например, тут:
http://www.icos.ru/distribution/production/fault-tolerant.html


 
Kostafey ©   (2007-06-27 13:46) [9]

А вот кстати, где можно найти характеристики надежности обычных
серверов. Скажем компании-производители предоставляют такие данные?


 
TUser ©   (2007-06-27 13:50) [10]

> tesseract ©   (27.06.07 11:17) [7]

Мышка - это форс-мажор, а уборщица - нарушение ТБ. :)


 
TUser ©   (2007-06-27 13:51) [11]

Точнее не ТБ, а условий эксплуатации.


 
NailMan ©   (2007-06-27 13:58) [12]

[9] Kostafey ©
Как я ща прозондировал это дело - не всякий сервер у одного производителя может иметь MTBF в своих характеристиках открыто распространяемых. Скажем у НР(чьими серерами я занимаюсь) MTBF указан только для тяжелых 4процовых серверов, а для двухпроцовых фиг.

не у всякого производителя моников найдешь MTBF и если найдешь, то он двойной - на лампу и все остальное в монике.

---
P.L.U.R. and WBR, NailMan aka 2:5020/3337.13



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2007.07.29;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.047 c
15-1183015789
de.
2007-06-28 11:29
2007.07.29
Нужна картинка


15-1183486078
ttimetabler
2007-07-03 22:07
2007.07.29
помогите определить время :)


15-1183006920
John_Korsh
2007-06-28 09:02
2007.07.29
Вопрос по сетям.


2-1183723063
Aragorn
2007-07-06 15:57
2007.07.29
TStrings.Items.Objects


15-1183160038
O.O
2007-06-30 03:33
2007.07.29
D6 и Vista





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский