Причины падения сервера

3 Июня 2022

Падение сервера, увы, достаточно частая проблема. И не только для системного администратора, но и всех пользователей, которые использовали его аппаратные мощности в рабочем процессе. Как результат – приостановленная деятельность бизнеса, потеря клиентов, неспособность удовлетворить их запросы, убытки. Продолжать этот перечень можно достаточно долго. Но стоит ли? Надо как можно быстрее поднимать сервер и не поддаваться панике. И первое, что предстоит сделать – установить причину неполадки. Только так можно будет устранить проблему и вернуть оборудование в рабочий режим. Так почему сервер падает? Можно ли предотвратить подобную проблему? Вот на этих моментах и остановимся более подробно.

Почему «падает» сервер

сервернаяПрежде, чем рассматривать наиболее распространенные причины выхода из строя оборудования, надо четко понимать, что значит сервер упал? Под этим термином специалисты понимают сбой или полный отказ в работе аппаратного обеспечения. И «лежать» он будет до тех пор, пока не установится причина падения, не устранятся ошибки.

Причин, по которым системное оборудование перестает работать, достаточно много. И их можно разделить на 3 отдельные категории:

  1. Наиболее распространенные.

  2. Технические неисправности.

  3. Человеческий фактор.

Наиболее распространенные причины падения сервера

Как показывает практика, наиболее распространенные причины падения сервера напрямую связаны с желанием сэкономить и халатным отношением системных администраторов к своим прямым обязательствам. Чаще всего возникают такие проблемы:

  • Физическое падение оборудования. Это произойдет тогда, когда перед установкой стойки для сервера не обустроить качественный фальшпол. Он должен быть идеально ровным. Плит должны плотно соприкасаться, не шататься, не проваливаться.

  • Проблемы с блоком питания после неожиданного отключения света. Высокая цена самого сервера – повод для многих экономить на чем-то ином. И часто это блок питания. При резком скачке напряжения, происходящем при внезапном отключении или повторном включении электричества этот узел может просто сгореть.

  • Использование в качестве сервера обычного компьютера. Еще одна причина выхода из строя оборудования, спровоцированная желанием сэкономить. Центр обработки данных должен основываться на оборудовании повышенной мощности и надежности. И обычный ПК этим требованиям никак не соответствует. Но, увы, далеко не все это понимают. Во многих офисах сегодня 1С бухгалтерия работает на обычных компьютерах. Смело или неразумно?

  • Перегрев аппаратного обеспечения. Для оптимальной работы сервера необходимо поддерживать температуру в помещении в пределах 18-22 0С. Более высокие показатели негативно скажутся на функциональности памяти, процессора, дисков и могу вызвать отказ в работе. Поэтому рекомендуется в серверной установить кондиционер и поддерживать постоянно требуемую температуру в рабочем пространстве.

  • Отсутствие автоматического ввода резерва (АВР). Этот блок позволяет подключать сервер к двум линиям PDU – основной и резервной. Если на одной из них пропадет питание, то оборудование будет получать энергию от второй. Если АВР не будет, то при отключении PDU сразу же упадет вся сеть вместе с маршрутизаторами, коммутаторами и прочими компонентами.

Технические неисправности

проблемы с оборудованиемЛюбая техника, даже самая новая и надежная может выходить из строя. Это может спровоцировать естественный износ компонентов, их моральное устаревание, механические повреждения и пр. Больше всего поломкам подвержено аппаратное обеспечение, при эксплуатации которого регулярно нарушаются нормы и требования, превышаются допустимые нагрузки. Так, падение сервера может спровоцировать:

  • Поломка HDD. Для работы сервера требуются особые диски. Те, что предназначаются для персональных компьютеров сюда не подходят. Да, серверные винчестеры стоят дороже, а срок их эксплуатации в рейде не превышает 4-х лет. И даже если по прошествию этого времени диск будет продолжать работать, и вы не заметите никаких проблем с ним, его все равно надо менять на новый. По истечению 4-х лет он в любой момент может выйти из строя, «уложить» сервер и удалить всю рабочую документацию. К этой же категории причин, вызывающих сбой сервера можно отнести использование в таком аппаратном обеспечении жестких дисков от персональных компьютеров.

  • Превышение допустимой нагрузки на автоматический ввод резерва. Когда сервер включается, выполняется его перезагрузка, происходит скачок потребления электроэнергии. В случае, если ваш АВР загружен примерно на 75%, то кратковременное повышение нагрузки на нем никак не скажется. Но если этот показатель при работе в штатном режиме будет выше, то резко возрастает вероятность того, что автоматический ввод резерва просто перегорит при запуске на повышенной мощности.

  • Перегорание проводов. Если с целью экономии в серверном аппаратном обеспечении использовались тонкие, дешевые кабели, то в рабочем процессе они могут просто перегореть. Особенно часто это происходит при скачках напряжения. А если учесть тот факт, что в большинстве серверных используются сотни проводов, отыскать среди них перегоревший будет не так уж и просто. Это потребует много времени и усилий.

  • Чрезмерный износ аккумуляторов, питающих источник бесперебойного питания. Все аккумуляторы со временем эксплуатации теряют свою емкость. Она может опускаться до тех пределов, пока устройство не сможет уже работать. И если в вашем источнике бесперебойного питания будет установлена старая батарея, он не сможет поддержать работу сервера при внезапном отключении электроэнергии. Как результат – скачок напряжения. А это уже может спровоцировать выход из строя как блока питания, так и памяти и даже процессора. Помните: за состоянием аккумулятора необходимо постоянно следить и не допускать падения его емкости до критических показателей. Батарейка – мелочь. Но из-за ее плохого состояния можно в одно мгновение уничтожить сотни терабайтов данных. Поэтому по мере ее износа, надо выполнять замену.

Человеческий фактор

ошибки администратора сервераЗдесь выделим 2 основные причины сбоя серверов, связанные с низкой компетентностью персонала или недобросовестным отношением к работе:

  1. Ошибки, допущенные при подключении аппаратного обеспечения. Это может быть подключение к одному PDU обоих кабелей АВР или двух блоков питания, установка в одну стойку избыточного числа устройств (резервных мощностей PDU будет недостаточно для поддержания стабильной работы), подсоединение оборудования из одной стойки к другой. Наиболее часто сисадмины смешивают контролеры домена с файловым или прокси-сервером, 1С, MS SQL. Чтобы исключить появление таких проблем, следует периодически проверять индикацию устройств.

  2. Халатное отношение к выполняемым работам. Так, сервер может упасть от того, что на него будет установлено нелицензионное аппаратное обеспечение, если на одной машине одновременно запустить несколько энергоемких сервисов. Проблемы могут возникнуть и от допуска к работе в ЦОД сторонних лиц, при отключении антивирусного ПО, фаервола.

  3. Использование встроенной учетной записи администратора по адресу. Она подвергается очень быстрому и простому взлому. И не надо быть слишком опытным «специалистом», чтобы хакнуть ее. Достаточно злоумышленнику просто проявить небольшую активность и все – доступ получен. Не забывайте отключать учетную запись. Будет еще лучше, если вы ее переименуете через групповые политики.

Минимизировать негативные последствия, связанные с влиянием человеческого фактора можно, если регулярно делать резервные копии. В это случае при падении сервера можно будет восстановить большую часть утраченной информации, что немаловажно для любого бизнеса. Ставку стоит делать на системных администраторов, которые не просто делают резервные копии, а еще и регулярно проверяют их. Использование специализированных программных комплексов – реальная возможность узнать о наличии проблемы (сообщения автоматически будут выводиться на экран) еще на этапе ее зарождения и смогут предотвратить серьезные последствия.

Стабильность работы сервера также во многом зависит от регулярности проведения мониторинга логов, проверки работоспособности оборудования и сетевых соединений, профилактических мероприятий. Диагностика должна выполняться после окончания рабочего дня, что позволит исключить простой сотрудников компании.

Как избежать падения сервера?

С проблемами падения сервера может столкнуться любая компания. Известны случаи, когда подобные проблемы возникали в таких мировых корпорациях, как Скайп, Амазон, Сони и пр. Компании стараются не афишировать подобные события, ведь они могут повлечь за собой снижение доверия со стороны клиентов.

Да, есть универсальные советов насчет того, как избежать падения сервера. Речь идет о профессиональных системных администраторах. Тех, кто с полной ответственностью будет подходить к выполнению поставленных задач. Кто будет следить за оборудованием, выполнять резервное копирование, использовать лицензионные приложения и соответствующие комплектующие.

Сервер упал, что делать, как найти причину, как устранить ее, как восстановить информацию? Вопросов много, и чтобы ответить на каждый из них, требуется много времени и усилий. И никто не даст гарантий, что все их можно будет решить и вернуть оборудование к стабильной работе без потери данных. Поэтому подобные проблемы проще предотвратить, чем устранять. И компетентную помощь в этом готова предоставить компания «Xelent». Мы предлагаем профессиональные услуги веб-хостинга частным и корпоративным клиентам. Имеем огромный опыт в размещении серверного аппаратного обеспечения, выполнении соответствующих операционных настроек и администрирования всевозможных онлайн бизнес проектов.

Обращайтесь к нашим специалистам, чтобы получить дополнительные консультации и более подробно узнать об особенностях сотрудничества.

Популярные услуги
Получить консультацию специалиста
Персональный ассистент
Cloud.Xelent