109387, Москва, ул. Люблинская, 42, офис 108 +7(495) 351-88-01 351-88-02 main@tiscom.ru
 277625523 tiscomputers  @olegshishlyannikov
Техподдержка:+7(985) 991-63-14 support@tiscom.ru

В чем отличия между десктопными и RAID-версиями жестких дисков?

 

Вопрос хочется продолжить: и почему второе дороже первого при одинаковых емкостных и скоростных характеристиках?
 
Давайте представим себе одиноко шуршащий жесткий диск. Как и все другие современные жесткие диски, он наделен определенной степенью интеллекта и имеет встроенную функцию автоматической коррекции ошибок. Создатели этой функции исходили из предпосылки, что жесткий диск при обнаружении ошибки чтения должен самостоятельно решать проблему, а не сообщать о ней другим устройствам в системе, загружая их ненужной дополнительной работой.
Причины ошибки чтения могут быть разными. Ошибка может быть обусловлена плохой читаемостью сектора (нестабильный сектор), сбоем при записи данных в сектор или другими какими-либо причинами. Сектор может быть просто частично размагничен – и тогда жесткий диск зафиксирует низкий уровень сигнала и, как следствие, ошибку.
Обнаружив ошибку, жесткий диск попробует исправить её. Для этого в тот же сектор данные будут записаны заново с последующим контрольным чтением. Если уровень сигнала по прежнему будет низким, данные будут перемещены в какой-нибудь незанятый сектор диска, а сектор, в котором обнаружена ошибка, будет помечен как дефектный и исключен из дальнейшего использования. Если данные в секторе не прочитаются, будет произведена попытка их восстановления по имеющимся кодам исправления ошибок (ECC, Error Correction Code).
Этот алгоритм отлично работает, если диск является самостоятельным устройством, а не частью RAID-массива. В RAID-массиве работой жестких дисков управляет RAID-контроллер.
В случае возникновения ошибки чтения-записи жесткий диск начинает заниматься их устранением в соответствии с алгоритмом, описанном выше. При этом диск не отправляет никаких соответствующих информационных сообщений и не отвечает на запросы системы. Диск "не знает" того, что в системе есть RAID контроллер, который может помочь ему восстановить работоспособность после обнаружения ошибки. В свою очередь, контроллер не понимает, почему жесткий диск стал аутистом и не реагирует на внешние команды. В результате этого грустного факта взаимного непонимания, как только устранение ошибки превышает по продолжительности 7-15 секунд (на разных контроллерах), RAID контроллер, не получая в течение этого периода времени ответа от диска, автоматически исключает его из массива. При этом массив, в зависимости от его типа, либо распадается, либо работает, до замены диска,  в режиме ограниченной  функциональности. Причем, если в период до восстановления массива после замены диска такие же неприятности произойдут еще с одним жестким диском, все сохраненные в массиве данные будут потеряны.
 
Подобная проблема выпадения дисков из RAID_массива коснулась жестких дисков всех производителей и наиболее часто возникала при выполнении компьютерами задач, связанных с большим количеством операций ввода-вывода (web-серверы, системы видеонаблюдения и тому подобное).
 
TLER (Time Limited Error Recovery) – Ограниченное время на коррекцию ошибки – так называется технология, решающая проблемы, описанные в этой статье. Диски с поддержкой данной технологии при обнаружении ошибки начинают стандартную процедуру ее коррекции, но, не уложившись в 7 секунд, отправляют RAID - контроллеру соответствующее сообщение и откладывают исправление ошибки до более удобного момента, например, до момента простоя системы. Как результат, у контроллера не возникает повода исключить диск из массива. Напротив, контроллер, получив уведомление о том, что у жесткого диска имеются отложенные проблемы с чтением-записью,  передает данные с учетом этого обстоятельства до тех пор, пока не получит от жесткого диска уведомление об исправлении ошибки. Для сохранения информации об ошибках чтения-записи на жестких дисках и исправлении этих ошибок контроллер ведет специальный журнал регистрации
 
Таким образом, TLER снижает вероятность отказа RAID массива, ограничивая время, которое диск тратит на восстановление работоспособности в случае обнаружения ошибки чтения-записи.