Пошук несправностей в мікропроцесорних системах

 

1 Методика діагностики мікропроцесорної системи

2 Відновлення BIOS

3 Процедура самотестування (POST)

4 POST-плата

5 Тестування пам'яті

6 SMART

7 Текстові помилки BIOS

8 Повідомлення Blue Screen of Death

 

 

1 Методика діагностики мікропроцесорної системи

 

Більшість несправностей досить прості і їх можливо виявити нескладним приладом. Відправною точкою при роботі з схемною платою є ідентифікація основних елементів, включаючи мікропроцесор та допоміжні мікросхеми. Мікросхеми пам’яті розташовують компактно, їх легко знайти. Мікросхеми вводу/виводу розташовують поблизу відповідних роз’ємів. Генератор легко знайти по кварцу, а дешифратори адреси, виконують на ТТЛ – схемах або на ПЛІС. Розібравшись в схемній платі необхідно знайти відповіді на наступні запитання:

-         в якому стані знаходиться система, чи є будь-яка індикація або система виглядає повністю непрацюючою? В останньому випадку необхідно в першу чергу перевірити наявність +5В, якщо вона мала або відсутня, необхідно відімкнути живлення друкованої плати та виявити причину: ДЖ або надмірне навантаження;

-         натиснути кнопку “Скид” та подивитися чи виникають в системі будь-які зміни. Якщо відбувається частковий скид (наприклад, повідомлення про авторські права…), несправність мікропроцесора малоймовірна, а більш правдоподібна відмова допоміжної ІМС, наприклад, ОЗП;

-         якщо спостерігається переміжна несправність (система якийсь час працює, а далі зупиняється в непередбаченій точці), перевірте усі роз’єми. З’єднання в роз’ємах доволі ненадійне та їх контакти необхідно періодично чистити. Аналогічно якщо основні мікросхеми вставлені в гнізда. Обережно натисніть на кожну з ВІС та подивіться чи не відновлюється правильна робота;

-         якщо мікропроцесор майже працює і несправність не переміжна доцільно перевірити сигнали керування в самому мікропроцесорі, за допомогою логічного пробника впевнитися в тому, що:

·        маються сигнали на вході синхронізації. Якщо вони відсутні то перевіряють генератор синхронізації;

·        на вході “Скид” відсутній сигнал низького рівня (перевірити дію короткого імпульсу при натисненні “Скид”). Якщо вхід “Скид”, “зависає” перевіряють схему формування сигналу “Скид”;

·        відсутній постійний сигнал низького рівня на вході немасковуваного переривання (NMI). Якщо цей сигнал присутній, по черзі відмикають зовнішні прилади до тих пір, поки сигнал немасковуваного переривання не стане пасивним. Перевірте також мікросхему вводу/виводу;

·        лінії зчитування та запису активні. Якщо МП вибирає команди та виконує їх, на цих лініях діє непереривний потік імпульсів. Якщо їх немає, натисніть кнопку “Скид” та перевірте наявність короткочасної активності на лінії зчитування. У випадку відсутності імпульсів при спрацьовуванні сигналу “Скид”, по всій ймовірності несправний сам МП.

-         По черзі дотикаючись логічним пробником кожної лінії адреси та даних. Якщо на якійсь лінії постійно діє сигнал низького, високого рівня або постійно знаходиться у високоімпендансному стані, вимкнути живлення та попробувати по черзі від’єднати допоміжні ІМС. У випадку збереження несправності її причиною може бути відмова в одному з внутрішніх буферів МП, що потребує його заміни;

-         якщо всі спроби виявилися даремними, виконайте наступні заходи:

·        нехай система попрацює деякий час, далі по черзі доторкніться по черзі пальцем кожної мікросхеми. Якщо якась мікросхема надто гаряча, то можливо несправність виникла саме в ній;

·        коли мікросхеми вставлені в гнізда по черзі виймайте та замінюйте кожну з них (вимикаючи живлення). Заміну необхідно проводити на завідомо справну ІМС.

 

BIOS (Basic Input/Output System, базова система введення-виведення) - спеціальна програма, що зберігається в мікросхемі ПЗП. Відразу після включення живлення комп'ютера одержує керування саме BIOS. Вона виконує початкове тестування всіх компонентів комп'ютера. Якщо все в порядку, то керування передається програмі, що перебуває в Boot-секторі (завантажувальному секторі) завантажувального диска (це може бути дискета, жорсткий диск, компакт-диск). Та, у свою чергу, завантажує операційну систему.

Процедура початкового тестування називається POST - Роwer-Оп Self Test (самотестування після включення живлення).

BIOS зберігає в спеціальній мікросхемі CMOS-пам'яті апаратну конфігурацію комп'ютера. При включенні живлення поточна конфігурація порівнюється зі збереженої. Якщо контрольна сума не збігається з підрахованою, BIOS "вирішує", що він пошкоджений і запускається аварійна програма відновлення BIOS. На екран виводиться повідомлення типу "BIOS checksum error", система звертається до дисководу з метою завантажитися з нього й запустити програму перепрограмування. Якщо ж дисковід виключений/відсутній або в ньому немає системної дискети, то комп'ютер зупиняється.

2 Відновлення BIOS

 

Сучасні материнські плати, що базуються на Award BIOS, мають так званий  "boot-block BIOS". Це невелика зона в системному BIOS, що не перепрограмується. Boot-block BIOS підтримує тільки дискети. Boot-block BIOS повинен розпізнати дискету, завантажитися з неї. Процедура відновлення контролюється прослуханням спікера й спостереженням за світлодіодом floppy-дисководу. Поки спостерігається активність, йде програмування. Як тільки активність дисководу й звукові сигнали спікера припиняться, необхідно перезавантажити систему. Якщо етап відновлення пройшов успішно, система перейде в режим звичайної роботи BIOS.

 

3 Процедура самотестування (POST)

 

У випадку успішного завершення самотестування  подається короткий одиночний звуковий сигнал. У деяких випадках після успішного завершення процесу POST може взагалі не подаватися ніяких сигналів.

Що відбудеться при виявленні помилок під час проведення самотестування? Якщо помилки не критичні -повідомлення про неї будуть виведені на екран, після чого завантаження комп'ютера може продовжитися. Якщо ж у процесі самотестування будуть виявлені серйозні помилки, комп'ютерна система спробує повідомити про їх користувачеві, однак вивести інформацію на екран буде неможливо. Отже, користувач не зможе побачити відповідне повідомлення.

У цьому випадку для визначення причини помилки користуються звуковими сигналами, які подаються через системний динамік комп'ютера після закінчення процедури POST. За допомогою цих сигналів система повідомляє користувача про результати процесу само тестування.

Деякі комбінації сигналів, що досить часто використовуються для позначення тих самих помилок:

-         один короткий сигнал - тестування завершилося успішно, завантаження триває (деякі системи при цьому не подають ніяких звукових сигналів);

-         звук відсутній, немає зображення на екрані - несправні процесор або блок живлення;

-         один довгий безперервний сигнал - несправний блок живлення;

-         два коротких сигнали - виявлені незначні помилки, необхідно внести зміни в настройках параметрів BIOS для систем компанії Award; помилка парності пам'яті для систем від AMI;

-         три довгих сигнали - помилка контролера клавіатури;

-         три коротких сигнали - помилка роботи нижньої пам'яті;

-         один довгий і один короткий сигнал - невірно працює оперативна пам'ять;

-         один довгий і два коротких сигнали - невірно працює відеоадаптер;

-         один довгий і три коротких сигнали - помилка відеосистеми (не підключені монітор або не працює відеоадаптер) для AMI BIOS, помилка відеосистеми або проблеми з контролером клавіатури для Award BIOS;

-         один довгий і вісім коротких сигналів - помилка відеосистеми: не підключений монітор, не працює відеоадаптер і т.д.;

-         один довгий і дев'ять коротких сигналів - помилка зчитування даних BIOS;

-         чотири коротких сигнали - не працює системний таймер;

-         п'ять коротких сигналів - невірно працює процесор;

-         шість коротких сигналів - несправний контролер клавіатури;

-         сім коротких сигналів - проблеми з материнською платою;

-         вісім коротких сигналів - невірно працює відеопам'ять;

-         дев'ять коротких сигналів - помилка контрольної суми при перевірці вмісту BIOS;  викликає скидання параметрів BIOS, після чого можна ввійти в програму їхньої настройки й продовжити роботу;

-         десять коротких сигналів - помилка запису даних у мікросхему CMOS;

-         одинадцять коротких сигналів - невірно працює зовнішня кеш-пам'ять;

-         довгі гудки, що повторюються - несправний або невірно підключений модуль оперативної пам'яті;

-         короткі гудки, що повторюються - невірно працює блок живлення.

 

4 POST-плата

 

Як показує практика, у процесі самотестування комп'ютерної системи може виникнути й така помилка, що не вдається локалізувати за допомогою звукових сигналів. Тут для аналізу ситуації на допомогу може прийти POST-плата.

POST-Плата — це спеціальна плата розширення для шини PCI, що має цифровий індикатор. На цьому індикаторі при виконанні POST плата виводить коди самотестування, за допомогою яких можна простежити за ходом процесу.

Спеціально для індикації результатів самотестування виділений спеціальний порт – 80H. Перед тим як проініціалізувати той або інший пристрій, що є присутнім у системі, у цей порт обов'язково виводиться деякий код. По ньому можна точно визначити, що саме ініціалізується в цей момент.

Якщо ініціалізація пристрою завершилася успішно, то система перейде до ініціалізації наступного пристрою. При цьому в 80-й порт буде записаний наступний код.

Якщо робота системи була перервана, можна побачити код, що записаний в 80-й порт останнім. По цьому коду легко визначити, на якій операції відбувся збій, який пристрій не вдалося проініціалізувати. Наприклад, якщо на індикаторі останнім висвітилося значення 04, то це (при використанні системи з Award BIOS) буде означати, що в системі неправильно формуються сигнали регенерації оперативної пам'яті.

Значення кодів POST у різних виробників BIOS і материнських плат також можуть відрізнятися. Однак більшість із них все-таки має стійкі значення. У табл. 1 наведені коди процедури POST, які  зустрічаються в системах на снові Award BIOS.

 

Таблиця 1 –  POST-Коди

Код

Значення

01

Перевірка працездатності процесора

02

Перевірка регістрів процесора

03

Ініціалізація ресурсів ISA

04

Перевірка сигналів регенерації оперативної пам'яті

05

Ініціалізація контролера клавіатури                                                             

06

Тестування області пам'яті, у яких розмішається копія BIOS

07     

Перевірка CMOS

08

Розширена перевірка перших 256 кілобайт оперативної пам'яті                

09

Ідентифікація процесора Cyrix

Ініціалізація контролера переривань

0B

Перевірка контрольної суми CMOS

Ініціалізація блоку змінних BIOS

0D

Пошук відеоадаптера

Ініціалізація відеоадаптера

0F

Тестування клавіатури

20

Ініціалізація пристроїв ISA

2F

Ініціалізація пристроїв ISA і пошук порожніх роз’ємів

30

Визначення обсягу базової пам'яті

31

Визначення обсягу розширеної пам'яті

3D

Ініціалізація PS/ 2-миші

41

Ініціалізація контролера дисководу для гнучких дисків

42

Визначення параметрів IDE-пристроїв і настроювання IDE- контролера

45

Ініціалізація математичного співпроцесора

4E

Настроювання USB-клавіатури

4F

Запит пароля

52

Пошуки ініціалізація додаткових BIOS

53

Установка лічильника часу DOS

60

Включення антивірусного захисту завантажувального сектора                                

62

Визначення режиму роботи цифрового блоку клавіатури й режиму автоповтору натискань на клавішу

63

Перевірка й корекція інформації про пристрої, що підтримують стандарт Plug-n-play

В0

Активізація процедури зупинки системи (при серйозних збоях)

BE

Ініціалізація набору мікросхем (Chipset) материнської штати

BF

Настроювання набору мікросхем (Chipset) материнської плати

C0

Відключення кеш-пам'яті й перевірка DMA-контролера й контролера переривань

С1

Визначення типу й обсягу пам'яті

C3

Перевірка перших 156 кілобайт оперативної пам'яті

С5

Перенос коду програми тестування в оперативну пам'ять

С6

Визначення обсягу й перевірка зовнішньої кеш-пам'яті

С8

Перевірка цілісності BIOS

CF

Визначення типу процесора

FF

Успішне завершення самотестування — передача керування завантажувальному сектору диска

 

Деякі виробники материнських плат, щоб полегшити процедуру діагностики несправностей, поміщають індикатори POST кодів  безпосередньо на поверхню материнської плати. Іноді виробники йдуть ще далі, розташовуючи на материнській платі виводи індикатора кодів POST і поставляючи сам індикатор у комплекті. У цьому випадку він може бути виведений на будь-яке місце корпуса комп'ютера.

 

5 Тестування пам'яті

 

Пройшовши POST відбувається виявлення відеоадаптера. У цьому випадку відбувається його ініціалізація, після чого на екрані виникає зображення, що може містити відомості про встановлений у системі відеоадаптері, обсязі його пам'яті, а також деяких інших деталях (наприклад, може відображатися логотип виробника відеоадаптера).

Після ініціалізації відеоадаптера відбувається визначення типу процесора. Потім  програма завантажування визначає тип і обсяг установленої в системі оперативної пам'яті. Після цього відбувається тестування пам'яті. Інформація про результати цих процесів також виводиться на екран.

Для діагностики ОЗП застосовують  метод, пов’язаний з почерговим записом та зчитуванням кожного біту. При цьому контролюється вірність виконання потрібної зміни. Якщо якийсь біт не змінюється то видається повідомлення про помилку. Показується адреса несправного байта, що дозволяє виявити конкретну ІМС або банк ІМС.

Memory test fail – дане повідомлення буде виведено в тому випадку, якщо під час тестування пам'яті була виявлена помилка. Після цього повідомлення буде виведена додаткова інформація про виявлену помилку.

Відмову окремих елементів пам’яті можливо виявити з допомогою діагностичних процедур, а далі необхідно знайти відмовившу ІМС.

MemTest 3.3 -  утиліта, призначена для тестування оперативної пам'яті.

Для поверхневого тестування оперативної пам'яті досить запустити цю утиліту на 20 хвилин. Якщо за цей час помилок не виявиться (у заголовку вікна утиліти виводиться напис: 0 errors), то тест можна вважати пройденим. Якщо ж потрібно переконатися в повній і безвідмовній роботі оперативної пам'яті комп'ютера, то потрібно щоб утиліта MemTest попрацювала на комп'ютері протягом доби (у стабільній системі, помилок бути не повинно).

 

6 SMART

 

Після тесту пам'яті відбувається ініціалізація й перевірка пристроїв, підключених до контролерів IDE. Це можуть бути жорсткі диски, приводи компакт-дисків або DVD і інші накопичувачі.

S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) - дослівно "технологія самодіагностики, аналізу й звіту".  S.M.A.R.T. це мікропрограма, що перебуває в контролері диска. Вона контролює багато параметрів роботи й стану вінчестера й допомагає визначити дійсний стан HDD: стан самого диска, час експлуатації вінчестера, проблеми, що існують й т.і. Для аналізу надійності жорсткого диска використовуються дві групи параметрів.

Перша характеризує параметри природного старіння жорсткого диска:

·        кількість циклів вмикання/вимикання (старт/стоп)

·        кількість обертів двигуна за час роботи

·        кількість переміщень головок

Друга група параметрів уже інформує про поточний стан якості накопичувача. До цих параметрів відносяться:

·        висота головки над поверхнею диска;

·        швидкість обміну даними між дисками й кеш-пам'яттю на диску;

·        кількість перепризначень поганих секторів (коли замість зіпсованого сектора підставляється вільний справний)

·        кількість помилок пошуку;

·        кількість операцій перекалібровки

·        швидкість пошуку даних на диску

 

Таблиця 2 – Типові дефекти жорсткого диску й способи їх передбачення

Вид дефекту

Симптом/ Чим викликаний

Що передбачає

Велика кількість поганих секторів

Фізичні дефекти поверхні, ушкодження при транспортуванні

Кількість дефектів поверхні, швидкість їхнього росту

Надмірний шум

Дефект мотора, ушкодження при транспортуванні

Діагностика

Значна кількість нерегулярних помилок

Ушкодження головки або її забруднення

Часті повтори при звертанні до диску, спрацьовування схеми ЕСС контролю

Відмова мотора

Не виробляється сигнал готовності, немає шуму обертання дисків/ Дефект мотора, ушкодження при транспортуванні

Повтори вмикання, збільшення часу набору номінальної швидкості обертання

Диск не відповідає

Дефект електроніки диска

Ніщо не може передбачити катастрофу в цьому випадку

Помилки позиціонування серводвигуна

Велика кількість помилок переміщення головок/ ушкодження при транспортуванні

Помилки позиціонування, часті повтори калібрування

Збій роботи головки, резонанс при її переміщенні

Значна кількість нерегулярних помилок

Ріст помилок при читанні, а також помилок позиціонування

 

Всі ці параметри S.M.A.R.T. періодично тестує і записує. Для доступу до SMART інформації існує багато програм, які вміють це робити. Вони в досить зручній формі виводять поточні значення параметрів (Value) і їх граничні припустимі значення Threshold. Кожному параметру привласнюється значення Value  від 100 і вище. Потім у міру погіршення параметра його значення зменшується. При падінні величини Value до значення Threshold вінчестер теоретично повинен вийти з ладу,  але навіть у такій сумній ситуації HDD може успішно продовжувати працювати. У випадку падіння значення цього параметра нижче критичного значення найбільш ймовірний вихід вінчестера з ладу.

На деяких материнських платах у BIOS є програма, що зчитує інформацію з S.M.A.R.T. і може видати повідомлення:

SMART Failure Predicted on Primary Master

SMART Failure Predicted on Primary Slave

SMART Failure Predicted on Secondary Master

SMART Failure Predicted on Secondary Slave

Звуки, що  видаються вінчестерами  під час нормальної роботи або при певних несправностях дозволяють  зробити попередню діагностику. Звуки, що видає повністю справний вінчестер:

1) розкручування вала (свист, що збільшується);

 2) розпаковування блоку головок (клацання);

 3) рекалібрування головок (рівномірне стрекотіння);

 4) паркування головок після вимикання живлення (клацання);

 5) поступова зупинка вала (згасаючий свист)

 

7 Текстові помилки BIOS

 

При помилках BIOS виводить на екран різні повідомлення. Тому що ці повідомлення використовують англійську мову. Розглянемо типові повідомлення BIOS.

CMOS battery failed — сіла батарейка на материнській платі, що живить мікросхему CMOS - пам'яті. Для усунення проблеми необхідно замінити батарейку на нову.

CMOS checksum error - Defaults loaded — невірна контрольна сума вмісту CMOS-пам'яті, будуть використані настройки  BIOS Setup, прийняті за замовчуванням. Дане повідомлення інформує про те, що дані в CMOS-пам'яті ушкоджені. Для усунення проблеми викликається BIOS Setup і перевіряють усі настройки. Якщо дане повідомлення буде виникати регулярно, необхідно замінити батарейку, що живить мікросхему CMOS-пам'яті.

BIOS ROM checksum error — ушкоджені дані в мікросхемі Flash-пам'яті, що містить BIOS. Для виправлення даної помилки потрібно перепрограмувати BIOS. У випадку, якщо це неможливо, потрібно замінити мікросхему Flash-пам'яті.

Floppy disk ( s ) fail — помилка контролера дисководу гнучких дисків. Якщо параметри дисководів в BIOS Setup зазначені вірно й контролер не відключений, проблема або з материнською платою, або з дисководом, або зі шлейфом.

Drive A error. System halt — помилка диска А, система зупинена. Дана проблема може бути викликана дисководом, що вийшов з ладу, несправним контролером дисководу, шлейфом.

Hard disk ( s ) Diagnostics fail — помилка контролера жорстких дисків або логіки керування самого жорсткого диска. Перевірте в BIOS Setup параметри жорстких дисків, проконтролюйте положення джамперів на IDE-пристроях (Master / Slave), зверніть увагу на параметри IDE-контролера материнської плати, що виставлені в BIOS Setup, перевірте шлейфи, а також самі жорсткі диски.

Primary master drive fail — помилка ініціалізації накопичувача, що підключений як основний до первинного каналу стандартного IDE-контролера материнської плати. Проконтролюйте в BIOS Setup параметри накопичувачів, переконайтеся, що самі накопичувачі справні, перевірте положення джамперів на IDE-пристроях (Master / Slave), зверніть увагу на шлейфи.

Primary slave drive fail — помилка ініціалізації накопичувача, що підключеного як допоміжний до первинного каналу стандартного IDE-контролера материнської плати. Рекомендації ті ж.

Secondary master drive fail — помилка ініціалізації накопичувача, що підключений як основний до вторинного каналу стандартного IDE-контролера материнської плати. Рекомендації ті ж.

Secondary slave drive fail — помилка ініціалізації накопичувача, що підключений  як допоміжний до вторинного каналу стандартного IDE-контролера материнської плати. Рекомендації ті ж.

SMART Failure Predicted on Primary Master — є проблема з надійністю жорсткого диска, підключеного як основний до первинного каналу стандартного IDE-контролера материнської плати: найближчим часом він вийде з ладу. Необхідно, поки не пізно, перенести дані в інше місце й замінити даний жорсткий диск.

SMART Failure Predicted on Primary Slave — те ж саме для жорсткого диска, підключеного як допоміжний до вторинного каналу стандартного IDE-контролера материнської плати.

SMART Failure Predicted on Secondary Master — те ж саме для жорсткого диска, підключеного як основний до вторинного каналу стандартного IDE-контролера материнської плати.

SMART Failure Predicted on Secondary Slave — те ж саме для жорсткого диска, підключеного як допоміжний до вторинного каналу стандартного IDE-Контролера материнської плати.

Keyboard controller error — помилка контролера клавіатури. Перевірте, чи вірно підключена клавіатура. Якщо із клавіатурою все в порядку, на жаль, потрібна заміна або ремонт материнської плати.

Keyboard error or no keyboard present — помилка контролера клавіатури або сама клавіатура відсутня. Перевірте, чи підключена вона, чи не вийшла клавіатура з ладу.

Memory test fail — помилка оперативної пам'яті. Якщо це повідомлення буде з'являтися й надалі, заміните модуль пам'яті.

Memory Configuration error : The two SDRAM modules need to be swapped — помилка в конфігурації пам'яті, для нормальної роботи потрібно два модулі пам'яті. Необхідно додати другий модуль пам'яті.

OFFENDING ADDRESS NOT FOUND - не працює або збоїть контролер пам'яті. Якщо перезавантаження не допомагає, необхідно замінити або ремонтувати материнську плату.

OFFENDING SEGMENT: — не працює або збоїть контролер пам'яті. Якщо перезавантаження не допомагає, необхідно замінити або ремонтувати материнську плату.

RAM PARITY ERROR - CHECKING FOR SEGMENT... - помилка контролю парності оперативної пам'яті. Якщо це повідомлення буде з'являтися й надалі, необхідно заміни модуль пам'яті.

I/O CHANNEL CHECK - CHECKING FOR SEGMENT... - проблеми з каналами введення - виведення. Якщо перезавантаження не допомагає, то, перевірте карту розширення, що використовує даний сегмент пам'яті для введення - виведення. Якщо з картою все в порядку, можливим джерелом проблем є або оперативна пам'ять або материнська плата.

PRESS F1 TO DISABLE NMI, F2 ТO REBOOT — проблеми з немаскувальними перериваннями. Якщо перезавантаження не допомагає, то, швидше за все, прийдеться замінити або ремонтувати материнську плату.

PRESS A KEY TO REBOOT — пропозиція натиснути будь-яку клавішу для перезавантаження комп'ютера. Дане повідомлення виводиться при виявленні помилки, що вимагає перезавантаження.

SYSTEM HALTED. (CTRL-ALT-DEL) TO REBOOT...   - система зупинена в результаті помилки, для перезавантаження комп'ютера необхідно натиснути комбінацію клавіш Ctrl+Alt+Del.

DISK BOOT FAILURE, INSERT SYSTEM DISK AND PRESS ENTER — диск, з якого виконується завантаження, не системний, вставте системний диск і натисніть клавішу Enter.

Invalid Password — невірно введений пароль, що встановлений в BIOS Setup, і, що вимагається для завантаження комп'ютера.

Press Any Key to Continue — пропозиція натиснути будь-яку клавішу для продовження завантаження. Якщо на екран виводиться повідомлення, що вимагає вашої уваги, то слідом за ним буде виведена ця пропозиція.

 

8 Повідомлення Blue Screen of Death

 

Стоп-повідомлення про помилки (Blue Screen of Death, BSOD) виникають у системах сімейства Windows NT у тому випадку, якщо операційна система виявляє фатальний збій, у результаті якого вона не може продовжити своє нормальне функціонування.

Повідомлення STOP містять спеціальний код ідентифікації (наприклад, STOP: 0x000000D1, плюс якісь параметри) і текстовий ідентифікатор (наприклад, IRQL_NOT_LESS_OR_EQUAL), а також рекомендації користувачеві по можливих способах усунення причин збою. У ряді випадків у тексті Blue Screen of Death може згадуватися ім'я файлу або пристрою, пов'язаного із причинами збою, і адреса пам'яті, по якому виникла проблема.

Усього стоп-кодів біля 200, докладно з ними можна познайомитися в документі Error and Event Messages із складу Windows 2000 Server Resource Kit . Розглянемо найпоширеніші  Blue Screen of Death:

KMODE_EXCEPTION_NOT_HANDLED - процес режиму ядра спробував виконати неприпустиму або невідому процесорну інструкцію. Може бути пов'язаний з несумісністю "заліза", несправністю устаткування, помилками в драйвері або системній службі;

NTFS_FILE_SYSTEM - збій при виконанні коду драйвера файлової системи ntfs.sys. Причиною може бути порушення цілісності даних на жорсткому диску (збійний кластер) або в пам'яті, пошкодження драйверів IDE або SCSI;

DATA_BUS_ERROR - в оперативній пам'яті виявлена помилка парності. Причина: дефектне або несумісне устаткування, наприклад, збій у мікросхемі кеш-пам’яті другого рівня, у відеопам'яті. Також збій може бути пов'язаний з некоректно працюючим або невірно сконфігурованим  драйвером, зі збоєм на жорсткому диску;

IRQL_NOT_LESS_OR_EQUAL - процес режиму ядра спробував звернутися до області пам'яті, використовуючи неприпустимо високий для нього рівень IRQL (Interrupt Request Level). Може бути викликаний помилками в драйвері, системній службі, BIOS або несумісним драйвером, службою, програмним забезпеченням (наприклад, антивірусом);

PAGE_FAULT_IN_NONPAGED_AREA – дані, що запитувались, відсутні в пам'яті (наприклад, система шукає потрібні дані у файлі підкачування, але не знаходить їх). Звичайно пов'язаний зі збоєм устаткування (дефектна пам'ять), порушенням файлової системи, помилкою системної служби або антивірусу;

KERNEL_STACK_INPAGE_ERROR - не вдається прочитати з файлу підкачування у фізичну пам'ять сторінку пам'яті. Причини: дефектний сектор файлу віртуальної пам'яті, збій контролера жорстких дисків, недостатньо місця на диску, неправильне підключення жорсткого диска, конфлікт переривань, дефект ОЗП, вірус;

MISMATCHED_HAL - рівень апаратних абстракцій (HAL) і ядро системи не відповідають типу комп'ютера. Найчастіше пов'язаний із ситуацією, коли в однопроцесорну систему встановлюють другий процесор, забуваючи вручну обновити HAL і ntoskrnl. Може також бути викликаний розбіжністю версій hal.dll і ntoskrnl.exe;

KERNEL_DATA_INPAGE_ERROR - не вдається прочитати у фізичну пам'ять сторінку даних. Причини - дефектний сектор файлу віртуальної пам'яті, збій контролера жорстких дисків, збій оперативної пам'яті, вірус, збій дискового контролера, дефектна оперативна пам'ять;

INACCESSIBLE_BOOT_DEVICE - у процесі завантаження ОС не змогла одержати доступ до системного розділу. Причин цього розповсюдженого збою можуть бути:

·       дефектний завантажувальний диск або дисковий контролер; несумісність устаткування;

·       завантажувальний вірус;

·       помилка у файловій системі, наприклад, у таблиці розділів (Partition Table);

·       ушкодження або відсутність необхідного при завантаженні файлу, наприклад, NTLDR;

·       відсутність драйвера контролера жорстких дисків або невідповідність поточного драйвера встановленому устаткуванню;

·       включений в BIOS режим DMA;

·       включений в CMOS Setup режим зміни букв дисководів DRIVE SWAPPING;

·       конфлікт розподілу ресурсів між дисковим контролером і іншим пристроєм;

·       ушкодження даних у системному реєстрі  про драйвера; установка системи в розділ за межами перших 1024 циліндрів жорсткого диска; помилка у файлі boot.ini;

UNEXPECTED_KERNEL_MODE_TRAP - виникнення пастки (trap) ядром або фатальна помилка (типу ділення на нуль). Несправність устаткування або збій програмного забезпечення;

STATUS_SYSTEM_PROCESS_TERMINATED - збій у службі, що працює в режимі користувача. Збій може бути пов'язаний з некоректною роботою прикладних програм, драйверів, сторонніх системних служб;

STATUS_IMAGE_CHECKSUM_MISMATCH - ушкоджений або загублений файл драйвера або системної бібліотеки. Може бути викликаний збоєм файлової системи або випадковим видаленням системного файлу.

Виходячи із цих даних і варто планувати процес пошуку причин збоїти, що може включати:

-         видалення застарілих або несумісних додатків;

-         видалення драйверів, що не мають цифрового підпису;

-         відновлення програмного забезпечення й драйверів устаткування;

-         видалення несумісного устаткування;

-         перевірка файлової системи;

-         сканування антивірусом;

-         перевірка системних файлів за допомогою утиліти sfc.exe (команда sfc /scannow);

-         тестування або заміна пам'яті;

-         установка останніх оновлень і патчів операційної системи й програмного забезпечення;

-         зміна настройки CMOS Setup, наприклад, відключення кешування або режиму DMA;

-         відновлення головного завантажувального запису (MBR) і системного завантажника Windows NT;

-         перевірка правильності підключення дисків, дискових контролерів і SCSI-адаптерів;

-         відмова від розгону; переустановка системи.

Останнім часом дуже часто оперативна пам'ять є причиною проблем багатьох користувачів. В особливо важких випадках операційна система видає  Blue Screen of Death відразу ж після завантаження або безпосередньо в її процесі, і немає ніякої можливості зайнятися пошуком причин збою, провести діагностику або видалити проблемний драйвер.