Записки IT специалиста
- Автор: Уваров А.С.
- 05.10.2011
Диагностика один из важнейших этапов, когда речь идет о ремонте аппаратной части ПК. От того, насколько быстро и качественно она будет выполнена, зависят дальнейшие сроки и стоимость ремонта. В данной заметке мы расскажем о двух простых приборах, способных значительно облегчить работу сервисного инженера.
Научиться настраивать MikroTik с нуля или систематизировать уже имеющиеся знания можно на углубленном курсе по администрированию MikroTik. Автор курса, сертифицированный тренер MikroTik Дмитрий Скоромнов, лично проверяет лабораторные работы и контролирует прогресс каждого своего студента. В три раза больше информации, чем в вендорской программе MTCNA, более 20 часов практики и доступ навсегда.
Эта история началась, когда мы встали перед вопросом оснащения оборудованием нашего нового сервисного центра. Переезд, как известно, равен двум пожарам, и немного обжившись в новом офисе мы начали делать неприятные открытия: что-то потеряли, что-то сломали, что-то где-то лежит но найти не получается и т.д. и т.п. Поэтому наш взор устремился к известному китайскому интернет-магазину DealExtreme, ассортимент и цены которого давно нас привлекали.
Мы не будем описывать все подробности, скажем только что с оплатой (если вы имеете кредитку) и доставкой никаких проблем возникнуть не должно. Качество товаров на довольно высоком уровне, заявленные функции честно выполняются. Единственное, перед заказом, стоит почитать комментарии пользователей, что позволит выбрать оптимальный вариант среди аналогичных устройств (а выбрать есть из чего).
Мы заказали тестер для блоков питания ATX и POST-плату для диагностики материнских плат. Несмотря на то, что основное применение эти приборы находят в сервисном центре, системным администраторам тоже полезно иметь подобные инструменты, так как им тоже приходится производить первичную диагностику железа и правильно поставленный диагноз способен резко сократить срок ремонта оборудования и, следовательно, убытки связанные с простоем рабочего места.
Мониторинг ПК
CPU-Z: простоя и понятная программа, позволяющая узнать множество сведений о процессоре, материнской плате, памяти вашего ПК.
GPU-Z: делает то же, что и программа выше, но только с вашей видеокартой.
HWiNFO: продвинутая утилита, которая позволяет узнать множество деталей о вашем компьютере. Имеет неудобный интерфейс, от чего пользуется низкой популярностью.
Speccy: упрощённый вариант. Кажется, он слишком простой и немного неудобный.
AIDA64: одна из наиболее продвинутых утилит. Имеет множество настроек и огромную фанатскую базу.
HWMonitor: проще и удобнее многих конкурентов. Расскажет о температуре вашего ПК.
Open Hardware Monitor: продвинутая версия предыдущей утилиты. На любителя, полностью бесплатна.
I-Nex: бесплатная программа, которая даёт базовые сведения о ПК.
Оживление Рождение
— Wake up, Neo.
Для bringup обычно изготавливается 3—5 образцов (в расчете на то, что как минимум два будут уничтожены в бреду дебага). Если в составе устройства есть дорогие чипы — на один из образцов они не устанавливаются. Фаб может предложить вам сэкономить на золоте — НИ В КОЕМ СЛУЧАЕ НЕ СОГЛАШАЙТЕСЬ (ну просто паять придется много и часто).
Плата без чипа — это первый кандидат на убой. На ней проверяются последовательность включения питания, сбросы, номиналы напряжений и прочее подобное. Потом такая плата является донором органов и/или полигоном для проверки всяческих гипотез. Также перед тем, как что-то включать, нужно обязательно:
- прозвонить землю-питание, там частенько есть КЗ;
- визуально осмотреть плату – там запросто бывает перепутана полярность конденсаторов, чипы стоят вверх ногами, присутствует стружка, с лёгкостью можно найти пассивные компоненты, которые оторвали;
- отдельно изучить – а не поставили ли вам на плату компоненты, которые вы просили не ставить (лайфхак: не делайте черную маску на первых сэмплах – на ней не видно установлены или нет чип-резисторы).
Но вообще при самом первом включении обычно можно не бояться — оно скорее всего не включится, так как вы наверняка забыли перепаять компоненты, у которых в дизайне перепутаны ноги:
И еще припаять немножко проводов:
Термоклей — наше все, лучший друг разработчика, почти как скотч в обычной жизни.
Сразу после Дремеля:
И молотка, которым приходится забивать бонки в плату, — не всегда выходит аккуратно.
Иногда приходится делать пациенту рентген или томографию. Выглядит это так:
Отсканировать плёнку, оказывается, не очень просто. Сняли телефоном на просвет напротив окна.
Конкретно на этом снимке не видно ничего — не вглядывайтесь. Но вообще на рентгене можно увидеть непропай, трещины и прочее подобное.
Отдельно стоит сказать про bringup материнских плат, потому что делается он по-другому. DFT сэмплов матерей обычно заказывается много – порядка 20 штук. Стоит это дорого, поэтому тут своя стратегия.
Берутся разработчики и отправляются на фабрику. Собирается порядка 5 плат и конвейер останавливается. Далее у разработчиков есть порядка 30 минут, чтобы плату включить (для x86-систем критерий успеха — загрузить BIOS). Если всем повезло — собираются остальные образцы. Если нет — производство отменяется, а разработчики едут домой думать. Деньги затраченные на PCB — потеряны, зато компоненты ждут на складе следующей попытки.
Хорошо — мы запустили нашу плату, и даже запустили другие, которые должны работать вместе с ней. Что дальше? Собираем стенд.
И тут вы, наверное, ожидаете увидеть такое?
Это все показуха для замминистров. Настоящий стенд должен быть собран из палок и желудей, и выглядит так:
— I didn’t say it would be easy, Neo. I just said it would be the truth.
(стакан для противовеса, фломастер — чтоб радиатор внатяг сидел — оно там проводом примотано)
В лабораторию набивается вот такая орда:
И все начинают наперегонки зашивать свои прошивки, программки, и тыкать везде осциллографом.
Иногда в процессе то и дело раздается вежливая просьба «Дорогой коллега, пожалуйста, уберите паяльник от моей руки — уж очень горячо» или «Будьте так добры — больше не включайте источник питания, когда я привинчиваю плату к шасси».
В нашем конкретном случае основная цель проверки совместной работы нескольких устройств — узнать, работает ли PCI Express, соответствует ли он стандарту. Просто без всего остального в принципе можно жить. Обычно функционал, закладываемый в железку, избыточен. Тонны GPIO выводов, I2C/SPI шин, термодатчиков, ледов и прочего, как правило, остаются невостребованными, так как их отладку откладывают на последний момент, который никогда не наступает.
Естественно, у нас нет на каждый случай жизни измерительной аппаратуры за несколько миллионов рублей — это для слабаков. Нам на помощь спешит тестовое ПО от производителей компонентов. Практически все современные чипы с высокоскоростными интерфейсами имеют внутри цифровой осциллограф. К нему полагается специализированное ПО, позволяющее считать его показания. Запускаем и смотрим глазковые диаграммы. Видим такое:
Иногда видим опасный прищур:
А иногда ловим кальмаров:
Кальмары — самые опасные. Это нелинейные искажения, и встроенные эквалайзеры с таким бороться особо не умеют. Кальмары означают, что где-то в канале связи есть что-то очень плохое — слишком длинное переходное отверстие, существенный перепад импеданса, попадание какой-то неравномерности в 1/4 или 1/2 длины волны каких-то гармоник в полезной полосе и прочее подобное.
Кто-то, возможно, заметит, что кальмар немного похож на то, что делает с принятым сигналом DFE в эквалайзере приемника PCIe. Но в данном случае это таки кальмар, а не результат работы DFE (просто результат работы DFE используемое нами ПО отображать не умеет).
Отдельно надо сказать про тестовый софт, который тоже бывает крайне коварным. Например для снимания глазковых диаграмм мы используем две версии одной и той же программы — одна версия рисует картинки, но не пишет значения раскрыва глаза, вторая — наоборот.
Ну и да — если вы планируете снимать глаза по интерфейсу I2C — забудьте, это будет очень очень очень медленно. Только in-band. Проблема в том, что для съема in-band у вашего устройства должен быть рабочий PCIe линк с компьютером, где работает тестовое ПО, что весьма проблематично, когда ваша железка не устанавливается в стандартный PCIe слот. И что самое забавное — у вас уже должен быть хоть как-то работающий линк на том канале, который вы отлаживаете, причем именно в том режиме (gen2/3) в котором вам нужно (ибо в разных режимах разные глаза и по разному работают эквалайзеры). Нет ножек, нет мультиков линка, нет глаз — вот как хотите, так и выкручивайтесь.
Про то, как выкручиваться с PCIe — я ранее написал отдельную статью.
Вообще, при разработке сервера, конечно, очень важна поддержка со стороны производителей используемых компонентов, поскольку сегодня сложность даже относительно простых чипов такова, что без использования встроенных в них тестовых вещей полноценно проверить и отладить систему вряд ли получится. Тактовые генераторы, регуляторы напряжений, сетевые контроллеры, коммутаторы PCI Express, редрайверы – все это имеет встроенные средства для настройки, диагностики, и нуждается в определенном наборе программ и кабелей для подключения для полноценной настройки и тестирования, без использования которых разработка становится просто невозможной.
В процессе проведения проверок иногда выясняется, что где-то что-то идет не так. И тогда начинается увлекательный процесс локализации ошибки, чтобы ее можно было исправить в следующей ревизии. И хорошо если это «не так» стабильно повторяется – тогда выяснить, что именно является причиной ошибки, как правило, не составляет труда. Но иногда все гораздо хуже. Например, на некоторых экземплярах плат при длительном прогоне тестов возникают одиночные некорректируемые ошибки на шине (которых быть не должно совсем). И вот здесь зачастую уже приходится применять метод «пристального взгляда» — то есть просто сидеть, гипотетически глядя на схему предполагать, что именно может быть причиной, пробовать эту гипотетическую причину устранить в схеме, и тестами уже проверить – угадали мы или нет.
Мы с подобным сталкивались несколько лет назад, когда тесты NVIDIA (да, многие производители предоставляют специфические наборы тестов, которые позволяют проверить вещи, недоступные программным путем при использовании стандартных утилит) давали редкие одиночные ошибки при длительных (сутки и более) прогонах на некоторых экземплярах плат. Тогда все дело оказалось в неудачной трассировке референсного клока (100 MHz) — хотя прежде чем мы к этому пришли, проверено было много всего, начиная от качества питания и заканчивая глазковыми диаграммами по всем линиям.
И кстати, это хорошо. Самый большой кошмар разработчика — когда все работает сразу. Это значит только одно — где-то закопана мина, которая сработает после отгрузки 100500 единиц оборудования заказчику. Дело в том, что в процессе поиска причины какой-то глобальной проблемы осуществляется проверка нескольких гипотез и как правило выявляется множество мелких неисправностей, никак с возникшей проблемой не связанных. Нет большой проблемы — не найдёте маленьких. Их за вас найдут ваши заказчики.
Проверяем жесткие диски и SSD
Если вы столкнулись с фризами в играх, то причина не всегда кроется в ОЗУ, процессоре и видеокарте. Зачастую жесткий диск, на котором установлена игра, имеет сбойные сектора. Проверить состояние винчестера можно с помощью программы CrystalDiskInfo. Она отобразит суммарную информацию о вашем HDD. Например, температуру, общее время работы, число включений, техническое состояние и ошибки. Реинкарнировать накопитель данный софт не умеет, поэтому следует воспользоваться другой утилитой.
Victoria — более сложное и профессиональное решение, которое предназначено для лечения жесткого диска. Программа имеет множество алгоритмов для исправления бэд-блоков и умеет работать как в интерфейсе операционной системы, так и в DOS-режиме. С её помощью, кстати, можно осуществить полное стирание информации, чтобы ее невозможно было восстановить. Пользоваться софтом следует с осторожностью.
SpeedFan
Простая и нетребовательная утилита SpeedFan поможет контролировать основные показатели устройств компьютера, такие как скорость вращения кулера, напряжение, частота на ядре ЦП, температура компонентов и т.д. Почти 20 лет данное ПО является любимым инструментов многих энтузиастов разгона и рядовых пользователей. SpeedFan можно скачать бесплатно на сайте разработчика.
Спид Фан — это универсальное средство для контроля работы компьютера в реальном времени. С его помощью вы сможете изменять частоту оборотов крыльчатки вентиляторов, контролировать частоты процессора, следить за показаниями термодатчиков и проверять напряжение на выводах блока питания по линии 3.3В, 5В и 12В. Кроме этого она выводит отчет S.M.A.R.T. о состоянии жесткого диска. Зная эти показатели, пользователь может увеличить теплоотвод или наоборот, уменьшить шум системного блока.
Интерфейс программы помимо стандартной оболочки Windows включает в себя множество графиков для наглядного представления об изменениях показателей. Также тут есть функция предупреждения при превышении установленных порогов температуры, а шкала «CPU Usage» подскажет о загруженности каждого ядра ЦП.
Преимущества:
- снимает показания с датчиков температуры, напряжения, частоты и т.п.;
- контроль состояния винчестера;
- отображает напряжения на линиях питания БП;
- простейший интерфейс в стиле Windows 2000;
- поддержка большинства современных микроконтроллеров;
- бесплатное ПО с русификатором.
Недостатки:
- нет представления характеристик оперативной памяти, чипсета и другой не менее важной информации.
CrystalDiskInfo
Узнать о состоянии жесткого диска или SSD поможет программа CrystalDiskInfo.
Можно оценить состояние жёстких дисков при помощи считывания S.M.A.R.T, проверить температуру, количество включений и общее время работы накопителя. А в случае с дисками SSD — еще и объём данных, записанных на устройство за все время работы.
Оценить производительность диска можно при помощи программы CrystalDiskMark.
Часть 1: программы для анализа и мониторинга компьютера
Небольшая программа существует уже около 20 лет. Её автором является Франк Делаттре из Франции. Программа отображает информацию о процессоре: производитель, модель, количество ядер, размер кэша и многое другое.
Кроме описания процессора, программа собирает информацию относительно материнской платы и оперативной памяти. Изначально функционал CPU-Z был очень простым, но сейчас он существенно расширился.
Также здесь есть простой бенчмарк процессора и стресс-тест. Можно загрузить полученные результаты на сайт и поделиться своей статистикой.
Программа доступна только на компьютерах под управлением Windows, а также на мобильных устройствах на Android.
Ещё одна программа для единственного компьютерного компонента — видеокарты. Она была создана в 2007 году разработчиками из TechPowerUp. Принцип работы такой же, как у CPU-Z. Набор команд используется для сбора информации относительно спецификации видеокарты.
Бенчмарка здесь нет, но можно просматривать и записывать данные настроек и датчиков видеокарты. Предоставляется информация о тактовой частоте, температуре, напряжении и текущей нагрузке на GPU и контроллер памяти. Если вы хотите узнать больше о своей видеокарте, нажмите на кнопку Lookup.
Приложение бесплатное и доступно только на Windows.
HWinfo
Программа рассказывает о компьютере всё, что только возможно. Информация разделена по трём пунктам: системная, полный отчёт и мониторинг датчиков.
Значительную часть этой информации можно увидеть в диспетчере задач Windows, но в данном случае сведения структурированы намного удобнее.
А также много данных можно получить с датчиков, в том числе с процессора, памяти, материнской платы, видеокарты, вентиляторов корпуса, устройств хранения и т.д. Если же вы хотите графический способ отображения статистики, нажмите на любой пункт в списке и увидите график.
HWinfo существует более 20 лет и обновляется почти каждый месяц. При этом она полностью бесплатная. Разработчик инструмента Мартин Малик заслуживает похвалы за такой долгосрочный проект. Поддерживаются 32-разрядная и 64-разрядная версии Windows, и есть даже версия для DOS.
Speccy
Если функциональность HWinfo для вас избыточна, попробуйте программу Speccy от разработчиков приложения CCleaner. Тут также есть мониторинг датчиков, как видно на изображении ниже. Отображаются температуры, объём оперативной памяти и т.д.
В отличие от первых трёх описанных приложений данная программа обновляется не так часто. Например, процессор Intel Core i7-9700K опознаётся как i7-7700K.
Программа бесплатная и доступна на Windows. Если вы хотите получить автоматические обновления и премиальную поддержку, ежегодная подписка стоит $19,95.
AIDA64
Это приложение сделано венгерскими разработчиками из FinalWire и существует с 2010 года. Стандартная версия AIDA64 Extreme напоминает HWinfo, но она не бесплатная. Даётся 30-дневный пробный период с различными ограничениями.
После этого стоимость составляет $39,95. Оплата включает все программные функции, техническую поддержку и обновления на год. Когда срок лицензии заканчивается, приложение продолжает работать, но для получения поддержки нужно снова платить. AIDA64 есть на Android, Windows Mobile и iOS.
Зачем нужна такая программа, когда HWinfo даёт всё то же бесплатно?
HWMonitor
Если вы не хотите платить за программу для мониторинга компьютера, разработчики CPU-Z предлагают бесплатное решение. Программа размером всего 1,2 Мб расскажет вам о текущих значениях датчиков максимально подробно.
HWmonitor предназначается только для Windows-пк и позволит узнать температуру, скорость вентиляторов, напряжение. Если вы хотите узнать температуру и скорость вентиляторов на ноутбуках MacBook, имеется приложение smcFanControl.
Open HWM
Если вы хотите получить сведения о компьютере на Linux, возможности для этого довольно ограниченные. На протяжении 10 лет разработчик Майкл Мёллер ведёт проект с открытым исходным кодом под названием Open Hardware Monitor.
Приложение бесплатное и также доступно на Windows. Программа выглядит и работает как HWMonitor, но при этом чуть быстрее.
I-Nex разработана программистами из Польши и предназначается только для Linux. Она похожа на CPU-Z, но обеспечивает дополнительную информацию относительно жёстких дисков, звуковой системы и структуры операционной системы.
Как и многие программы в этом списке, эта бесплатная. Обновляется она не так часто, как остальные аналогичные программы.
Если ваш компьютер с операционной системой Linux и работает на самых современных комплектующих, программа может не узнать их.
Тестирование видеокарты. Программа FurMark
Видеокарту необходимо регулярно тестировать на наличие неисправностей, особенно если вы владелец игрового компьютера или ноутбука.Протестировать видеокарту поможет бесплатная утилита под названием FurMark.
Внешний вид приложения FurMark
Чтобы начать тестирование видеокарты, нажмите на клавишу «GPU-Z», как показано на рисунке выше.
Результат тестирования видеокарты компьютера
Тематические видеоролики:
AIDA64 универсальная программа для диагностики компьютера или ноутбука.
AIDA64 позволяет произвести: тест на стабильности системы, тест температуры видеокарты, процессора и других основных узлов компьютера.
Тестирование производительности вашего компьютера в MAXON CINEBENCH R15
Тестирование компьютера — Подробное руководство