...

Логи Bitmain Antminer (ошибки)

Логи Bitmain Antminer

Разберём по этапам логи в Kernel Log (в веб интерфейсе Bitmain → вкладка System → Kernel Log).

Самые частые ошибки:

ЛогиЧто это значитЧто делать
Chain[X]: find 0 asic или chain find 0 asic, will power off this chainПлата вообще не видна / ни одного чипа1. Выключить асик из розетки 2. Вытащить и сильно вставить обратно оба толстых силовых кабеля на этой плате 3. Включить → в 40-60% случаев на S19kPro/XP/S21 сразу найдёт 126 чипов и заработает. Не помогло → плата в ремонт
Chain[X]: only find 47-90 asicПоловина чипов пропалаПеретыкаем силовые кабели + шлейф. Не помогло → плата в ремонт
autotune fail (особенно на S21/S21+)Плата не смогла настроить частоты1. Перетыкаем кабели 2. Factory Reset + свежая прошивка 3. Не помогло → 85% умер VRM → плата в ремонт
domain voltage abnormal / unstableНа плате упало напряжение 1.2 ВНести плату в ремонт
CRC error (даже 1-2 раза в минуту)Чипы плохо передают данные друг другуЭто уже начало конца. Через 1-4 недели плата уйдёт в 0. Несите в ремонт
nonce errorЧип считает «мусор»На старых S9-S17 — мёртвый чип. На S19kPro и новее — в 90% плохое питание платы
Temp[X]: 90-97 °C на S21Нормально для S21 в 2025 годуНичего не делать, это штатное состояние
Temp[X]: 95-100+ °C (любой модели)Скоро вырубитсяСрочно улучшить обдув, убрать пыль
Fatal Error: some fan lost!Один вентилятор не крутится или не отдаёт оборотыПоменять вентиляторы местами → ошибка переехала → менять вентилятор → ошибка осталась на том же номере → ремонт контроллера
PSU error / voltage too lowБлок питания не тянет или просадка в розеткеУбрать тройники, проверить 220 В, попробовать другой БП
pic error / pic init failНа плате сгорел маленький «мозг» (PIC)Плата в ремонт
EEPROM error / eeprom checksum failПамять платы умерла или данные стёрлись90% — плата в ремонт. Перепрошивка помогает редко

Запуск майнера и софта

Строка в логеЧто значитЧто делать
bmminer start / cgminer startЗапустился основной майнер (движок, который считает хэш)Норма
restart bmminerПерезапуск майнера внутри системы (без полного ребута асика)Смотреть строки выше — почему перезапустился
Found bmminer / start running bmminerКонтроллер нашёл и запускает бинарник майнераНорма
bmminer not running, restart…Процесс упал, watchdog пытается поднять обратноИдём выше по логу, ищем причину падения (температура, чипы, БП)

Определение плат (Chain/Hashboard)

СтрокаЧто значитЧто делать
check_chain_num: chain_num = 3Асик ожидает 3 хешборда (0, 1, 2)Норма
chain[0] exist / chain[1] existПлата найдена по шлейфуНорма
chain[2] is missing / chain[2] doesn’t existОдна из плат не отвечает вообщеПроверить питание платы, шлейфы, порт; скорее всего ремонт платы
hashboard type: S19Контроллер определил тип платы/моделиНорма
hashboard missingПлаты нет или она «мёртвая»Проверить кабеля, питание. Если не помогает — нести в ремонт

Поиск чипов на платах (ASIC detect) для Bitmain

СтрокаЧто значитЧто делать
chain[0]: find 126 asicНа плате 0 найдено 126 чипов — норма для S19-серииВсё хорошо
chain[1]: find 0 asicПлата есть физически, но ни один чип не отвечаетПроверить питание и силовые кабели (на S19kPro/S19XP/S21 часто это плохой контакт в разъёме питания платы), в ремонт, если всё равно не видит чипы
chain[1]: only find 47 asicПлата нашла часть чипов, цепочка обрываетсяПроверить шлейф; если повторяется — ремонт цепочки/чипов
chain[2]: asic detected = 76Альтернативный формат: найдено 76 чиповЕсли должно быть 76 — норма, если больше — недочип, ремонт
asic number is not enoughКоличество найденных чипов меньше нормыПлата дефектная, нужна диагностика
chain 1 find asic 0, will power off this chainКонтроллер отключает эту плату, так как чипы не найденыАсик будет работать без этой платы, но хешрейт упадёт; плату в ремонт

Инициализация PIC, сенсоров и служебных контроллеров

СтрокаЧто значитЧто делать
pic init / init pic okPIC-контроллер успешно запустилсяНорма
pic error / failed to init picКонтроллер питания/датчиков не выходит на связьЧаще всего ремонт платы; может лечиться перепрошивкой, но не всегда
read temp sensor okДатчики температуры отвечаютНорма
read temp sensor error / temp sensor read failНе получается прочитать температуру с платыПроверить шлейф; если на одной плате стабильно — ремонт

Проверка вентиляторов при запуске

СтрокаЧто значитЧто делать
check fan NUM: 2Ожидается 2 вентилятора (или 4 — в зависимости от модели)Норма
Fan0 speed = 0, Fan1 speed = 0 (start phase)На запуске вентиляторы ещё не раскрутилисьНорма, если дальше появляется нормальное значение
Fatal Error: some fan lost! (на старте)Уже при запуске контроллер видит, что один вентилятор не отвечаетПроверить вентилятор, кабель, разъём; без исправления асик не запустится в майнинг

Строки с калибровкой, autotune при старте

СтрокаЧто значитЧто делать
start autotune / begin tuning chain 0Запуск подбора частот и напряжений для платНорма
tune chain 0 asic 0-125Идёт настройка всех чипов на плате 0Норма
autotune fail (особенно на S21)Плата не смогла настроить частотыПроверить кабели, перезагрузить прошивку. Если не помогло, проблема в VRM → в ремонт
calibration OKКалибровка завершена успешноНорма
calibration failНе удалось откалибровать платуПовторный запуск; если повторяется — ремонт

Что видно в логах — расшифровка

Что видно в логахЧто это значитЧто делать
chain 1 lower hashЭта плата работает слабее остальных. Дает меньше терахэшей.1) Сравнить температуру этой платы с другими. 2) Посмотреть, сколько чипов она нашла на старте. 3) Есть ли CRC-ошибки? Если есть → плата деградирует.
only find 47 asicАсик нашёл меньше чипов. Плата неполная/частично умерла.Плата рабочая, но уже «криво». Нужна диагностика или ремонт.
CRC error on chain 1Чипы на плате передают данные с ошибками. Цепочка нестабильна.Если CRC повторяются → плата умирает. Временно можно майнить, но хешрейт будет падать → отправлять в ремонт.
disable chain 1Асик сам отключил плату — она совсем плохая.Ничего не сделать. Асик будет майнить только на 1-2 оставшихся платах. Плату в ремонт.
asic X timeout / nonce errorОдин из чипов глючит, плохо отвечает или считает неправильно.Разовая ошибка — норм. Частые ошибки → плата деградирует → ремонт.
hashrate now сильно ниже avgХешрейт прыгает, асик нестабилен.Проверяйте: 1) температуру; 2) работает ли одна из плат хуже; 3) есть ли CRC; 4) не троттлит ли асик из-за жары.

Общие ошибки по питанию

Что видно в логахЧто это значитЧто делать
voltage too lowАсик недополучает питание. Напряжение просело.1) Померить напряжение в розетке (должно быть 220-240В). 2) Убрать удлинители/тройники. 3) Проверить кабель питания. 4) Если повторяется → менять БП.
voltage too highНапряжение выше нормы — опасно для асика.Проверить розетку мультиметром. Если это выдаёт БП → заменить БП.
PSU errorБлок питания работает неправильно.1) Проверить кабель и контакты. 2) Заменить БП — это чистый признак его умирания.
power lostПитание кратковременно пропадало/провалилось.1) Проверить розетку и кабель. 2) Проверить автомат/щиток. 3) Если всё ок — менять БП.
power low, rebootАсик уходит в перезагрузку из-за просадки по питанию.Проверить питание, заменить БП.

Внутреннее питание плат (domain voltage)

Что видно в логахЧто это значитЧто делать
domain voltage abnormalНа одной из плат напряжение гуляет или нестабильно. Это уже проблема самой платы, а не розетки.Плата в ремонт. Самостоятельно не чинится.
set volt xx / volt adjustАсик подбирает напряжение для чипов — норма.Ничего делать не нужно.
volt too low for chain XНа этой плате не хватает питания для стабильной работы.Проверить БП. Если БП нормальный → плата деградирует → ремонт.

Ограничение мощности (Power Limit)

Что видно в логахЧто это значитЧто делать
power limit reachedАсик сам урезал мощность, потому что БП не тянет или питание проседает.Проверить: 1) температуру БП; 2) сеть 220В; 3) если повторяется — менять БП.
limited power modeВключился режим экономии — хешрейт снизится.Проверить питание.

Подключение к пулу

Что видно в логахЧто это значитЧто делать
stratum connectАсик пытается подключиться к пулу.Норма.
stratum connectedПодключение к пулу успешно.Всё хорошо — майнит.
stratum authenticate successАсик прошёл авторизацию (Worker верный).Норма.

Проблемы с сетью (кабель, интернет, DNS)

Что видноЧто это значитЧто делать
socket connect failedАсик не может подключиться к пулу. Нет интернета.1) Проверить кабель. 2) Проверить роутер. 3) Попробовать другой пул.
reconnecting…Асик теряет связь и пытается заново подключиться.Интернет нестабилен. Проверить сеть.
DNS resolve failedАсик не может найти домен пула (проблема DNS).Поменять DNS в роутере: 8.8.8.8 / 1.1.1.1.
stratum connection interruptedСвязь оборвалась.Проверить интернет, кабель, вилку.
network error, retry after 10 secondsИнтернет есть, но нестабилен.Проверить пинг/задержки.

Проблемы с пулом (ошибки авторизации или сам пул лежит)

Что видноЧто значитЧто делать
stratum authentication failedНеверный Worker или пароль (обычно «x»).Проверить строку воркера на пуле.
pool 0 slow/downПул не отвечает или работает медленно.Сменить пул / подождать.
null work receivedПул прислал пустое задание.Проблема на стороне пула.
pool failed: retry after …Асик не может обменяться данными с пулом.Проверить сеть → попробовать другой пул.

Ошибки шар и подтверждения

Что видноЧто значитЧто делать
accepted shareПул принял шары — всё работает.Норма.
rejected shareПул отклоняет часть шар.Если >3% → проверить интернет (задержки).
stale shareУстаревшие шары — асик прислал слишком поздно.Проблема с задержкой сети. Проверить провайдера.
high stale rateСлишком много устаревших шар.Интернета не хватает. Менять роутер или кабель.

Ключевые симптомы, когда асик не майнит, но выглядит рабочим

Что видноЧто это значитЧто делать
hashrate now = 0, но вентиляторы крутятсяАсик не получает задания от пула.Проверить сеть/пул/DNS.
Нет accepted share за 1-2 минутыАсик подключён, но не выполняет работу.Проблема в пуле или авторизации.
Постоянные reconnectingИнтернет «плавает».Проверить кабель, роутер, сменить порт.
socket send errorАсик не может отправить шары на пул.Проверить сеть.

Самые частые причины ребута (watchdog)

Что видно в логахЧто значитЧто делать
watchdog: restart minerАсик завис или перестал считать → watchdog принудительно перезапустил.Смотреть 10-30 строк выше: температура? CRC? питание? сеть?
restart bmminerСам майнер упал (как программа).Часто бывает при плохом питании или ошибки чипов. Проверить питание → смотреть CRC.
power lost, rebootПитание просело/пропало, асик перезапустился.Проверить розетку, кабель, БП.
fatal error, rebootingЖёсткая ошибка оборудования.Смотреть, какая цепочка или датчик дал сбой → обычно ремонт.

Ребут из-за температуры

Что видноЧто значитЧто делать
temp too high, rebootАсик перегрелся и включил защиту.Проверить вентиляцию, пыль, температуру помещения.
overheat, shutdown, rebootЧипы или плата превысили лимит.Сначала охлаждение, потом тестировать.
fan lost, rebootВентилятор не работает → безопасность → ребут.Проверить вентиляторы, кабели, порты.

Ребут из-за питания (БП, просадка 220В)

ЛогЧто это значитЧто делать
power low, rebootБП не справляется, мало напряжения.Проверить сеть 220В, убрать удлинители, заменить БП.
voltage too low, restartГлубокая просадка питания.То же самое.
psu error, rebootБП работает неправильно.95% случаев → менять БП.

Ребут из-за чипов, платы (chain)

Что видноЧто значитЧто делать
chain X asic status abnormal, rebootПлата зависла или чипы не отвечают.Смотреть CRC, температуру, недочип.
CRC error … restartЦепочка «сыпется», чипы передают ошибки.Ремонт платы.
chain X lower hash, restartПлата упала по хешрейту → watchdog считает это отказом.Проверить плату (температура, CRC, недочип).
fault on chain X, rebootЖёсткая ошибка цепочки.Плата в ремонт.

Ребут из-за сети, пула

Что видноЧто значитЧто делать
stratum disconnect, rebootАсик теряет пул и считает, что он «мертв».Проверить интернет, DNS, роутер.
no active pool, rebootАсик не нашёл ни одного рабочего пула.Исправить строку воркера, сменить пул.

Ошибки PIC (микроконтроллер на плате)

Что видно в логахЧто значитЧто делать
read pic failКонтроллер не получает данные с PIC.Плата в ремонт. Дома не чинится.
pic init failPIC не запустился при старте.Ремонт платы / прошивка PIC на стенде.
pic sensor errorPIC не может прочитать датчик температуры.Проверить шлейф → если не помогает — ремонт платы.

Ошибки датчиков температуры

Что видноЧто значитЧто делать
temp sensor errorАсик не видит датчик температуры.Проверить шлейфы. Если привязано к плате → ремонт.
read temp failСбой при чтении датчика.То же самое.
sensor connection lostДатчик не отвечает.Проверить шлейф → ремонт платы.
board temp abnormalДатчик даёт неверные показания.Плата нестабильна → в ремонт.

Ошибки контроллера (control board)

ЛогЧто значитЧто делать
control board lost chainКонтроллер не видит плату.Переподключить шлейфы. Если не помогает — ремонт платы или контроллера.
control board rebootСбой контроллера.Прошивка / сброс на заводские.
control board errorКонтроллер работает нестабильно.Перепрошивка. Если остаётся — заменить контроллер.
gpio init errorКонтроллер не может инициализировать линии управления платой.Характерно для S17/T17. Почти всегда ремонт платы.

Ошибки EEPROM

Если кратко: видите в логах слово EEPROM, можете сразу нести плату в ремонт.

Что видноЧто значитЧто делать
EEPROM errorEEPROM не читается или повреждён.Ремонт платы или перепрошивка EEPROM на программаторе.
eeprom data invalidДанные повреждены.То же самое.
eeprom not foundEEPROM не обнаружен.Плата неисправна → ремонт.

Модели асиков Antminer с уникальными логами: ANTMINER S19, S19 Pro, S19j, XP

МодельУникальная ошибкаЧто значитЧто делать
S19 серияstart autotuneЗапуск автотюна частот.Норма.
S19 серияstart voltage tuneНастройка напряжений цепей.Норма.
S19 серияvoltage calibrationКалибровка напряжения на платах.Наблюдать, если ошибка не повторяется.
S19/S19jasic index abnormalСбой в порядке чипов.Проверить CRC, возможно ремонт.
S19/S19jhashboard mismatchПлата не соответствует прошивке/модели.Проверить прошивку, совместимость, иногда плата неоригинальная.
S19/S19 XPdomain voltage abnormalПлохое питание цепочки.Плата в ремонт.
S19 Propic init failPIC не запускается.Ремонт платы.

ANTMINER S21, T21, PRO

МодельУникальная ошибкаЧто значитЧто делать
S21/T21VRM protection triggeredСработала защита питания VRM.Плата неисправна → ремонт.
S21/T21overcurrent on chainСлишком большой ток на плате.Проверить питание, скорее всего ремонт.
S21/T21domain voltage unstableНапряжение скачет.Плата деградирует → ремонт.
S21/T21chip detect timeoutЧипы не прошли инициализацию вовремя.Проверить шлейф → ремонт платы.
S21/T21critical temp: hashing stoppedТемпература достигла критического уровня.Проверить охлаждение.

ANTMINER L7 (LTC/DOGE)

МодельУникальная ошибкаЧто значитЧто делать
L7L7: pll errorЧастота PLL не выставилась.Плата в ремонт или снизить частоту.
L7L7 autotune failАвтотюн не смог подобрать частоты.Проверить питание, температуру.
L7chip temp abnormalПроблема с датчиком температуры платы.Проверить датчики → ремонт.
L7fan lostПотеря вентилятора, критичная для L7.Проверить вентиляторы.

ANTMINER HYDRO

МодельУникальная ошибкаЧто значитЧто делать
S19 Hydro / S21 Hydrowater temp highВода перегрелась.Проверить контур охлаждения.
Hydropump speed lowНасос работает слишком медленно.Проверить насос.
Hydroflow sensor errorНет потока воды.Остановить работу → чинить контур.
Hydrowater cooling protectСработала защита водяного охлаждения.Устранить проблему в охлаждении.
HydroERROR_WATER_REVERSEСработала защита водяного охлаждения.Поменять местами обратку и подачу.

We are interested in long-term cooperation with our Partners and customers, so reliability and quality are our top priorities. Do you have any questions? Please contact our support team

Copyright © 2017 vnish.ru