Как обеспечить стабильную круглосуточную работу майнинг рига

Заработок от майнинга напрямую зависит от продолжительности работы устройств, которые производят вычисления для поддержания работы того или иного блокчейна.

В связи с этим необходимо обеспечить бесперебойную работу майнинг ригов со стабильным хешрейтом. Работа компьютерного оборудования в режиме 24/7 должна быть максимально автоматизирована и обеспечивать высокий уровень безопасности.

В данной статье рассматривается проблематика обеспечения продолжительного uptime в недели/месяцы при майнинге на ригах с видеокартами.

Что нужно сделать для обеспечения бесперебойной работы компьютера при майнинге?

Для обеспечения стабильной продолжительной работы ригов нужно обеспечить выполнение следующих требований:

  1. Устранить (минимизировать) возможность зависаний и сбоев (crashes);
  2. Автоматизировать процедуру перезагрузки/рестарта и повторного включения компьютера в случае зависания, сбоя, после пропадания питания/интернета;

Кроме того, важно обеспечить возможность удаленного мониторинга и доступа по сети к ригам.

Рассмотрим подробнее, как обеспечить более стабильную работу ригов в круглосуточном режиме.

Устранение (сведение до минимума) зависаний и сбоев майнинг ригов

Для обеспечения стабильной работы рига нужно:

  • использовать надежное программное обеспечение, содержащее минимум ошибок (операционная система, драйвера, майнер). Для минимизации появления возможных сбоев нужно настроить систему: отключить в системе ненужные службы, удалить неиспользующиеся программы, отменить ненужные задания автоматического обслуживания/обновления. При сбоях по питанию и частых перезагрузках рига могут слететь драйвера, что будет приводить к зависаниям и появлению ошибок. В ОС типа Linux такие проблемы появляются редко, поэтому риги стоит переводить именно на Linux-подобные системы (по возможности);
  • использовать качественный блок питания, способный длительное время отдавать нужную мощность и напряжение. Блок питания должен стабильно работать при скачках напряжения в сети, фильтровать импульсные помехи, иметь защиту от коротких замыканий, перегрузок и перегрева;
  • обеспечить качественные контакты, в особенности по цепи прохождения сигнала между видеокартами, райзерами и материнской платой. Нужно учитывать тот факт, что риг с подключенными шестью видеокартами имеет в десятки раз больше ненадежных контактов через разъемы, чем обычный компьютер с одной видеокартой, вставленной в разъем PCI-E материнской платы. Некачественный контакт даже в одном месте может привести к зависанию всей системы. Плохой контакт по линии питания (что часто случается при использовании переходников) может привести не только к зависанию, но и к возгоранию (из-за этой опасности не стоит использовать райзера с питанием по разъему PCI-E). При использовании переходников нужно регулярно проверять их на предмет нагревания, изменения цвета изоляции на проводниках. Если провода слишком сильно греются, то нужно заменить их на более мощные (толще);
  • не стоит использовать слишком большой разгон видеокарт. Погоня за лишней копейкой может обернуться потерями долларов из-за простоев, вызванных прекращением работы ригов, вызванных сбоями из-за переразгона/излишнего даунвольтинга. После сборки рига нужно найти частоты и вольтаж, при котором он работает относительно стабильно, но для практической работы выставить эти значения на уровне 80-90% от найденных (немного уменьшить частоту разгона). Это обеспечит более надежную работу рига и убережет его от лишних зависаний/сбоев. Кроме того, нужно учитывать, что со временем у чипов памяти проявляется деградация из-за эффекта электромиграции. Из-за этого для стабильности периодически нужно немного снижать разгон по памяти.

Большую пользу для обеспечения круглосуточной работы рига окажут сторожевые таймеры. Они недороги и просты в настройке, поэтому их стоит использовать на всех ригах.

Кроме аппаратных сторожевых таймеров, стоит добавить программную функцию повторного запуска майнера или перезагрузки компьютера в батнике.

Для этого батник модернизируют следующим образом:

@echo off

:loop

команды для запуска майнера (основной батник)

timeout /t 1 >nul

taskkill /f /im название_майнера >nul

goto loop

Такая модернизация позволяет осуществлять циклический перезапуск майнера после программных сбоев в его работе.

Если риг работает нестабильно даже без оверклокинга и даунвольтинга, используется хороший БП, обеспечены нормальные контакты, то причину зависаний и сбоев нужно искать в несовместимости/неисправности использующегося железа.

Возможно, сбоит оперативная память компьютера (нужно прогнать memory test), в BIOS выставлена слишком большая скорость обмена по линии PCI-E (нужно использовать GEN1 или GEN2), недостаточен размер файла подкачки, или сбоит жесткий диск, на котором он стоит.

Кроме сбоев, существуют внешние факторы, приводящие к простоям ригов. К ним можно отнести сбои по сетевому питанию и пропадание подключения к интернету.

При нестабильной сети 220В можно подключить риги через UPS, а также использовать аппаратные watchdog-и. Также в BIOS нужно включить опцию автоматического включения после пропадания питания.