rdc@fri - Major malfunction of one of the nodes – Podrobnosti o dogodku

Storage Izkušnje z zmanjšano zmogljivostjo

Major malfunction of one of the nodes

Odpravljeno
Večji izpad delovanja
Začetek pred 7 meseciTrajalo 4 dni

Prizadete storitve

Frida

Večji izpad delovanja od 9:30 AM do 10:56 AM, Poslabšano delovanje od 10:56 AM do 12:46 PM, Deluje od 12:46 PM do 10:15 AM

Compute

Večji izpad delovanja od 9:30 AM do 10:56 AM, Poslabšano delovanje od 10:56 AM do 12:46 PM, Deluje od 12:46 PM do 10:15 AM

Posodobitve
  • Odpravljeno
    Odpravljeno

    GPU0 on node ixh has been successfully replaced and the node is back in production. Please, benchmark your runs against earlier ones and report any discrepancies.

    Thank you for your patience.

  • Napaka odkrita
    Napaka odkrita

    Vozlišče ixh ne deluje zaradi pregrevanja grafične kartice 0. S podporo iščemo rešitev.

    Hvala za vašo potrpežljivost.

  • Spremljanje
    Spremljanje

    We are reinstating the node and we'll monitor the status.

  • Raziskovanje
    Raziskovanje
    We are currently investigating this incident.