Bună ziua!
În ultimele zile au existat multiple reboot-uri la nivelul hypervizorilor ce se află în propria noastră locație din România. Deși nu au existat pierderi de date, știm că nu toți clienții și-au setat autostart pentru software-ul lor esențial, iar aceeste rebooturi pot fi foarte neplăcute.
Așadar, suntem conștienți de faptul că avem o problemă și suntem gata să o rezolvăm imediat ce vom afla sursa acestei probleme.
Ce știm cu certitudine în acest moment, e faptul că la nivel de grid (rețeaua publică de furnizare a energiei electrice) există întreruperi ale furnizării energiei ce durează mai puțin de o secundă, efectul fiind vizibil doar atunci când există becuri aprinse și există mici fluctuații ale luminii. Faptul că aceste întreruperi sunt atât de scurte, pun în dificultate sistemele noastre ce ar trebui să ne asigure până la 100% uptime:
- generatorul pornește automat în 10 secunde -> inutil în cazul de față
- bateriile pot susține sarcina până la 2 ore -> inutil în cazul de față
- Invertorul OFF-GRID în modul UPS ar trebui să schimbe sursa electricității de la grid la baterii în mai puțin de 100ms -> posibil ca aici să fie problema
- PDU-ul care împarte sarcina de la invertor la echipamentele IT are la rândul său diferite grade de protecție -> posibil ca aici să fie problema.
Întrucât nu știm exact dacă PDU-ul ori UPS-ul eșuează în scenariul de față, va trebui să monitorizăm în continuare infrastructura până vom afla ce componentă va trebui înlocuită.
Știm că situația da față pune în dificultate utilizarea normală a serviciilor dar vă asigurăm că facem tot ce putem pentru rezolvarea cât mai rapidă și eficiență a acestei probleme. Nu dorim să cumpărăm degeaba nici un nou PDU și nici un UPS întrucât costurile variază între 1000 și 5000 de EURO iar o investiție inutilă ar duce ulterior la creșterea nejustificată a prețurilor pentru a acoperi și această nouă investitiție.
Mulțumim pentru înțelegere!
Hello!
In the last few days there have been multiple reboots at the level of hypervisors located in our own location in Romania. Although there was no data loss, we know that not all customers have autostart set for their critical software, and these reboots can be very annoying.
So, we are aware that we have a problem and we are ready to solve it as soon as we find out the source of this problem.
What we know for sure at the moment is that at the grid level (the public electricity supply network) there are interruptions in the supply of energy lasting less than a second, the effect being visible only when there are light bulbs on and there are small fluctuations of light. The fact that these interruptions are so short, puts a strain on our systems which should ensure us up to 100% uptime:
- the generator starts automatically in 10 seconds -> useless in the present case
- the batteries can support the load for up to 2 hours -> useless in the present case
- The OFF-GRID inverter in UPS mode should switch the electricity source from the grid to the batteries in less than 100ms -> this may be the problem
- The PDU that shares the load from the inverter to the IT equipment has in turn different degrees of protection -> this may be the problem.
Since we don't know exactly if the PDU or UPS is failing in this scenario, we will need to continue monitoring the infrastructure until we know which component will need to be replaced.
We know that the current situation makes it difficult to use the services normally, but we assure you that we are doing everything we can to solve this problem as quickly and efficiently as possible. We do not want to buy a new PDU or a UPS for nothing as the costs vary between 1000 and 5000 EURO and an unnecessary investment would later lead to unjustified price increases to cover this new investment.
Thank you for understanding!