Po fiasku z Crowdstrike, Microsoft testuje narzędzie do automatyzacji naprawy systemu Windows

Microsoft testuje nową funkcję, "Szybkie Odzyskiwanie Maszyny" (QRM), która ma zautomatyzować proces naprawy systemów Windows, które nie mogą się uruchomić. Inicjatywa ta, będąca odpowiedzią na problemy z masowymi awariami rozruchu, ma na celu zwiększenie odporności systemu Windows i zminimalizowanie przestojów.

Kuba Kowalczyk
źródło: Unplash/ Sunrise King

Microsoft pilotuje nową funkcję, „Szybkie Odzyskiwanie Maszyny” (QRM), mającą na celu automatyzację odzyskiwania systemów Windows, które nie mogą się uruchomić. Ta inicjatywa, będąca częścią szerszego programu „Windows Resilience”, ma na celu złagodzenie skutków powszechnych awarii rozruchu, problemu, który uwypuklił znaczący incydent w zeszłym roku.

Automatyczne odzyskiwanie w centrum uwagi

QRM działa poprzez monitorowanie procesu uruchamiania systemu Windows i wykrywanie krytycznych błędów, które uniemożliwiają pomyślny rozruch. Gdy wystąpi taki błąd, system automatycznie uruchamia się ponownie w środowisku odzyskiwania systemu Windows. Tradycyjnie to środowisko często wymaga ręcznej interwencji, co jest uciążliwym procesem, szczególnie w przypadku awarii na dużą skalę.

Innowacja Microsoftu polega na automatyzacji procesu odzyskiwania w tym środowisku. Dotknięte systemy będą teraz próbowały nawiązać połączenie z serwerami Microsoftu za pośrednictwem Wi-Fi lub Ethernet. To połączenie umożliwia Microsoftowi analizę danych o awariach i identyfikację powtarzających się wzorców. Jeśli zostanie wykryta wspólna przyczyna, Microsoft może opracować i wdrożyć pakiet odzyskiwania. Dotknięte systemy mogą następnie pobrać ten pakiet bezpośrednio ze środowiska odzyskiwania i spróbować samodzielnie się naprawić.

Reakcja na incydent z Crowdstrike

Wydaje się, że rozwój QRM jest bezpośrednią odpowiedzią na wyzwania, jakie stwarzają incydenty, takie jak ten, który miał miejsce 19 lipca ubiegłego roku. Wówczas wadliwa aktualizacja oprogramowania z Sensor Tower firmy Crowdstrike uniemożliwiła rozruch około 8,5 milionom komputerów z systemem Windows. Brak zautomatyzowanego mechanizmu odzyskiwania wymusił ręczną interwencję w celu przywrócenia dotkniętych systemów.

Ad imageAd image

Dzięki QRM Microsoft przewiduje bardziej usprawnioną reakcję na podobne zdarzenia. W scenariuszu z Crowdstrike, dotknięte maszyny automatycznie skontaktowałyby się z Microsoftem, umożliwiając firmie szybkie opracowanie i wdrożenie pakietu odzyskiwania, który wycofałby problematyczną aktualizację. To znacznie skróciłoby czas przestoju i obciążenie administratorów IT.

Fazowe wdrażanie i kontrola

Microsoft obecnie testuje QRM z Windows Insiders w kanale Beta Windows 11 24H2. Firma planuje ostatecznie domyślnie włączyć tę funkcję dla użytkowników Windows 11 Home. Co ważne, Microsoft zdaje sobie sprawę z potrzeby kontroli w środowiskach korporacyjnych. Klienci Windows 11 Pro i Enterprise zachowają możliwość włączenia lub wyłączenia QRM, zarówno na poziomie lokalnego administratora, jak i na poziomie organizacji. Ta elastyczność rozwiązuje obawy dotyczące prywatności danych i potrzeby, aby działy IT utrzymywały kontrolę nad procesami odzyskiwania systemu.

Implikacje i rozważania

QRM stanowi znaczący krok w kierunku poprawy odporności ekosystemu Windows. Automatyzując proces odzyskiwania, Microsoft ma na celu skrócenie czasu przestoju i zminimalizowanie skutków powszechnych awarii rozruchu.

Udostępnij