The Art of Data – Optymalizacja przechowywania danych w pamięciach masowych

6 min

Niedawna awaria Data Center Politechniki Wrocławskiej i praktyczne unieruchomienie wszystkich usług i uczelnianych serwisów dobitnie pokazała jak wielkie znaczenie ma prawidłowe projektowanie i użytkowanie systemów pamięci masowych i serwerów. Każdy element, każde urządzenie i system powinno być najwyższej klasy, szczególnie w dużych organizacjach, gdzie ciągłość procesów biznesowych ma szczególne znaczenie. Nie oznacza to oczywiście, że nie należy zwracać uwagi na koszty infrastruktury IT – wręcz przeciwnie, ale wybór optymalnych rozwiązań wymaga sporego doświadczenia i rozległej wiedzy inżynierskiej.


Karol Pluciennik Advatech

„Jak pokazuje praktyka, firmy mają silną tendencję do tworzenia silosów danych, bo każda z aplikacji biznesowych ma swój własny koncept na przechowywanie danych. Jeśli nawet małe, czy średnie przedsiębiorstwa użytkują statystyczne po 14,3 aplikacji, to z pewnością część danych, choćby o klientach, czy poszczególnych transakcjach powiela się w wielu miejscach. Już samo rozproszenie informacji biznesowych nie służy wydajności w przetwarzaniu danych i zmusza firmy do zbędnych inwestycji. Dopuszczenie do istnienia takich silosów danych nie ma nic wspólnego z ekonomicznym zarządzaniem pamięcią masową i w ogólności infrastrukturą IT”

Karol Płuciennik, Menedżer ds. Rozwoju Biznesu z firmy Advatech, jednego z największych integratorów rozwiązań informatycznych w Polsce.

Rzeczywiście, jeśli uda się uniknąć powielania danych, to można znacząco obniżyć wymagania w stosunku do wielkości pamięci masowej, wydajności serwerów i ogólnie obniżyć koszty infrastruktury. Osiągnięcie takiego celu wymaga posiadania odpowiednich systemów pamięci masowych i specjalistycznego oprogramowania, które będzie w stanie w pełni wykorzystać możliwości oferowane przez sprzęt. W tej dziedzinie szczególnego znaczenie nabiera wiedza,  znajomość niuansów technicznych, ekonomicznych i potrzeb firmy. 


„Z reguły analiza przedwdrożeniowa, w zestawieniu z możliwościami finansowymi i celami ekonomicznymi postawionymi przez naszych klientów, sugeruje wyraźnie konieczność skorzystania ze sprawdzonych i technologicznie zaawansowanych rozwiązań IBM, które tworzą jeden spójny ekosystem. System pamięci masowych IBM FlashSystem w połączeniu z IBM Spectrum Scale pozwala wypłynąć na bardzo szerokie wody optymalizacji przechowywania danych. Oszczędności, jakie można wygenerować w tym obszarze są znaczne i warto się pochylić nad tym bardzo interesującym zagadnieniem”

Karol Płuciennik z Advatech

IBM Spectrum Scale pozwala pozyskiwać i analizować metadane dotyczące zasobów, wielkości i konfiguracji pamięci masowej, dzięki czemu można wykryć zmiany w jej wykorzystaniu oraz umiejętnie zaplanować przyszłe potrzeby w tym zakresie. Od strony technicznej IBM Spectrum Scale to oprogramowanie pamięci masowej zdefiniowane programowo (SDS), które umożliwia przetwarzanie dużych ilości danych w środowisku rozproszonym w jednym klastrze, który może zawierać jeden lub większą liczbę serwerów albo kombinację serwerów i systemów GPFS (General Parallel File System) Storage Server. Z kolei GPFS Storage Server (GSS) to rozwiązanie pamięci masowej, które obejmuje obudowy pamięci masowej, dyski twarde i serwery, które są instalowane razem z oprogramowaniem IBM Spectrum Scale.


„System IBM Spectrum Scale można tak konfigurować, aby obsługiwał on plikową pamięć masową lub kombinację plikowej pamięci masowej i obiektowej pamięci masowej. Obiektowa pamięć masowa korzysta z obiektowego systemu pamięci masowej OpenStack Swift. Obiekty Swift są przechowywane w systemie plików GPFS”

Karol Płuciennik z Advatech

Użytkownik IBM Spectrum Scale otrzymuje jednoczesny dostęp do pojedynczego systemu plików lub zestawu systemów plików z wielu węzłów. Umożliwia to wysokowydajny dostęp do tego wspólnego zestawu danych tworząc platformę o wysokiej dostępności.

Trzeba pamiętać, IBM Spectrum Scale oferuje wiele funkcji wykraczających poza zwykły dostęp do danych. W systemie dostępna jest replikacja danych, zarządzanie pamięcią masową w oparciu o zasady i operacje w wielu ośrodkach. Można utworzyć klaster złożony z węzłów systemów AIX®, Linux® i  Windows lub ich dowolnej kombinacji. IBM Spectrum Scale można uruchomić w wirtualnych instancjach, które zapewniają wspólny dostęp do danych w środowiskach, korzystają z partycjonowania logicznego lub innych hiperwizorów. Wiele klastrów IBM Spectrum Scale może udostępniać dane w obrębie jednej lokalizacji lub w ramach połączeń sieci rozległej WAN.


„Chyba najważniejszy z punktu widzenia bezpieczeństwa danych jest wydajny mechanizm ich replikacji. IBM Spectrum Scale zapewnia wysoką dostępność na poziomie pamięci masowej dzięki dwóm spójnym replikom systemu plików umieszczonym w oddzielnych geograficznie ośrodkach. Każda z nich jest dostępna do odtworzenia na wypadek awarii tej drugiej. Dwie repliki pozostają zsynchronizowane za pomocą logicznego zapisu lustrzanego opartego na replikacji, który nie wymaga specyficznej obsługi od bazowego podsystemu dyskowego. Mając takie rozwiązanie, można się nie obawiać skutków awarii np. systemu przeciwpożarowego, jak to miało miejsce we Wrocławiu”

Karol Płuciennik z Advatech

W tych przypadkach, gdzie jest wymagana najwyższa dostępność i odporność na awarie zaleca się użycie konfiguracji z trzema ośrodkami w różnych lokalizacjach odległymi od siebie nie mniej niż 50 km. Razem udostępniają one wysoko dostępny, aktywny klaster pureScale , z możliwością bezproblemowego przełączania awaryjnego w dwóch geograficznie wyodrębnianych centrach przetwarzania danych, z trzecim oddzielnym serwisem rozstrzygającym.

Rozwiązania bazujące na IBM FlashSystem i IBM Spectrum Scale wspierają także usługi chmurowe, udostępniając natywną warstwę pamięci masowej w chmurze. Rozbudowane mechanizmy tieringu pozwalają administratorom centrów danych optymalizować wielkość pamięci masowej IBM Spectrum Scale dzięki przenoszeniu rzadziej używanych danych do pamięci masowej w chmurze. Oznacza to, że organizacja może zmniejszyć koszty inwestycyjne i operacyjne oraz poprawić efektywność wykorzystania infrastruktury IT.


„Dzięki doświadczeniu naszych konsultantów i wsparciu, które mamy w IBM, możemy oferować takie rozwiązania, które są bardzo racjonalne nie tylko z technicznego, ale i ekonomicznego punktu widzenia. Nasi klienci bardzo to doceniają” 

podsumowuje Karol Płuciennik z Advatech

Udostępnij
Leave a comment

Dodaj komentarz