Firma Snowflake na swojej dorocznej konferencji Snowflake Summit 2023 zaprezentowała nowe ulepszenia swojej ujednoliconej platformy, które mają na celu ułatwienie organizacjom wykorzystywania i zarządzania danymi. Ważne innowacje to Document AI, które umożliwia analizę i zrozumienie dokumentów, oraz aktualizacje Iceberg Tables, które pomagają eliminować silosy danych i umożliwiają efektywniejsze zarządzanie nimi. Snowflake wprowadził także nowy wskaźnik SPI, który ma na celu zwiększenie przejrzystości poprawy wydajności platformy, pokazując, że czas trwania zapytania poprawił się o 15% dla stabilnych obciążeń klientów w ciągu ostatnich 8 miesięcy.
Jednym z klientów korzystających z platformy Snowflake i jej innowacji jest Fidelity Investments. To jedna z największych instytucji finansowych obsługujących codziennie ponad 40 milionów klientów. Ponad 68 tys. globalnych współpracowników Fidelity polega na ujednoliconej platformie danych Snowflake, aby zwiększyć wpływ danych na działalność przedsiębiorstwa.
– Marzeniem każdego CIO jest posiadanie wszystkich danych organizacji w jednym miejscu, a Chmura Danych faktycznie to umożliwia. Konieczne jest, aby kluczowi interesariusze w całej organizacji mieli wgląd w to samo pojedyncze źródło danych, aby płynnie odpowiadać na zapytania i szybciej rozwiązywać problemy – mówi Mihir Shah, CIO i Enterprise Head of Data Architecture and Engineering w Fidelity Investments. – Chmura Danych pomaga nam eliminować silosy, zapewniając kontrolowany dostęp do danych kluczowym interesariuszom oraz umożliwiając nam ciągłe wprowadzanie innowacji na dużą skalę, zwiększanie wydajności i ostatecznie tworzenie większej wartości dla naszych klientów.
Według IDC, w ciągu najbliższych pięciu lat ponad 90 proc. światowych danych będzie nieustrukturyzowanych w postaci dokumentów, obrazów, wideo, audio i innych. Ta ogromna ilość danych jest rutynowo przechowywana przez organizacje, jednak uzyskanie do nich cennego wglądu wymagało w przeszłości ręcznych, podatnych na błędy procesów i złożonych umiejętności ekspertów. Opierając się na wsparciu Snowflake dla nieustrukturyzowanych danych, wbudowana w Snowflake sztuczna inteligencja dokumentów sprawi, że organizacje będą mogły bez wysiłku zrozumieć i wydobyć wartość z dokumentów za pomocą przetwarzania języka naturalnego.
Document AI to efekt przejęcia przez Snowflake firmy Applica (wrzesień 2022 r.) i wykorzystania opracowanego przez nią dużego modelu językowego (LLM). Dzięki integracji tego modelu z platformą Snowflake organizacje będą mogły łatwo wyodrębniać treści, takie jak kwoty faktur lub warunki umowne z dokumentów i dostosowywać wyniki za pomocą interfejsu wizualnego oraz języka naturalnego. Klienci będą mogli skorzystać z Document AI, aby pomóc swoim zespołom być bardziej efektywnymi w prowadzeniu działalności i zwiększyć produktywność użytkowników w bezpieczny i skalowalny sposób. Snowflake, zaczynając od Document AI, planuje rozszerzyć te możliwości na więcej typów nieustrukturyzowanych danych.
Apache Iceberg stale zyskuje na popularności jako standard branżowy dla otwartych formatów tabel. Snowflake od teraz ułatwia przedsiębiorstwom rozszerzenie wartości Chmury Danych na dane Iceberg. Dzięki Iceberg Tables organizacje mogą pracować z danymi we własnej pamięci masowej w formacie Apache Iceberg, niezależnie od tego, czy dane te są zarządzane przez Snowflake, czy zewnętrznie, jednocześnie korzystając z łatwości użytkowania, wydajności i ujednoliconego ekosystemu Snowflake. Upraszcza to zarządzanie danymi, eliminując potrzebę przenoszenia lub kopiowania danych między systemami, jednocześnie zwiększając elastyczność i obniżając koszty. Ponadto rosnący ekosystem Apache Iceberg, obejmujący różnorodnych użytkowników, współpracowników i usługi komercyjne, zabezpiecza pamięć masową na przyszłość, zapobiegając uzależnieniu od dostawcy i częstym migracjom. Klienci tacy jak Booking.com już dziś wykorzystują Iceberg Tables, aby wykorzystać moc Chmury Danych dla wszystkich swoich danych.
Snowflake koncentruje się na regularnym dostarczaniu innowacji w celu poprawy wydajności i efektywności, często nie wymagając żadnych działań ze strony klientów. Mając to na uwadze, firma wprowadza nowy wskaźnik SPI w celu ilościowego określenia ulepszeń w czasie poprzez analizę rzeczywistych obciążeń klientów. Na podstawie wskaźnika SPI można stwierdzić, że czas trwania zapytania poprawił się o 15 proc., odkąd Snowflake zaczął śledzić ten wskaźnik osiem miesięcy temu. SPI odzwierciedla zaangażowanie Snowflake w ciągłą optymalizację kosztów i wydajności dla klientów oraz zapewnienie im większej przejrzystości w zakresie ilościowego wpływu możliwości platformy i ulepszeń sprzętowych na ich obciążenia.
Snowflake rozwija swoją platformę również po to, aby obsługiwać szerszy zestaw zaawansowanych funkcji analitycznych, w tym wstępnie wbudowane funkcje uczenia maszynowego dla użytkowników SQL (wersja public preview), a także rozszerza ujednolicone zarządzanie i prywatność o nowe wskaźniki jakości danych i funkcje klasyfikacji (oba w wersji private preview).