Czy dane w firmie są gotowe na AI? Pięć pytań przed projektem

Firmy coraz częściej wiedzą, gdzie chciałyby wykorzystać sztuczną inteligencję. W obsłudze klienta, sprzedaży, finansach, produkcji, analizie dokumentów albo prognozowaniu popytu. Coraz częściej mają też budżet, narzędzia i pierwsze pilotaże. Problem pojawia się poziom niżej: przy danych.

Dane, które przez lata wystarczały do raportów, dashboardów i analiz miesięcznych, nie zawsze są wystarczające dla systemu, który ma rekomendować decyzje, automatyzować proces albo odpowiadać klientowi w czasie rzeczywistym. Raport może tolerować ręczne korekty, opóźnienia i niepełne rekordy. Model AI korzysta z tego, co dostaje. Jeśli widzi niepełny, niespójny albo nieaktualny obraz firmy, jego odpowiedź może wyglądać przekonująco, ale prowadzić do słabszych decyzji.

Dlatego przed projektem AI warto zadać pytanie nie tyle „czy mamy dane?”, ile „czy te dane nadają się do konkretnego zastosowania, które chcemy wdrożyć?”.

Według badania Harvard Business Review Analytic Services i Cloudera tylko 7 proc. przedsiębiorstw deklaruje, że ich dane są w pełni gotowe do AI. W innym badaniu Cloudera 79 proc. respondentów wskazało, że inicjatywy AI utrudnia ograniczony dostęp do danych między środowiskami, a tylko 30 proc. firm miało w pełni zintegrowane źródła danych. To dobrze pokazuje, że w wielu organizacjach barierą nie jest już sama chęć użycia AI, ale fundament, na którym AI ma pracować.

Dużo danych to za mało

W wielu firmach dane istnieją, ale są rozproszone. Część znajduje się w CRM, część w ERP, część w e-commerce, część w systemach obsługi klienta, arkuszach, dokumentach i korespondencji. Dla człowieka, który zna organizację, taki krajobraz bywa niewygodny, ale możliwy do interpretacji. Dla AI może stać się źródłem błędów.

Warto rozróżnić trzy poziomy. Pierwszy to dane istniejące, czyli takie, które firma gdzieś posiada. Drugi to dane używalne, które można połączyć, zrozumieć i wykorzystać bez długiego ręcznego porządkowania. Trzeci to dane gotowe do AI, czyli wystarczająco aktualne, spójne, opisane i adekwatne do konkretnego celu biznesowego.

To rozróżnienie jest ważne, bo projekt AI nie potrzebuje idealnych danych w całej organizacji. Potrzebuje danych wystarczająco dobrych dla konkretnej decyzji, którą ma wspierać.

Gdzie najczęściej pęka projekt

Najczęstsze luki są zwykle mniej spektakularne niż sam model, ale bardziej decydujące dla efektu. Silosy danych sprawiają, że AI widzi tylko fragment klienta, produktu lub procesu. Brak wspólnych definicji powoduje, że sprzedaż, finanse i operacje mogą inaczej rozumieć „aktywny klient”, „marżę” albo „utracone zamówienie”. Nieaktualne dane sprawiają, że model dobrze opisuje przeszłość, ale słabo reaguje na zmianę rynku. Brak właściciela danych utrudnia szybkie ustalenie, gdzie powstał błąd.

W badaniu Confluent 72 proc. liderów IT wskazało wyzwania z przetwarzaniem danych w czasie rzeczywistym jako barierę dla skalowania AI. 66 proc. mówiło o niepewności dotyczącej pochodzenia danych, a 65 proc. o rozproszonej odpowiedzialności za dane. Jednocześnie tylko 32 proc. organizacji miało agentów AI realnie działających w produkcji.

Te dane pokazują, że gotowość do AI nie jest wyłącznie sprawą data teamu. Dotyczy sposobu, w jaki firma opisuje procesy, ustala odpowiedzialność i decyduje, które źródło informacji jest wiarygodne.

Pięć pytań przed projektem AI

Dobrym punktem wyjścia jest krótki test gotowości danych. Nie chodzi o audyt całej organizacji, ale o uporządkowanie jednego konkretnego zastosowania.

Pierwsze pytanie brzmi: jaką decyzję biznesową AI ma wspierać? Dane mogą być wystarczające do segmentacji klientów, ale niewystarczające do automatycznej oceny ryzyka albo dynamicznego ustalania ceny.

Drugie: czy dane pokazują cały proces, czy tylko jego wycinek? Model oparty wyłącznie na CRM może nie widzieć reklamacji, historii płatności, zwrotów albo kontaktów z obsługą klienta.

Trzecie: czy różne systemy mówią to samo o kliencie, produkcie lub transakcji? Jeśli klient ma inne ID w CRM, e-commerce i systemie obsługi, AI nie buduje pełnej historii relacji. Buduje kilka oderwanych historii i próbuje wyciągać z nich jeden wniosek.

Czwarte: czy dane są wystarczająco aktualne dla decyzji, którą model ma wspierać? Dane dobre do raportu kwartalnego mogą być za wolne dla rekomendacji sprzedażowej, wykrywania anomalii albo zarządzania zapasem.

Piąte: czy wiadomo, kto odpowiada za kluczowe dane? Gdy wynik modelu budzi wątpliwość, firma potrzebuje wiedzieć, gdzie sprawdzić źródło problemu i kto może je poprawić.

Najbardziej kosztowne są nieoczywiste braki

W praktyce projekty AI rzadko zatrzymują się dlatego, że firma „nie ma danych”. Częściej okazuje się, że brakuje danych w kluczowych miejscach. Nie ma wiarygodnych etykiet, czyli odpowiedzi na pytanie, jaki wynik był poprawny. Nie ma informacji o pochodzeniu danych. Nie ma historii zmian. Nie ma jednego punktu odniesienia, gdy systemy pokazują różne wersje tej samej informacji.

To właśnie takie luki utrudniają przejście od efektownego pilotażu do wdrożenia, które działa na co dzień. W pilotażu wiele rzeczy można obejść ręcznie. W produkcji każdy wyjątek zaczyna kosztować: czas zespołu, zaufanie użytkowników, jakość decyzji albo bezpieczeństwo regulacyjne.

Ten problem dobrze widać także w szerszych danych o zwrocie z inwestycji w AI. Według opisywanego badania PwC ponad połowa CEO nie widziała jeszcze istotnych korzyści kosztowych ani przychodowych z AI, mimo że firmy intensywnie inwestują w sztuczną inteligencję, analitykę danych i chmurę. Jednym z wyzwań pozostaje przejście od pilotaży do rozwiązań zintegrowanych z działalnością firmy.

To nie jest argument za odkładaniem AI. Raczej za bardziej precyzyjnym startem. Zamiast zaczynać od wielkiego programu porządkowania wszystkich danych, lepiej wybrać jeden ważny use case i sprawdzić dane krytyczne właśnie dla niego. Dla rekomendacji sprzedażowych będą to inne źródła niż dla predykcji awarii, obsługi reklamacji czy analizy ryzyka finansowego.

Takie podejście pozwala szybciej zobaczyć, gdzie dane są wystarczające, gdzie projekt wymaga zawężenia, a gdzie największą wartość przyniesie najpierw uporządkowanie definicji, dostępu lub odpowiedzialności.

To temat zarządu, IT i biznesu jednocześnie

Gotowość danych do AI nie zależy wyłącznie od technologii. IT może dostarczyć integrację, architekturę i narzędzia. Biznes doprecyzowuje decyzję, którą AI ma wspierać. Compliance pomaga określić granice wykorzystania danych. Zarząd rozstrzyga, które zastosowania są warte inwestycji i jaki poziom ryzyka jest akceptowalny.

W tym sensie pytanie o dane jest jednym z najprostszych testów dojrzałości AI w firmie. Nie sprawdza tylko jakości tabel w systemach. Sprawdza, czy organizacja wie, co chce automatyzować, na czym model będzie pracował, jak będzie oceniany i kto odpowiada za informację, gdy AI zacznie wpływać na realne decyzje.

Modele można kupić, przetestować i wymienić. Znacznie trudniej szybko nadrobić brak wspólnych definicji, właścicieli danych, historii zmian i zaufania do informacji. Dlatego firmy, które chcą wyjść poza pilotaże, coraz częściej odkrywają, że AI nie zaczyna się od modelu. Zaczyna się od pytania, czy dane rzeczywiście opisują biznes takim, jaki jest.