OpenAI wprowadza przełom w komunikacji AI z modelem GPT-4o

W najnowszej aktualizacji swojego modelu sztucznej inteligencji, OpenAI dokonuje kroku milowego, prezentując możliwości swojego najnowszego modelu, GPT-4o, który może naśladować ludzkie kadencje mowy i wykrywać nastroje swoich użytkowników. Ta zdolność do emulowania emocjonalnych aspektów komunikacji przywodzi na myśl film Spike’a Jonze’a „Ona” z 2013 roku, w którym główny bohater zakochuje się w systemie operacyjnym opartym na AI.

OpenAI twierdzi, że nowy model, skrótowo nazwany „omni”, działa znacznie szybciej niż jego poprzednicy i może analizować tekst, dźwięk oraz obrazy wideo w czasie rzeczywistym. Model GPT-4o będzie integrowany z popularnym chatbotem firmy, ChatGPT, i ma być udostępniony użytkownikom, również tym korzystającym z darmowej wersji, w najbliższych tygodniach.

Podczas krótkiej prezentacji transmitowanej na żywo, w której nie uczestniczył CEO firmy, Sam Altman, dyrektor ds. technologii Mira Murati oraz inni dyrektorzy demonstrowali zdolności GPT-4o do rozmowy w czasie rzeczywistym. Na prośbę publiczności, AI dodawało więcej emocji do swojej odpowiedzi, czyniąc komunikację bardziej dramatyczną. W trakcie demonstracji, GPT-4o pokazało również, jak może ułatwić rozwiązywanie prostych równań matematycznych oraz bardziej złożonych zadań programistycznych, nie ograniczając się jedynie do szybkiego podawania odpowiedzi.

W szczególnie imponującej demonstracji, model był w stanie zinterpretować stan emocjonalny osoby na podstawie selfie, oceniając, że osoba jest szczęśliwa, gdyż się uśmiechała. OpenAI zademonstrowało również zdolność modelu do tłumaczenia wypowiedzi na angielski i włoski, co ma na celu ułatwienie komunikacji między osobami mówiącymi różnymi językami.

Mimo że prezentacja trwała mniej niż 30 minut, wywarła znaczące wrażenie. Jednakże, jak zauważa Chirag Dekate z Gartnera, niektóre prezentowane możliwości mogą wydawać się znajome, gdyż podobne funkcje były już prezentowane przez innych gigantów technologicznych, jak Google. W zeszłym roku OpenAI wydawało się mieć przewagę nad konkurentami, ale teraz, jak twierdzi Dekate, widać, że firma musi nadrabiać zaległości w niektórych obszarach.

Należy również zwrócić uwagę na nadchodzącą konferencję Google I/O, gdzie zaplanowano prezentacje aktualizacji ich modelu AI, Gemini. To wydarzenie z pewnością dostarczy więcej informacji na temat kierunku, w którym zmierzają główni gracze na rynku sztucznej inteligencji.

Innowacje OpenAI w modelu GPT-4o, choć robią wrażenie, rzucają również światło na dynamicznie zmieniający się krajobraz technologiczny, w którym ciągłe inwestycje w rozwój AI są kluczem do utrzymania przewagi na rynku. Jak długo OpenAI będzie w stanie utrzymać krok z rywalami, pozostaje kluczowym pytaniem dla obserwatorów branży.