OpenAI wprowadza przełom w komunikacji AI z modelem GPT-4o

W najnowszej aktualizacji swojego modelu sztucznej inteligencji, OpenAI dokonuje kroku milowego, prezentując możliwości swojego najnowszego modelu, GPT-4o, który może naśladować ludzkie kadencje mowy i wykrywać nastroje swoich użytkowników. Ta zdolność do emulowania emocjonalnych aspektów komunikacji przywodzi na myśl film Spike’a Jonze’a „Ona” z 2013 roku, w którym główny bohater zakochuje się w systemie operacyjnym opartym na AI.

OpenAI twierdzi, że nowy model, skrótowo nazwany “omni”, działa znacznie szybciej niż jego poprzednicy i może analizować tekst, dźwięk oraz obrazy wideo w czasie rzeczywistym. Model GPT-4o będzie integrowany z popularnym chatbotem firmy, ChatGPT, i ma być udostępniony użytkownikom, również tym korzystającym z darmowej wersji, w najbliższych tygodniach.

Podczas krótkiej prezentacji transmitowanej na żywo, w której nie uczestniczył CEO firmy, Sam Altman, dyrektor ds. technologii Mira Murati oraz inni dyrektorzy demonstrowali zdolności GPT-4o do rozmowy w czasie rzeczywistym. Na prośbę publiczności, AI dodawało więcej emocji do swojej odpowiedzi, czyniąc komunikację bardziej dramatyczną. W trakcie demonstracji, GPT-4o pokazało również, jak może ułatwić rozwiązywanie prostych równań matematycznych oraz bardziej złożonych zadań programistycznych, nie ograniczając się jedynie do szybkiego podawania odpowiedzi.

W szczególnie imponującej demonstracji, model był w stanie zinterpretować stan emocjonalny osoby na podstawie selfie, oceniając, że osoba jest szczęśliwa, gdyż się uśmiechała. OpenAI zademonstrowało również zdolność modelu do tłumaczenia wypowiedzi na angielski i włoski, co ma na celu ułatwienie komunikacji między osobami mówiącymi różnymi językami.

Mimo że prezentacja trwała mniej niż 30 minut, wywarła znaczące wrażenie. Jednakże, jak zauważa Chirag Dekate z Gartnera, niektóre prezentowane możliwości mogą wydawać się znajome, gdyż podobne funkcje były już prezentowane przez innych gigantów technologicznych, jak Google. W zeszłym roku OpenAI wydawało się mieć przewagę nad konkurentami, ale teraz, jak twierdzi Dekate, widać, że firma musi nadrabiać zaległości w niektórych obszarach.

Należy również zwrócić uwagę na nadchodzącą konferencję Google I/O, gdzie zaplanowano prezentacje aktualizacji ich modelu AI, Gemini. To wydarzenie z pewnością dostarczy więcej informacji na temat kierunku, w którym zmierzają główni gracze na rynku sztucznej inteligencji.

Innowacje OpenAI w modelu GPT-4o, choć robią wrażenie, rzucają również światło na dynamicznie zmieniający się krajobraz technologiczny, w którym ciągłe inwestycje w rozwój AI są kluczem do utrzymania przewagi na rynku. Jak długo OpenAI będzie w stanie utrzymać krok z rywalami, pozostaje kluczowym pytaniem dla obserwatorów branży.

OpenAI wprowadza przełom w komunikacji AI z modelem GPT-4o

Biuletyn

Microsoft Polska zacieśnia szyki. Cichocka i Albin wchodzą do zarządu

Wzrost ataków DDoS o 50% – czy Twoja firma jest gotowa na cybernetyczne tsunami?

Zobacz również

Trzy ekrany kontra chińska presja. Samsung otwiera nowy front walki o rynek premium

Ubezpieczenie cyber: Partner w kryzysie czy tylko płatnik?

Koniec ery „pisania SQL-a”. Snowflake kreśli wizję architektury danych na 2026 rok

Koniec „garażowych” wdrożeń. OCP standaryzuje infrastrukturę dla komputerów kwantowych

Ukryte koszty IT cichym hamulcem biznesu. Pochłaniają nawet 7 proc. obrotów

Microsoft Polska zacieśnia szyki. Cichocka i Albin wchodzą do zarządu

Pragmatyzm kontra hype: Jak “agent washing” i halucynacje sprowadziły AI na ziemię

Biznes uwielbia agentów AI, ale kompletnie ich nie kontroluje