Meta wypuszcza model AI, który uczy i ocenia siebie

Meta, właściciel Facebooka, ogłosiła wprowadzenie nowego modelu sztucznej inteligencji, który umożliwia autonomiczną ocenę pracy innych modeli AI bez potrzeby zaangażowania człowieka. Technologia ta, oparta na technice „łańcucha myśli”, ma potencjał zrewolucjonizować procesy uczenia maszynowego, eliminując kosztowną konieczność ludzkiej weryfikacji.

Izabela Myszkowska

Meta, właściciel Facebooka, ogłosiła w piątek wprowadzenie na rynek nowej serii modeli sztucznej inteligencji, w tym narzędzia o nazwie „Self-Taught Evaluator”. Model ten stanowi istotny krok w kierunku redukcji potrzeby zaangażowania człowieka w proces rozwoju AI. Nowa technologia opiera się na technice „łańcucha myśli”, którą stosują także modele OpenAI, pozwalając na bardziej wiarygodne osądy w zakresie oceny odpowiedzi generowanych przez sztuczną inteligencję.

Automatyczna ocena AI przez AI

Zgodnie z informacjami Meta, nowy model Self-Taught Evaluator został wytrenowany wyłącznie na danych generowanych przez inne modele sztucznej inteligencji, co eliminuje konieczność udziału człowieka w procesie szkolenia. To oznacza, że Meta dąży do stworzenia AI, która nie tylko jest w stanie uczyć się na własnych błędach, ale również niezależnie oceniać swoją pracę. Dwaj badacze z Meta, którzy stoją za tym projektem, wskazali, że model ten oferuje wgląd w przyszłość autonomicznych agentów AI, którzy mogą samodzielnie wykonywać skomplikowane zadania.

Technika „łańcucha myśli” rozbija skomplikowane problemy na logiczne kroki, co poprawia trafność odpowiedzi, zwłaszcza w dziedzinach takich jak nauka, kodowanie czy matematyka. Warto podkreślić, że to właśnie precyzyjna ocena wyników sztucznej inteligencji była dotąd jednym z największych wyzwań, wymagającym zaawansowanego nadzoru ze strony ludzi.

Koniec z tradycyjnym uczeniem maszynowym?

Wprowadzenie Self-Taught Evaluator może znacząco wpłynąć na obszar uczenia maszynowego. Obecnie rozwój modeli AI często opiera się na technice zwanej uczeniem się wzmacniającym z ludzkiej informacji zwrotnej (Reinforcement Learning from Human Feedback – RLHF), co wymaga kosztownego i czasochłonnego zaangażowania ludzi do adnotacji danych i weryfikacji poprawności odpowiedzi AI. Dzięki nowemu modelowi Meta ten etap może zostać całkowicie zastąpiony autonomiczną pracą sztucznej inteligencji.

Jason Weston, jeden z badaczy Meta, podkreślił, że umiejętność samooceny przez AI jest kluczowa dla osiągnięcia poziomu sztucznej inteligencji, który przewyższa możliwości przeciętnego człowieka. „Pomysł bycia samoukiem i zdolność do samooceny są fundamentalne dla rozwoju nadludzkiej sztucznej inteligencji” – zaznaczył Weston.

Meta a konkurencja

Choć koncepcja oceny AI przez AI nie jest nowością, inne firmy, takie jak Google czy Anthropic, również prowadzą badania nad podobnymi technologiami, takimi jak Reinforcement Learning from AI Feedback (RLAIF). Jednak Meta wyróżnia się na tle konkurencji, ponieważ swoje modele udostępnia publicznie, podczas gdy inne firmy tego nie robią.

W ramach piątkowej premiery Meta zaprezentowała także inne narzędzia sztucznej inteligencji. Znalazły się wśród nich m.in. aktualizacja modelu Segment Anything, który służy do identyfikacji obrazów, narzędzie do przyspieszania generowania odpowiedzi przez duże modele językowe (LLM) oraz nowe zestawy danych, które mogą być wykorzystane w badaniach nad odkrywaniem nowych materiałów nieorganicznych.

Udostępnij