ChatGPT, znany ze swojej zdolności do prowadzenia zaawansowanych rozmów tekstowych, teraz może reagować na obrazy i komunikaty głosowe. Użytkownicy mogą prowadzić rozmowy z chatbotem bez konieczności wpisywania słów, co sprawia, że interakcja jest bardziej naturalna i intuicyjna. Dzięki temu użytkownicy mogą korzystać z ChatGPT w sposób podobny do korzystania z Asystenta Google, Siri czy Alexy.
Interakcja głosowa
Funkcja głosowa ChatGPT działa na zasadzie zadawania pytań głosowych, na które bot odpowiada tekstowo lub głosowo. OpenAI jest przekonane, że ChatGPT będzie w stanie udzielić lepszych odpowiedzi niż inne wirtualne asystenty. Dzięki technologii LLM Whisperer, OpenAI może przekształcać wiadomości głosowe na tekst, a nowy model powrotu z tekstu na mowę pozwala ChatGPT odpowiadać głosowo. Co więcej, głos ChatGPT brzmi bardzo ludzko, co obiecuje firma.
Interakcja wizualna
ChatGPT może teraz również interpretować obrazy, umożliwiając użytkownikom uzyskiwanie informacji na podstawie przesłanych zdjęć, co działa na zasadzie podobnej do Google Lens. OpenAI pracuje również nad integracją nowej wersji Dall-E z ChatGPT, aby umożliwić generowanie obrazów na podstawie tekstu.
Bezpieczeństwo i dostępność
OpenAI jest świadome potencjalnych zagrożeń związanych z nadużyciami AI i podjęło kroki, aby zapobiec naśladowaniu głosów znanych osób lub popełnieniu oszustw głosowych. Funkcje obrazu są ograniczone i nie są dostępne dla zdjęć przedstawiających ludzi. Początkowo nowe funkcje będą dostępne tylko dla płatnych użytkowników ChatGPT, z planami rozszerzenia dostępu w przyszłości.
Rozwój ChatGPT to przełom w dziedzinie interakcji człowieka z maszyną. OpenAI nieustannie dąży do tego, aby uczynić technologię AI bardziej dostępną i użyteczną, jednocześnie dbając o bezpieczeństwo i prywatność użytkowników. W erze, gdzie granice między człowiekiem a maszyną stają się coraz bardziej rozmyte, ChatGPT z pewnością będzie odgrywać kluczową rolę w kształtowaniu przyszłości komunikacji.