DeepL wprowadza tłumaczenie mowy w czasie rzeczywistym z AI

Firma DeepL wprowadza kolejne innowacyjne rozwiązanie: DeepL Voice. To narzędzie, oparte na sztucznej inteligencji, umożliwia tłumaczenie rozmów w czasie rzeczywistym i wyświetlanie ich w formie tekstowej.

DeepL Voice obsługuje kilkanaście języków, w tym angielski, polski, niemiecki, japoński i hiszpański. Rozwiązanie ma być szczególnie przydatne podczas wideokonferencji i spotkań międzynarodowych. Narzędzie działa w prosty sposób: smartfon umieszczony pomiędzy uczestnikami rozmowy wyświetla tłumaczenie na ekranie w formie lustrzanego odbicia, co pozwala każdemu z rozmówców czytać tekst w swoim języku.

Na obecnym etapie DeepL Voice konwertuje głos jedynie na tekst, bez generowania tłumaczonego dźwięku. Firma zapowiada jednak, że funkcja audio pojawi się w przyszłości. Brak API oraz ograniczona dostępność sugerują, że narzędzie jest jeszcze w fazie rozwoju, z ukierunkowaniem na partnerów biznesowych.

DeepL Voice to pierwszy krok firmy w stronę tłumaczeń mowy, a zarazem zapowiedź dalszego rozwoju technologii głosowych. Premiera dla szerszej publiczności może nastąpić w ciągu najbliższego roku, co może wyznaczyć nowe standardy w dziedzinie tłumaczeń w czasie rzeczywistym.