Firma DeepL wprowadza kolejne innowacyjne rozwiązanie: DeepL Voice. To narzędzie, oparte na sztucznej inteligencji, umożliwia tłumaczenie rozmów w czasie rzeczywistym i wyświetlanie ich w formie tekstowej.
DeepL Voice obsługuje kilkanaście języków, w tym angielski, polski, niemiecki, japoński i hiszpański. Rozwiązanie ma być szczególnie przydatne podczas wideokonferencji i spotkań międzynarodowych. Narzędzie działa w prosty sposób: smartfon umieszczony pomiędzy uczestnikami rozmowy wyświetla tłumaczenie na ekranie w formie lustrzanego odbicia, co pozwala każdemu z rozmówców czytać tekst w swoim języku.
Na obecnym etapie DeepL Voice konwertuje głos jedynie na tekst, bez generowania tłumaczonego dźwięku. Firma zapowiada jednak, że funkcja audio pojawi się w przyszłości. Brak API oraz ograniczona dostępność sugerują, że narzędzie jest jeszcze w fazie rozwoju, z ukierunkowaniem na partnerów biznesowych.
DeepL Voice to pierwszy krok firmy w stronę tłumaczeń mowy, a zarazem zapowiedź dalszego rozwoju technologii głosowych. Premiera dla szerszej publiczności może nastąpić w ciągu najbliższego roku, co może wyznaczyć nowe standardy w dziedzinie tłumaczeń w czasie rzeczywistym.