OpenAI ulepszyło tryb głosowy ChatGPT

OpenAI wprowadziło zaktualizowaną wersję swojego trybu głosowego ChatGPT, poprawiając ekspresyjność i naturalność mowy. Nowy tryb, nazwany Advanced Voice, został udostępniony w weekend i zapewnia teraz bardziej subtelną intonację, odpowiednie pauzy, akcenty i emocjonalne zabarwienie fraz, w tym sarkazm i empatię.

Jedną z kluczowych innowacji jest tryb ciągłego tłumaczenia. Użytkownik może po prostu poprosić ChatGPT o przetłumaczenie mowy, a model będzie kontynuował tłumaczenie, dopóki nie otrzyma polecenia zatrzymania lub przełączenia na inny język. Sprawia to, że tryb głosowy jest bardziej wszechstronnym narzędziem w komunikacji.

Funkcja jest dostępna na wszystkich urządzeniach i platformach, ale tylko dla użytkowników z płatną subskrypcją. OpenAI nie ograniczyło aktualizacji według regionu – możliwości głosowe są ulepszane globalnie. Nowa wersja zachowuje wsparcie dla dialogowego formatu komunikacji i szybką reakcję na żądania głosowe.

Jednocześnie firma ostrzega, że w zaktualizowanym trybie można zaobserwować drobne odchylenia techniczne. Możliwe problemy obejmują nieoczekiwane zmiany intonacji i wysokości dźwięku oraz sporadyczne usterki odtwarzania. Niektóre „halucynacje” trybu głosowego, w tym bezsensowne frazy i muzyka w tle, nie zostały jeszcze rozwiązane.

Konwersacyjny tryb głosowy ChatGPT został uruchomiony jesienią 2023 roku i od tego czasu jest aktywnie rozwijany. Nowa wersja, według OpenAI, przybliża model do bardziej żywej i kontekstowej interakcji z użytkownikiem. Ulepszenia są szczególnie zauważalne w przypadku dłuższych rozmów i pracy tłumaczeniowej.

OpenAI nadal dostosowuje funkcje głosowe do szerszych zadań. W przyszłości firma planuje wprowadzić nowe modele głosowe i poprawić reakcję na złożone emocje w mowie.

Czy ta wiadomość była interesująca?

👍
0
👎
0