Strumieniowy model speech-to-speech do tłumaczeń w czasie rzeczywistym, dostępny przez dedykowany endpoint Realtime translation OpenAI.
Okno kontekstowe
16K tokens
tokenów
Max output
2000
tokenów
Dostęp:APIWdrożenie:☁ Cloud
Przegląd
Dostęp i wdrożenie
API
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 16K tokens
📥 Wejście: audio
Specyfikacja techniczna
Okno kontekstowe
16K tokens
tokenów
Max output tokens
2000
tokenów na odpowiedź
Knowledge cutoff
30 wrz 2024
Data graniczna wiedzy
Modalności
⬇ Wejście (Input)
audio
⬆ Wyjście (Output)
audiotext
Możliwości i zastosowania
Natywne możliwości modelu
Tłumaczenie na żywo
Tłumaczenie mowy w czasie rzeczywistym między wieloma językami bez przerywania strumienia audio.
Kategoria: speech
Transkrypcja strumieniowa
Konwersja mowy na tekst w czasie rzeczywistym z natychmiastowym wyprowadzaniem wyników w trakcie trwania wypowiedzi.
Kategoria: speech
Architektura techniczna
Rdzeń architektury (Core Architecture)
