Strumieniowy model speech-to-text OpenAI do transkrypcji w czasie rzeczywistym o niskiej latencji, dostępny przez Realtime transcription API.
Okno kontekstowe
16K tokens
tokenów
Max output
2000
tokenów
Dostęp:APIWdrożenie:☁ Cloud
Przegląd
Dostęp i wdrożenie
API
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 16K tokens
📥 Wejście: audio, tekst
Specyfikacja techniczna
Okno kontekstowe
16K tokens
tokenów
Max output tokens
2000
tokenów na odpowiedź
Knowledge cutoff
30 wrz 2024
Data graniczna wiedzy
Modalności
⬇ Wejście (Input)
audiotext
⬆ Wyjście (Output)
text
Możliwości i zastosowania
Natywne możliwości modelu
Transkrypcja strumieniowa
Konwersja mowy na tekst w czasie rzeczywistym z natychmiastowym wyprowadzaniem wyników w trakcie trwania wypowiedzi.
Kategoria: speech
Architektura techniczna
Rdzeń architektury (Core Architecture)
