STT
높은 정확도로 한국어 오디오를 텍스트로 변환
개요
STT(Speech-to-Text)는 한국어에 최적화된 고정확도 음성 인식 서비스입니다. 전사 서비스, 음성 명령, 회의록 작성, 접근성 기능 구현에 완벽한 솔루션입니다.
높은 정확도
한국어 음성 95%+ 정확도
다국어 지원
한국어 및 영어 지원
상세한 결과
단어별 타임스탬프 및 신뢰도
API 엔드포인트
POST https://agitvxptajouhvoatxio.supabase.co/functions/v1/stt-transcribe-v1
요청 파라미터
| 파라미터 | 타입 | 설명 | 필수 |
|---|---|---|---|
| audioUrl | string | 변환할 오디오 파일 URL | ✓ (둘 중 하나) |
| audioData | string | Base64 인코딩된 오디오 데이터 | ✓ (둘 중 하나) |
| lang | string | 언어 코드 (기본값: "ko") |
💡 참고: audio_url 또는 audio_data 중 하나만 제공해야 합니다.
응답 형식
성공 응답
Success Response
{
"jobId": "550e8400-e29b-41d4-a716-446655440000",
"transcript": "안녕하세요, 이것은 음성 인식 테스트입니다.",
"confidence": 0.95,
"words": [
{
"word": "안녕하세요",
"startTime": 0.0,
"endTime": 0.8,
"confidence": 0.98
},
{
"word": "이것은",
"startTime": 0.9,
"endTime": 1.3,
"confidence": 0.96
}
],
"processingTimeMs": 1523
}오류 응답
Error Response
{
"error": "Audio format not supported",
"details": "Please use MP3, WAV, AAC, M4A, or FLAC format"
}지원 포맷 및 제한사항
지원되는 오디오 포맷
MP3
WAV
AAC
M4A
FLAC
입력 방법
오디오 URL
공개적으로 접근 가능한 오디오 파일 URL 제공
{
"audioUrl": "https://example.com/audio.mp3"
}Base64 데이터
오디오 파일을 base64로 인코딩하여 업로드
{
"audioData": "UklGRnoGAABXQVZFZm10..."
}제한사항
- • 최대 길이: 60분
- • 최대 파일 크기: 50MB
- • 지원 언어: 한국어 (ko), 영어 (en)
- • 게스트 사용자: 최대 30초
코드 예제
다양한 프로그래밍 언어로 STT API를 호출하는 예시입니다. 탭을 클릭하여 언어를 전환하세요.
TypeScript Example
const response = await fetch(
'https://agitvxptajouhvoatxio.supabase.co/functions/v1/stt-transcribe-v1',
{
method: 'POST',
headers: {
'Content-Type': 'application/json',
'X-API-Key': '{YOUR_API_KEY}'
},
body: JSON.stringify({
audioUrl: 'https://example.com/audio.mp3',
lang: 'ko'
})
}
);
const data = await response.json();
console.log('Transcript:', data.transcript);
console.log('Confidence:', data.confidence);