STT

높은 정확도로 한국어 오디오를 텍스트로 변환

개요

STT(Speech-to-Text)는 한국어에 최적화된 고정확도 음성 인식 서비스입니다. 전사 서비스, 음성 명령, 회의록 작성, 접근성 기능 구현에 완벽한 솔루션입니다.

높은 정확도

한국어 음성 95%+ 정확도

다국어 지원

한국어 및 영어 지원

상세한 결과

단어별 타임스탬프 및 신뢰도

API 엔드포인트

POST https://agitvxptajouhvoatxio.supabase.co/functions/v1/stt-transcribe-v1

필수 헤더

Content-Type: application/json
X-API-Key: {YOUR_API_KEY}

내 API 키 확인

요청 파라미터

파라미터	타입	설명	필수
audioUrl	string	변환할 오디오 파일 URL	✓ (둘 중 하나)
audioData	string	Base64 인코딩된 오디오 데이터	✓ (둘 중 하나)
lang	string	언어 코드 (기본값: "ko")	-

💡 참고: audio_url 또는 audio_data 중 하나만 제공해야 합니다.

응답 형식

성공 응답

Success Response

{
  "jobId": "550e8400-e29b-41d4-a716-446655440000",
  "transcript": "안녕하세요, 이것은 음성 인식 테스트입니다.",
  "confidence": 0.95,
  "words": [
    {
      "word": "안녕하세요",
      "startTime": 0.0,
      "endTime": 0.8,
      "confidence": 0.98
    },
    {
      "word": "이것은",
      "startTime": 0.9,
      "endTime": 1.3,
      "confidence": 0.96
    }
  ],
  "processingTimeMs": 1523
}

오류 응답

Error Response

{
  "error": "Audio format not supported",
  "details": "Please use MP3, WAV, AAC, M4A, or FLAC format"
}

지원 포맷 및 제한사항

지원되는 오디오 포맷

MP3

WAV

AAC

M4A

FLAC

입력 방법

오디오 URL

공개적으로 접근 가능한 오디오 파일 URL 제공

{
  "audioUrl": "https://example.com/audio.mp3"
}

Base64 데이터

오디오 파일을 base64로 인코딩하여 업로드

{
  "audioData": "UklGRnoGAABXQVZFZm10..."
}

제한사항

• 최대 파일 크기: 50MB
• 지원 언어: 한국어 (ko), 영어 (en)
• 게스트 사용자: 최대 30초

코드 예제

다양한 프로그래밍 언어로 STT API를 호출하는 예시입니다. 탭을 클릭하여 언어를 전환하세요.

const response = await fetch(
  'https://agitvxptajouhvoatxio.supabase.co/functions/v1/stt-transcribe-v1',
  {
    method: 'POST',
    headers: {
      'Content-Type': 'application/json',
      'X-API-Key': '{YOUR_API_KEY}'
    },
    body: JSON.stringify({
      audioUrl: 'https://example.com/audio.mp3',
      lang: 'ko'
    })
  }
);

const data = await response.json();
console.log('Transcript:', data.transcript);
console.log('Confidence:', data.confidence);

오디오 전사를 시작하세요!

API 키를 발급받고 음성을 텍스트로 변환하세요.