728x90
반응형
어린이 음성 데이터 내역
- 초등학생 1학년에서 6학년의 남녀가 발성한 총 22.387시간의 음성 데이터
- 총화자 300명 중 여성 149명, 남성 151명
- 화자당 평균 발성 회수 : 60~100 문장
- 총 발화 문장 : 25,369 문장
- 녹음 형태 : 16kHz 또는 8kHz, headerless 16bit Linear PCM Mono 데이터
- 녹음 환경 : 조용한 환경의 스마트폰
어린이 음성데이터 다운로드 URL
https://aihub.or.kr/opendata/keti-data/recognition-laguage/KETI-02-005
728x90
반응형
'음성인식' 카테고리의 다른 글
Conformer Architecture for ASR (0) | 2023.03.22 |
---|---|
음성인식 API 사용해 보기( 자막생성 포함) (1) | 2023.01.20 |
한국어 종단형 음성인식엔진( End-To-End Speech Recognition System for Korean Language) (0) | 2023.01.16 |
프랑스 국영열차(SNCF) 안내 방송 음원 (0) | 2022.01.23 |
VoiceFilter-Lite: Streaming Targeted Voice Separation for On-Device Speech Recognition : REVIEW (0) | 2022.01.21 |