728x90
반응형
SKT에서 개발한 에이닷 서비스...
이미 안드로이드 앱을 설치해서 이용하고 있는데, 뜬금없이 아래 이미지를 포함하는 메일을 받게 되었습니다.
사용 경험에 대한 결론은
- 음성인식 성능은 화자(간)의 발성 형태나 목소리 크기에 아직은 영향을 받는 듯합니다.
- 요약 서비스의 성능은 괜찮은 것 같아요.. 예전의 중요문장을 고르는 것이 아닌, 새로운 요약 문장을 만드는 것 같습니다. 통화 내용 중, 시간 약속이 있으며, 달력이나 일정으로 export할 수 있도록 서식도 만들어줍니다.
- 음성합성은 조금 생소합니다. 생소한 것은 말투입니다. 존어체도 아니고, 예삿말투도 아니고..
며칠을 사용하다 보니, 히스토리가 쌓이고 통계정보가 보입니다.
요약문이 아주 마음에 듭니다. 통화의 요약문을 나중에 어떤 용도를 사용할지는 제 스스로도 의문입니다. 지금은 기술력에 대한 파악정도로..
실제 대화 내용은
- 가끔 화자 정보가 뒤바뀝니다. 내가 한 말인데, 상대편이 한 말로 나타납니다.(누가 먼저 '여보세요'라고 할까요?)
- 짧은 turn으로, 완전한 문장을 이루지 않을 때, 인식 품질이 떨어집니다.
- 같은 말(구)을 반복하는 인식결과가 빈번합니다.
통화 내용 중, 전화번호 언급이 있으면, 특별한 형태로 알려주고, 관련 기능도 제공합니다.
전화번호를 메모 등으로 기록할 수 없는 경우가 있는데, 이때 유용할 것 같습니다.
제대로 메모 되도록, 제 발성으로 또박또박 한 번 더 언급/발성하면 되겠죠...^^
728x90
반응형
'음성인식' 카테고리의 다른 글
음성인식 기능 - 출력 되는 정보 기준으로 (0) | 2023.10.20 |
---|---|
음성인식의 응용 분야 /feat LLM(Large Language Model) (0) | 2023.10.20 |
Pytorch 2.0 vs Tensorflow 사용량( 모델개수 측면) (0) | 2023.05.08 |
Conformer Architecture for ASR (0) | 2023.03.22 |
음성인식 API 사용해 보기( 자막생성 포함) (1) | 2023.01.20 |