:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
마속 나무위키 문서 2.3. 가정의 패전 인용"그런데 여기서 마속은 제갈량의 명령을 무시하고 길목에 세워야 할 방어진지를 산 꼭대기에 세우는, 전쟁사상 다시 없을 바보짓을 한다.부장 왕평이 필사적으로 말렸지만 이마저도 무시해버린다."
20/06/03 11:52
말씀하신 기능을 Speach to Text 라고 합니다.
받아쓰기죠. 외국어라면 Machine Translation (기계 번역) 까지 돌리면 됩니다. 그런데 구글 번역기 돌려보시면 아시겠지만... 사람이 한 것 처럼 깔끔하게는 안됩니다. 동네마다 사람마다 억양과 발음이 달라서요
20/06/03 11:56
분량이 올마나 되는지는 모르겠지만
https://cloud.google.com/speech-to-text?hl=ko 구글 음성인식기 api 입니다. 무료로 사용할 수 있는 부분도 있는 것 같아요. STT 고 MT 고 도메인 한정할수록 성능이 높아지는데, 제너럴 도메인에서 성능 제일 잘 내고 있는 것 중 하나는 단연 구글이죠
20/06/03 12:17
(수정됨) 국산 프로그램 vrew가 쓰기 편하고 무난합니다. 아예 텍스트파일로만 저장 가능하고 자막파일로도 가능하고 무료입니다.
그런데 발화자의 발음이나 속도 등등에 따라서 당연히 정확도는 천차만별입니다. 문장 부호도 지원 안 되고 ^^;; 정확한 작업을 위해서는 보통은 vrew로 추출하고 다시 영상 보면서 추출된 텍스트 수정하고 띄어쓰기 수정하고 텍스트 완성한 후 다시 싱크를 찍는 작업이 필요합니다만 예전에 쌩으로 들으면서 타이핑하는 것보다는 수월하긴 합니다. 물론 발화자의 상태에 따라서 그냥 쌩으로 하는 게 속도가 빠를 때도 있습니다. 예전에는 60분 이상 되는 영상들은 종종 오류나고 그랬는데 요즘은 100분 근처까지 문제 없이 잘 되더군요.
20/06/03 12:52
딱 말씀하신 그런 기능을 제공하는 프로그램이 vrew입니다. AI 수준에 대한 기대치는 각자 다르다고 하더라도 전체적인 방향은 일치하네요.,
|