카테고리 없음

음성기본과정 - 1,2차시 정리

린다여사 2022. 11. 23. 08:55

개인정보 - 비식별화 정제작업 필요 개인정보유출 방지

 

정제작업과정

원시 음성 데이터 다운로드 - 정제작업 - 관리 FTP에 결과물 등록

원시데이터 - 직접수집 or 녹음된 데이터 받아서 작업

 

전사단계에서도 비식별화 가능

녹음된 음성파일도 저작권동의 받아야함

 

정제한 전사전에 데이터 - 원천데이터

 

정제규칙

배경잡음 삭제

말 겹침 삭제 - 

음성 공백 삭제 - 공백 5초이내 남기고 삭제

발화 사이 공백 추가 - 화자바뀌는 구간 공백이 너무 없는 경우 2초내외 공백생성

자연스럽지 않은 대화 

말겹침 - 정제로 문자 미완성경우 앞뒤문장 활용해 문장완성

자연스럽지않은 문장 

기타 - 일부구간을 개인판단으로 건너뛰지않기, 

       - 가급적 재생 시간 손실을 최소한하는 방향

 

메타데이터 - 구조화된 다른 데이터

 

오다시티 프로그램 이용

파일가져오기 - 오디오 선택 - 파일선택 - 파형상하 늘려주기

 

단축키

스페이스바 : 재생 / 정지

P : 재생 / 일시정지

ctrl + A 전체선택

ctrl + Z 실행취소

ctrl + Y 재실행

ctrl + K 구간삭제

ctrl + 마우스휠 화면확대 축소

shift + 마우스휠 화면좌우이동

Del 구간삭제

Backspace 구간삭제

 

음성변조 - 높은음으로 변조되는 과정가능 (시사프로그램 뉴스등)

 

샘플링 또는 인코딩 값 변경 저장

파일 - 내보내기 wav로 내보내기- 인코팅 파일형식확인 

 

실제발음과 다르더라도 표준어표기 기준으로 전사

받침없는 명사+종결어미 결합하여 축약된 발음이들려도 명사를 살려서 전사

축약된 발성은 축약되어 소리나는 대로 전사