반응형
Development Environment - Colab Plus
Toolkit - ESPnet
TTS Model - Tactron2
dataset - KSS
본 글은 훈련이 완료된 모델을 활용하는 과정입니다.
ESPnet 설치 및 훈련 과정이 필요하다면 다음 글을 참고하세요.
Tacotron2 TTS 한국어 예제 실습 (KSS dataset) - (1)
기본 세팅
google drive connect
from google.colab import drive
drive.mount("/content/drive",force_remount=True)
패키지 설치
!pip install espnet_model_zoo
!pip install noisereduce
!pip install --upgrade parallel_wavegan==0.5.4
import
import soundfile as sf
from espnet2.bin.tts_inference import Text2Speech
모델 테스트
input_text = "나는 지금 타코트론 한국어 테스트를 진행하고 있습니다."
text2speech = Text2Speech.from_pretrained(model_file="[모델경로]")
speech = text2speech(input_text)["wav"]
sf.write("[저장할 경로.wav]", speech.numpy(), text2speech.fs, "PCM_16")
노이즈 제거
from scipy.io import wavfile
import noisereduce as nr
rate, data = wavfile.read("[wav파일 경로.wav]")
reduced_noise = nr.reduce_noise(y=data, sr=rate)
wavfile.write("[노이즈제거 저장할 경로.wav]", rate, reduced_noise)
참고자료
반응형
'Development > AI' 카테고리의 다른 글
Tacotron2 TTS 한국어 예제 실습 (KSS dataset) - (1) (0) | 2022.05.13 |
---|---|
자연어 처리(NLP) 개념 잡기 (3) - 정제, 정규화, 불용어 (0) | 2022.01.09 |
자연어 처리(NLP) 개념 잡기 (2) - 표제어, 어간 (0) | 2022.01.08 |
자연어 처리(NLP) 개념 잡기 (1) - 말뭉치, 토큰화 (0) | 2022.01.04 |
파이토치로 배우는 자연어 처리 - 리뷰 (0) | 2021.12.23 |