Development/AI

Tacotron2 TTS 한국어 예제 실습 (KSS datasets) - (2)

고고마코드 2022. 5. 13. 16:27
반응형

Development Environment - Colab Plus
Toolkit - ESPnet
TTS Model - Tactron2
dataset - KSS

본 글은 훈련이 완료된 모델을 활용하는 과정입니다.

ESPnet 설치 및 훈련 과정이 필요하다면 다음 글을 참고하세요.

Tacotron2 TTS 한국어 예제 실습 (KSS dataset) - (1)


기본 세팅

google drive connect

from google.colab import drive
drive.mount("/content/drive",force_remount=True)

패키지 설치

!pip install espnet_model_zoo
!pip install noisereduce
!pip install --upgrade parallel_wavegan==0.5.4

import

import soundfile as sf
from espnet2.bin.tts_inference import Text2Speech

모델 테스트

input_text = "나는 지금 타코트론 한국어 테스트를 진행하고 있습니다."

text2speech = Text2Speech.from_pretrained(model_file="[모델경로]")

speech = text2speech(input_text)["wav"]
sf.write("[저장할 경로.wav]", speech.numpy(), text2speech.fs, "PCM_16")

노이즈 제거

from scipy.io import wavfile
import noisereduce as nr

rate, data = wavfile.read("[wav파일 경로.wav]")
reduced_noise = nr.reduce_noise(y=data, sr=rate)
wavfile.write("[노이즈제거 저장할 경로.wav]", rate, reduced_noise)

참고자료

  1. https://github.com/espnet/espnet/tree/master/egs2/kss/tts1

반응형