HTS 训练包

需要环境:Debain/Ubuntu/MacOS(自己找软件包)

首先安装环境

sudo apt install git csh libx11-dev cmake gcc g++ automake

x

x

clone文件夹,觉得慢可以用gitee的仓库。

git clone https://gitee.com/GloomyGhost/SinsyVoiceCreat.git

下载安装HTK

(先去 http://htk.eng.cam.ac.uk/register.shtml 注册)

他会把密码发到邮箱的:

x

sudo sh install_htk.sh

安装HTS API

cd hts_engine_API
./configure
make && sudo make install
cd ../

安装SPTK

cd SPTK
./configure
make && sudo make install
cd ../

安装HTS_for_HTK

cd HTS_for_HTK/htk
make clean
./configure
make && sudo make install
cd ../

然后打开hts-train-demo文件夹,打开data,替换相应文件
raw文件夹为音频文件,格式为:480000Hz Little Endian 跳过前2位
可以使用ffmpeg进行转换:

ffmpeg -i input.wav -f s16le -ar 48000 -acodec pcm_s16le output.raw

label/full放入音乐的完整label,可以用Sinsy导出

sinsy -x dic -m jp.htsvoice -w c -o output.lab -l infile.xml

-x 指定发音表所在文件夹
-m 指定任意一个htsvoice(不影响输出结果,必须指定一个htsvoice是bug)
-w 指定语言,j代表日语
label/mono指定的歌词和对应时间,元音和辅音要拆开来,时间一定要准确,否则影响音源合成效果
具体怎么写可以参照官方的例子

开始训练

x

cd HTS-train-demo
./configure --with-hts-search-path=../HTS_for_HTK/htk/HTKTools
make all
如果发生错误,执行:
perl scripts/Training.pl 当前的绝对路径/scripts/Config.pm

训练结果在voice文件夹里,大约8小时结束(6700k单核训练)













本作品
 
HTS (Sinsy)音源库训练方法采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。
基于 http://www.GloomyGhost.com/2018/08/16/htstrain.html上的作品创作。


赞赏