无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

tacotron2/vits單人-無臺詞音頻處理成數(shù)據(jù)集-工具包

2023-02-11 22:18 作者:夏夜有輕風  | 我要投稿

封面:小藍鳥@iktd13_

前言

前段時間剪音頻,基于whisper-vits的腳本寫了個筆記本自用,外面套了slicer2和demucs。現(xiàn)在整理成了可以發(fā)布的樣子,相當于用一些沒有臺詞的音頻文件制作tacotron2/vits單人的訓練數(shù)據(jù)集的在線GUI,可以把音頻按臺詞切成片,當然你也可以拿來活字印刷或者機翻字幕等等。已經過一定測試,但不排除還有一些問題,歡迎反饋。

筆記本鏈接:https://colab.research.google.com/drive/1oM3HuRdGtONgpNNTredRCYeG_JrdF1be?usp=sharing

whisper-vits庫作者視頻:


使用說明

1. 把要處理的音頻打包成壓縮包上傳到云端硬盤

2. “在云端硬盤中保存一份副本”


復制一份到自己的云端硬盤

3. 一路按播放鍵向下執(zhí)行,解壓部分填剛才上傳的壓縮包的路徑

解壓

4. 可選擇使用 demucs 去除背景雜音

demucs 分離人聲

5. 可選擇 slicer2 按音頻中間的空白片段分割音頻

slicer2分割音頻

6. 選擇whisper轉寫方式:

填1 - whisper直接轉寫

填2 - whisper轉寫后調用whisper-vits庫,按臺詞進一步分割音頻

選擇whisper轉寫方式

7. 開始whisper轉寫

whisper轉寫

8. 轉寫完成后導出保存到云盤

制作完成,保存到云盤

補充說明

1. demucs和slicer2可以自由選擇,demucs默認放在前面以求slicer2分得更細

2. slicer2不是AI,是算法分割音頻

3. 清除緩存會重置對應步驟產生的影響,但會刪除對應步驟產生的數(shù)據(jù),謹慎操作

4. 默認勾選 wv_show_log 以便于排錯,如果覺得輸出的東西太影響視野可以勾掉,還你一個清爽的界面

5. 如果執(zhí)行過程中出現(xiàn)一時解決不了的錯誤想要保留中間產物,或者demucs分離人聲后想要保留背景音,可以在導出時在 wv_export_way 填2,將過程中產生的所有文件打包保存到云盤

6.?whisper轉寫有一定出錯概率,能找到原臺詞一般還是原臺詞更好

tacotron2/vits單人-無臺詞音頻處理成數(shù)據(jù)集-工具包的評論 (共 條)

分享到微博請遵守國家法律
四会市| 深泽县| 凉城县| 报价| 宜兴市| 军事| 浙江省| 醴陵市| 剑川县| 霍邱县| 盱眙县| 洪泽县| 陆川县| 郸城县| 游戏| 永川市| 嵊州市| 镶黄旗| 南平市| 贺兰县| 岑巩县| 平南县| 扎赉特旗| 阳西县| 黑水县| 郑州市| 宿州市| 绥棱县| 乌鲁木齐县| 界首市| 高安市| 望奎县| 福贡县| 衡阳县| 德格县| 法库县| 庆安县| 博爱县| 宜昌市| 巩留县| 子长县|