obsidian

批量处理VoxCeleb数据集
本文内容默认读者已经下载完成VoxCeleb数据集。本文默认的操作系统环境为Ubuntu18.04。下载VoxCe...
扫描右侧二维码阅读全文
03
2021/11

批量处理VoxCeleb数据集

本文内容默认读者已经下载完成VoxCeleb数据集。

本文默认的操作系统环境为Ubuntu18.04。

下载VoxCeleb数据集

VoxCeleb数据集是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。该数据集有2个子集: VoxCeleb1 和 VoxCeleb2。

下载数据集需要去官网上下载,这里给出官网链接。

VoxCeleb1:https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

VoxCeleb2:https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox2.html

注意,下载这两个数据集需要以企业或者学校申请,需在指定时间内下载。

处理VoxCeleb数据集

用自己的数据路径替换YOUR_DATA_PATH,分别进行整理数据集与数据音频格式转换,点此获取数据处理代码

python dataprep.py --save_path YOUR_DATA_PATH --extract
python dataprep.py --save_path YOUR_DATA_PATH --convert

转换前需要在系统安装wgetffmpeg

安装wget

apt update
apt install wget
wget --version

安装ffmpeg3.x

apt update
apt install ffmpeg
ffmpeg -version

大功告成

经过漫长的等待坐牢,处理好的数据新鲜出炉,具体怎么用就看各位操作了。

本文作者:Author:     文章标题:批量处理VoxCeleb数据集
本文地址:https://www.alphalrx.cn/index.php/archives/186/     
版权说明:若无注明,本文皆为“LRX's Blog”原创,转载请保留文章出处。
Last modification:November 3rd, 2021 at 09:36 pm
给作者赏一杯奶茶吧!

Leave a Comment