人工智能AI技术早已深入到人们生活的每一个角落,君不见AI孙燕姿的歌声此起彼伏,不绝于耳,但并不是每个人都拥有一块N卡,没有GPU的日子总是不好过的,但是没关系,山人有妙计,本次我们基于Google的Colab免费云端服务器来搭建深度学习环境,制作AI特朗普,让他高唱《国际歌》。
Colab(全名Colaboratory ),它是Google公司的一款基于云端的基础免费服务器产品,可以在B端,也就是浏览器里面编写和执行Python代码,非常方便,贴心的是,Colab可以给用户分配免费的GPU进行使用,对于没有N卡的朋友来说,这已经远远超出了业界良心的范畴,简直就是在做慈善事业。
配置Colab
Colab是基于Google云盘的产品,我们可以将深度学习的Python脚本、训练好的模型、以及训练集等数据直接存放在云盘中,然后通过Colab执行即可。
接着安装Colab即可:
至此,云盘和Colab就关联好了,现在我们可以新建一个脚本文件my_sovits.ipynb文件,键入代码:
随后,按快捷键 ctrl + 回车,即可运行代码:
这里需要注意的是,Colab使用的是基于Jupyter Notebook的ipynb格式的Python代码。
Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。
随后设置一下显卡类型:
接着运行命令,查看GPU
程序返回:
这里建议选择Tesla T4的显卡类型,性能更突出。
至此Colab就配置好了。
配置So-vits
下面我们配置so-vits环境,可以通过pip命令安装一些基础依赖:
注意jupyter语言是通过叹号来运行命令。
注意,由于不是本地环境,有的时候colab会提醒:
此时numpy库需要重启runtime才可以导入操作。
重启runtime后,需要再重新安装一次,直到系统提示依赖已经存在:
随后,克隆so-vits项目,并且安装项目的依赖:
安装好依赖之后,定义一些前置工具方法:
这些方法可以帮助我们下载、解压和加载模型。
接着将特朗普的音色模型和配置文件进行下载,下载地址是:
随后模型文件放到项目的models文件夹,配置文件则放入config文件夹。
接着将需要转换的歌曲上传到和项目平行的目录中。
运行代码:
此时系统会自动在根目录,也就是content下寻找音乐文件,包含但不限于wav、flac、mp3等等,随后根据下载的模型进行推理,推理之前会自动对文件进行背景音分离以及降噪和切片等操作。
推理结束之后,会自动播放转换后的歌曲。
如果是刚开始使用Colab,默认分配的显存是15G左右,完全可以胜任大多数训练和推理任务,但是如果经常用它挂机运算,能分配到的显卡配置就会渐进式地降低,如果需要长时间并且相对稳定的GPU资源,还是需要付费订阅Colab pro服务,另外Google云盘的免费使用空间也是15G,如果模型下多了,导致云盘空间不足,运行代码也会报错,所以最好定期清理Google云盘,以此保证深度学习任务的正常运行。