今天zzz哼哼抽卡,结果歪了一个一个一个一个waifu11啊啊啊啊啊(全恼🤔
不过还好不是另外一个zzz waifutao或者喵酱命座(🤔而且更加尴尬的是,我发现吴论是astra还是waifu11,貌似都塞不进我当前队伍一点,那没事力(吴慈悲🤔
既然如此,我接下来要么慢慢抽看会不会像上次武器池那样发生奇迹(迫真),要么就这么跳过接下来至少三个卡池,直到它出以太异常或者复刻janedoe为止(确信🤔
ai antics
另外我这几天在哼哼研究各种变声ai🤔X都那台机子在一顿哼哼清理空间+ntfs压缩某个不怎么用的系统之后,居然腾出了100GB甚至⑨0GB的空间,我都不知道这玩意这么能腾🤔所以我到最后在上面部署了一个一个一个ai变声系统整合包啊啊啊啊啊🤔
它们分别是sovits4,svcfusion和gpt-sovits🤔接下来一个一个一个进行介绍(确信🤔
so-vits-svc
这玩意算是ai唱歌方面的金金金金金标准,特点是模型极难训练,需要准备至少半小时(一个半小时最佳啊啊啊啊啊)源人物的纯净语音,并且训练一万甚至⑨千轮🤔而且训练机器的显存还不能太低,what can i say? 40⑨0 out(大嘘🤔
我也许在玩牢大梗,但据我迫真了解,干这一行的都是a100起步,这玩意在autodl和蓝耘上大概五块钱一小时,蓝耘的迫真白嫖账号大概只能撸tm六小时,除去部署套件和语音文件的时间,可能就五小时多点(恼
所以我随便找了几个模型,我还发现23年末我曾经在度盘上保存了个模型大包(但那时阳台机子只有16GB内存,所以没得玩),都撸了进去🤔其中有什么waifuhida啊,waifurina啊,甚至还有waifutao🤔很不幸的是它们都是中文配音的模型,因为傻逼西方壬缺乏分享精神,干个事怕这怕那,前怕版权后怕声优不去罢工去罢你,不是哥们,你都开始玩ai变声力,还装什么良民(全恼🤔
推理倒是不要求太多显存,我那台1070ti可以随便推理,只不过需要将分片间隔设成15秒或者怎么,不然某些连着唱的歌曲可能会干爆显存(悲🤔在参数设置合适的情况下,我本地的推理速度大概是两倍到一坤倍速,一首五分钟的歌曲两分钟以内就能处理完(确信🤔
在我哼哼用waifuhida唱了三十多首歌之后,我发现这玩意没那么简单🤔一首歌想被ai变声,首先需要做人声伴奏分离,我以前试过各种黑色高级服务,但现在也许我一分钱都不想掏,但最主要的是我现在还在摸索这玩意怎么搞,所以它的教程里面让我装一款叫做uvr5的申必软件,也是ai人声伴奏分离但在本地运行🤔
这玩意做分离的时间居然比ai变声的时间还要长,撅大多数情况下连一倍速都没有(恼🤔而且分离质量也不怎么样,但勉强够用🤔人声还没法直接拿去ai变声,还要分离两遍,第一遍是分离和声,另外一遍是分离混响🤔我有时候懒或者没条件做(见下文),变声之后的人声听起来就非常奇怪,比如在该有的音高和低八度之间反复震荡,或者唱到一半突然去说另外一个人的台词🤔
在做完各种预处理之后,接下来就可以直接扔进去ai变声力,首先需要选择模型,选择配置文件,选择扩散模型等附属模型,还要往显卡里加载模型🤔之后才能上传人声,开始推理🤔推理后下载下来或者在套件目录的output子目录里找到生成的人声,然后还要和刚才分离出的伴奏进行合并,可能得调节下各音轨的声高(将伴奏轨降低若干个dB),此时就可以上一款叫做audition的经典软件,这玩意我贼jb熟(确信🤔我尝试过某些有伴奏版的歌曲加上推理后的人声,发现完全没法用,不仅相位有问题,可能时序也有问题,一眼顶针唱片厂商就是防着你直接反相伴奏或者原唱提取人声,所以我最后还是用uvr5分离后的伴奏参与合并(悲🤔
所以这套玩意的推理部分几乎刚需win系统,就是因为推理之后可以极其方便地塞进audition当场合并力(确信🤔而且这样还有一个好处,尤其是对我这种全程parsec操作的来说,一首歌曲从以discord附件的形式传进这台机子,到制成的作品上传到discord结束,全程我居然只需要一台机子,而非像在某台远程linux机子里推理那样需要整两台机子折腾来折腾去,还要操纵下命令行🤔
我这几天时间不是在外面就是在外面,甚至有那么两天连轴转,手头只有一台n5105笔记本可以当parsec终端用🤔经常是我想听waifuhida唱某首歌,我就用手机或者我的主力机上传那首歌到discord某频道,或者度盘,在那台机子上下下来,塞进uvr5开始分离(或者准备好已经分离好的文件,我去年不是整了一大堆这种东西吗),接下来开始推理,推理完塞进预先准备好的audition多轨会话,参数已经填好,就换一个一个音轨,再导出成flac,上传到discord,我这边用手机版discord下下来再用mix explorer传到某个音乐手机上,我就可以当场听起来(确信🤔这一切都在某辆上下震荡的汽车上进行,我甚至没有空间掏出鼠标,更别说分离各种和声然后分别处理后在audition里精修(全恼🤔所以如果waifuhida唱得像史一样,一半原因是waifuhida本来就唱得像史一样(毕竟吴论中文waifuhida还是英文waifuhida都极其的夹,用这种夹子声线训练出来的模型能好好唱就见了鬼),另外一半原因是我没条件精修(恼🤔
不过总体来说在我听了三天啊三天的waifuhida唱歌之后,我撅得这玩意听起来还不错🤔也许我换成英文waifutao的模型后说不定会更好听些?不清楚,毕竟我可没条件真的准备上waifutao一小时半的语音(首先你滴waifutao有那么多语音吗)开始哼哼训练(悲🤔而且就算我克服了1919810难准备好了一切,我也懒得折腾(吴慈悲🤔
svcfusion
这个套件和上面那个差不多,只不过它缝了四种甚至三种svc套件,将它们做进了一整套webui里面,这样就可以随便选择其中一个训练或者推理力🤔
不过这玩意的作者是个易语言中级高手,做的launcher exe在114514个地方都被当作病毒橄榄力,我掏出了接码平台开始雷普海马云🤔在浪费了三回啊三回三毛的验证码后,我发现这狗새끼好不容易验证手机通过后,居然需要批信或者某支付软件扫码,扫了之后还要验证那些玩意绑定的手机号🤔好家伙,它最终只认这个,用接码平台撸这些批玩意的账号(还要在上面整个绑定了的手机号)可实在是太寄吧难力,这破玩意不值得这种电诈团伙级别的大费周章,我投降(全恼🤔
所以我又想起了牢朋友(大嘘)海星云,好家伙,海星云接码那叫一个一个一个一个舒服啊啊啊啊啊,一毛的验证码就可以撸个,吴非是只能用两小时,但我只是想跑下这个自我意识过剩的易语言中级高手写的大作,然后扔掉易语言谢特重新打包回去而已(确信🤔它这exe界面做得和lea chan下垂的奶子一样难看,但至少它可以用来下本体和各种模型,我就不接着骂这狗새끼了(迫真🤔下完后我重新打包然后上传到度盘,下到我的阳台机子上,照着上一个套件那样写了一个迫真bat,执行它的主py文件,接下来发现它居然有一个检查授权环节,而且我在海星云机子上撸的授权文件居然没法用🤔但它这么折腾只是为了弹出一个对话框,在点击同意后卡了将近一分钟后生成了一个新的授权文件后,才开始运行webui🤔
好家伙,一个开源免费的ai套件居然整了一个需要机器码的授权系统,甚至可能还有十层甚至⑨层vmp,再加上它官网的迫真商业授权声明,这作者自我意识过剩到有点令人生理不适(全恼🤔而另外一方面,这狗玩意也别想部署到linux平台力,那里可没有承载我们的易语言中级高手心心念念的迫真授权对话框的地方(全恼🤔whatever,我应该不会拿它训练什么东西,所以这套玩意非常有可能被我雪藏到有一天我会因为腾空间之类的原因直接删掉(吴慈悲🤔
gpt-sovits
这一个一个一个ai套件里,这玩意才是真正滴神🤔因为不管它是用什么申必ai里技实现的,但它就是只需要一段10秒甚至⑨秒的语音,搭配它对应的文字,就能开始tts,而且按照它官网的说法,和原始语音⑨分甚至⑧分相似(确信🤔听说它还可以ai变声,但至少它的webui没这功能,不清楚首先py部分开发了没有(🤔
而吴论是waifu impact还是honkai waifu rail,最不缺的刚好就是这种高度结构化的语音数据(确信🤔比如打开一段剧情(包括限时活动剧情)的wiki页面,翻到对话部分,如果某个撅色有语音的话,台词左边就是对应的语音🤔或者图省事的话直接去某个撅色的voiceover页面随便扒一句也不是⑧行(确信🤔这些东西对sovits4来说好像时长不太够,但对gpt-sovits来说就刚刚好,反正它最多只要一句(确信🤔
所以我想办法在wiki里面找到了一些萌妹代表性的台词,然后开始拿它们推理各种生草文本,比如某著名toiletpasta,还有一个一个一个英式快递员笑话(也算半个blonde joke或者说leajoke,反正我这边leajoke几乎全都是blonde joke魔改的),还有一个我自己魔改的吃饭睡觉法克晴笑话🤔听起来哪怕这些英文声优开始用ai说中文(没错,这个ai的v2版本具有跨语言执法能力,可惜不会说德语),都非常有那些撅色的味儿,比如我第一次听到waifutao搁那儿说“吃饭睡觉法克晴”,感撅就和waifutao在向waifurina讲鬼故事时一样(严格点来说我输入的语音片段就是那段鬼故事的前三分之一部分🤔另外waifuque也非常有意思,astawaifu差点意思,可能是我选择的语音片段不怎么样🤔刻晴就非常的,,,刻晴,哪怕“我fuck我自己”时也毫无波兰,这下真的是整个璃月港的人都在法克晴,法克麻了(大嘘🤔
除了部署到本地n卡机器外,这玩意还能在一个叫做端脑云的平台上用🤔用法和本地的webui一毛一样,提供了几个音频片段但貌似不好使,所以最好自己上传音频和提供文字🤔推理后还可以保存每次推理的记录和成品音频(不清楚保存多久),价格貌似根据token算,反正我用了那么七八回只扣了不到1000cep,大概一块?但我和蓝耘一样买的是两块钱10000cep的试用账号,所以不到两毛?(确信🤔
它推理速度可能比开了多线程的1070ti慢些,但比单线程1070ti快(确信🤔每当我那边机子由于impact cuties而爆显存时,我就用端脑云的gpt-sovits玩🤔有一说一这玩意它都上了,那么为什么不上sovits4?(半恼🤔