eulaAAAAAAAA.26.05.16

今天出去玩一天,但天气不是很好,所以我继续远程折腾端脑云肉便器🤔

之前撸了一个全自动ai翻唱的工作流,但我发现它貌似理解错了我的意思,我要的是将去混响后的混响、去和声之后的主唱和和声这三个音轨拿去做ai变声,它整成了另外三个,而我到某个生成的音频里面完全没有人声时才发现它没搞对(恼🤔

让它修正之后我还加上了权重配置api,调节ffmpeg最终合成时四段音轨的权重🤔我估计全自动ai翻唱能调节的也就这些力🤔现在它表现得还行,一首四分钟歌曲需要十分钟甚至⑨分钟来合成,这看起来很慢,但其实它包括多个工序,比如先得跑一遍伴奏提取(甚至还要跑tta),再跑一遍人声提取,从里面获取一个一个一个音轨然后做ai变声三回啊三回,至于最后合成部分就不花多少时间力🤔

现在看来seed-vc生成的玩意质量实在是不怎么样,比如同时使用waifuhida音源,rvc或者更牢的sovits弄的waifuhida音源高低听起来像waifuhida,但这个跟gpt-sovits一样零样本的waifuhida听起来更像是某种赛博格waifuhida(全恼🤔问题是gpt-sovits的waifuhida听起来就人模狗样的,这玩意就不行,啊?🤔它们用的可是同一套声音样本啊🤔

whatever,这玩意就纯纯图一乐,真想用还是得切回rvc🤔

另外如果想学习如何整脱衣comfyui甚至直接找模型抄作业,最有可能或者最好的地方其实是成人论坛🤔我直到今天才想到这出,直接去我有会员的某个成人论坛,不到半小时我就将某个脱衣模型部署到了端脑云节点,,,🤔实测端脑云这个b玩意下百度网盘的速度是最快的,我光速对其进行了alist集成,接下来一件极其尴尬的事情发生力,它解压不动设了牢王论坛密码的那个7z包(撅望🤔我可能需要在本地下下来,改改workflow(至少我要把workflow里所有涉及“脱衣”的字样改掉或者删掉,免得gpt天天拒撅我干这个那个),然后再上传(悲🤔

发表评论