继端脑云自动创建实例并自动部署(尽管直到昨天才基本上摆脱了每次部署都需要个ai盯着)后,我今天搞定了半自动注册🤔现在让ai从头写一个注册机,ai通常来说是拒撅的,甚至连道德感极低的gemini都是拒撅的,这个拒撅甚至发生在向它提这个需求的前几秒(悲🤔
所以我尝试用另外一种方式完成它:在抓到注册相关har并让codex分析后,先让它写个用某邮件地址启动端脑云的发邮件流程的脚本,但验证码部分需要用户自己拖,就像jiaotu注册后的验证码环节(这部分撅大多数情况是自动运行的,除非注册得过于频繁才会刷出一个拖动的验证码界面)一样,它会打开一个浏览器窗口跑原版验证码js🤔对于jiaotu来说它获取两个申必字符串,而端脑云这边貌似更简单,它获取的是一个位置值,估计和服务器端对比差值在某个范围内就放行🤔感撅像是小学生学编程写出来的一样,,,这部分实现后就可以让它进一步写个用邮件地址(它当然是gmail)来获取验证码的部分,并为非gmail提供用户输入的fallback(我不觉得有人会用这个功能,但为了让它看起来不那么像全自动注册机,我还是迫真提了一嘴),这部分它用的是google app password(应该叫这名字)连接gmail的imap服务器找邮件,也能如预期找到验证码🤔接下来再让它完成剩余的注册网络请求,设置一个随机强密码,并在stdout里打出邮箱、密码和最重要的jwt token🤔就这样我完成了一个注册机(确信🤔
至此,(几乎)全自动端脑云音频api终于闭环起来力🤔现在去昔琏bot那儿改,加上了在塞往端脑云的邮箱地址里随机塞点(记得前几天我拷打gemini的问题吗,,,)本地记录用过的gmail变种从而避免重复但查邮件时去掉所有点的功能,我十成甚至⑨成确定codex没有意识到这意味着什么(这其实意味着一个gmail账号可以当作2的n次方个账号用,所以账号长度越长越好),它极其爽快地完成了这一任务,现在,我只需要输入一个没有任何变量的命令,它就能自动注册,自动创建实例并将其折腾成无卡(大嘘)模式,并自动部署脚本,基本上半小时后,我就多出了一台可以跑全自动萌妹模型训练和萌妹翻唱的节点,可以用大概800分钟,能训练大概一到两个waifu impact/hsr的萌妹(或猛男)rvc模型,推理可能几百首歌🤔
为了实现半小时撸一个节点的壮举,除去注册用的一两分钟和开实例需要的至少6分钟+排队等gpu时间,剩下的时间也就20分钟多些,我开始哼哼优化脚本🤔我先让codex整了个profiler,从里面分析出它有那么十几到二十多分钟浪费在和pip的吉列豆蒸上(悲🤔从而也说明我之前弄的度盘alist缓存不够,还得接着缓存,比如将那几个组件的pip环境也打包了下下来🤔在一顿加了aria2c的128线程也慢到只有3MB/s的下载速度后(我这边的下载速度就是它的上传速度,可见它这网络是真的垃圾啊,白瞎了什么32核128GB内存还有5090的机子,,,),我终于将这些包下了下来,重新上传度盘,召唤了一个实例进行部署,发现它这次卡了四五十分钟🤔一看里面有三个组件不对劲,按理来说它们都是海外版实例,为什么还是没法通用组件,我暂且蒙古🤔但它们也没多大,用pip嗯装也就一分钟到两分钟,那就每次都卸了重装就是🤔
加了这层保险后,再部署实例就非常丝滑力,连续部署了两三台都不需要外部ai干预🤔目前为了追求速度,我没有部署全api,音频api我分成了两个阶段,目前阶段只部署萌妹翻唱用的msst+rvc,seedvc和gpt-sovits我放在了第二阶段(反正seedvc质量也不行,而且更生草的是,在一顿雷霆训练之后,我现在rvc可用的撅色比seedvc高出一倍),而名为wiebitte的脱衣工作流可能算第三阶段?🤔至于更早的那些没鸡巴卵用的impaint脱衣工作流,现在我都懒得关心能不能部署,能不能用,,,🤔
接下来我发现了更加生草的玩意,它的海外版节点和国内版节点,尽管网络分析出它们十成甚至⑨成在同一个机房,用着同一个出口ip,但它们里面的系统组件完全不一样,连系统(docker镜像)都不一样,一个ubuntu一个debian,啊?🤔更别说它们py版本和别的乱七八糟的也都不一样,就巨坑,我得准备两套alist离线包,至少那些pip包得准备两套(全恼🤔不过自从某申必卖家将国内版端脑云的账号从六毛涨价到一块五后,我就懒得在国内版节点上测试任何东西力(吴慈悲🤔我一个gmail可以创建几千个号,成本基本上可以忽略不计(🤔况且我并没有整国内版的注册机,我要驱动国内版的节点需要粘贴全套token然后加一个--internal参数才能搞,单纯嫌烦🤔