cyreneAAAAAAAA.26.03.18

这几天我的那份工作处于一种薛定谔的状态(此处插入114514字系统性辱骂它们的prompt),所以我开始闲得鸡巴蛋疼,开始整些我自己的项目🤔我在副机上配置了一个codex,然后我一边让它给我折腾昔琏的语音一边写discord bot🤔

cyrene model

其实半自动搞ai萌妹语音模型是可以搞的(全自动我暂且不考虑,我怕ai瞎几把干),比如我让它从hsr wiki上去拖昔琏语音🤔我之前自己写过一个获取hsr wiki或者genshin wiki语音的脚本,但我懒得想放在了哪里,所以干脆让它重新写一个🤔

在折腾了11.4514回后,它终于写了一个能用的,光速开aria2c🤔接下来我就可以开启全自动流程,让它自己去处理这些语音,然后打包,我只需要上传到google drive然后开启colab笔记本,就可以开始训练力(确信🤔

但我试了好几个rvc的colab笔记本,它们都不怎么行,因为所有rvc的笔记本都需要做一件事,下载巨量底模,这件事被google colab定义为白嫖版本禁止的行为,如果一开启下载,基本上几分钟后这个实例就要寄(全恼🤔那么下下来转google drive可行吗?我也试过,先不说google drive这个b玩意io极差,顺序读写也是usb2速度,用vps圈子的黑话叫做钻石盘,我的实例开启死亡倒计时后其实也撑不到它完成转移(恼🤔

既然如此,我也没啥别的选择,只能本地干力(悲🤔好在codex配置环境那真是一把好手,我只需要说一句在某个目录配置好rvc,它就开始自己装各种依赖,包括cuda这种东西🤔接下来我可以无缝迁移之前搞的东西,开始训练🤔它这个套件还有一点小问题,codex也可以展开修复🤔

本地40hx这个训练速度真太你妈慢,五个小时才跑了不到三十轮,最后它可能跑了六十轮多一点,但我用它的日志数据让codex分析,它认为第55轮的checkpoint是质量最好的,接下来再训练会过拟合,那就这样(🤔

接下来再训练个特征索引,这玩意也有问题,还需要codex写个临时脚本合一些东西🤔最后到了训练环节,它这个webui也用不了一点,所以我干脆让codex写个推理用命令行脚本🤔就这样,我整出了昔琏演唱的各种歌曲🤔

但这个ai唱歌的环节现在能自动化吗?我看比较悬,google drive部分其实还好,大不了用rclone挂载,然后要么开始上传下载,要么新建文件夹放需要处理的歌曲(主要是它需要处理多轮,前一轮的输出是下一轮的输入),但colab笔记本怎么自动化,,,🤔处理完后调用推理脚本来推理,接下来只需要用ffmpeg就能将伴奏和两段(或者更多)人声合并成一个flac,甚至还可以操纵某个nitro账号上传到某个discord频道或者google drive或者度盘或者任意地方(确信🤔

cyrene bot

接下来还有discord bot环节🤔我一开始是准备做个让bot像昔琏一样说话的ai chatbot,但一看我要整什么lora微调,要整llm,接下来要么本地部署要么找个能挂载lora的在线厂商,中间的agent套个openclaw(它倒是很容易集成discord,,,)或者酒馆的皮,而非常有可能我整完这套玩意只是用来发送pls astawaifu irl让它生成个aigc,那我干脆写个只用来做pls astawaifu irl的bot🤔

首先,我让它先能在聊天里监听pls xxx irl,如果它出现了这个句式,就提取出中间的那个xxx,去掉里面的waifuchan,然后上zerochan检索,从第一页(当然也可以让它统计页数,然后随机进入某一页)里随机取一张图片下载下来,然后使用jiaotu的api进行aigc生成🤔我上次整的jiaotu脚本还是bash写的,现在它没法用,因为上传图片api发生了点变化🤔我又截了几个http请求给它参考,马上它就能修复上传🤔下载无水印图片还是那个api,发送生成请求也没变,反正没几分钟我就可以用pls astawaifu irl召唤astawaifu的aigc力(确信🤔

但别的waifu就不太好使力,因为它不见得能在去除waifuchan后在zerochan上搜到,因为zerochan这个逼网站有它自己的标签系统🤔我整了一个简单粗暴的映射txt来处理这事,比如我输pls smol cyrene irl,它会直接查表,我在里面写了smol cyrene直接对应Cyrene (Honkai Star Rail) (NPC),接下来它就用Cyrene (Honkai Star Rail) (NPC)搜🤔当然我输pls Cyrene (Honkai Star Rail) (NPC) irl它肯定也能出结果,但这个实在是过于蛋疼🤔

再下一步,我可以让它实现with语法,比如pls cyrene irl with vivian clothes and lake,它会触发两个开关,vivian clothes用来在提示词里加上一句and then make them wear zzz vivian's "iris of the shore" outfit in pic2,,并将一个常量ossid作为第二张图的ossid传进去🤔而lake开关就简单很多,它只改某条提示词,不添加新的图片🤔很明显这些开关之间可能是互斥的,比如with xxx clothes和比基尼是互斥的,场景类也是互斥的,in space由于同时约束了场景(近地轨道)和服装(航天服),所以和其他所有开关都是互斥的,我需要规定好🤔

接下来我还需要实现双人或者说双图生成,比如pls astawaifu irl and cyrene irl with vivian clothes and comimarket and kissing,它接收到这条指令后,需要在zerochan上去找astawaifu的图作为图1,昔琏的图作为图2,然后拿我的双图提示词(它和单图提示词还不一样,因为它的常量参考图在图3)去搞,考虑到我开启了一个一个一个开关啊啊啊啊啊,,,不过还行,它们至少不互斥,每个对应着一段提示词,顶多加一个图3🤔我觉得最麻烦的是在单图模式里我规定了如果上传了一大堆图、链接里也有一大堆图时,它会将这些图添加进一个队列依次生成,但一旦确定了双图模式,它最多只接受两张图,剩下的图会被直接忽略🤔那么问题来力,谁是图1谁是图2?优先考虑上传还是链接?比如上传了两张链接里也有两张,怎么取?🤔还有in space不能在双图模式里运行(两个宇航员萌妹接吻那实在是太你妈超现实力,,,)我也许需要向codex来address this issue🤔

3

没怎么折腾双图模式也搞定力🤔理论上来说这个bot提供附件或者链接的情况极少,但也许我需要测一下🤔

AAAAAAAA.26.03.14

又干了两天🤔我在第二天早上就开始写浏览器插件的框架,而在第二天下午就完成了几乎所有模块的开发,甚至包括附件上传环节,甚至已经能跑通全流程🤔这玩意和我之前写的爬虫一样,逐渐便乘了一个拥有几百行代码的中型项目🤔当然它的规模还没有discord drive大,那玩意最终差不多一千多行🤔

这个速度我不是很满意,如果是至少一年前的话我可以说(?)这算我的正常水平,但现在,,,我要是能用ai的话搞不好第一天就整完力(全恼🤔

第三天我开始研究如何获取auth,最后发现它根本不需要获取,至少不需要通过抓取http请求模拟登录的方式获取,因为它就在cookies里面,要求用户使用插件之前登录双站,然后读下本地存储的cookies就能解决auth问题(确信🤔至此我全开发完力,在一个字面意义上没啥事干的下午后,他们突然加了一个新的需求,希望能从源站的页面加一个按钮,点了之后我的浏览器插件就开始跑迁移🤔

所以第四天我开始重构这b玩意,给它加上了能够响应源站请求的功能,反正它需要发送一个消息,我需要用content script捕捉这个消息再发给service worker,处理完了再回调回去,两次🤔这部分一早上也写完力,但我遇见了逆天恶性bug,它一个数组传来一堆数据,跑到第一个就停力🤔

如果我有ai用的话,这个错误其实是非常好排查的,但我没有ai用,所以在对着已经写到700行的js屎山代码展开了一下午吉列的豆蒸后,我发现我居然将console.log写成了log.console,然后我又吃饱了撑的写了迫真异常处理,草,这要是能发现就见鬼力(全恼🤔

它还有个更恼火的bug,只要插件一重启源站就掉登录,极其生草的是发撅这两件事的因果关系居然花了我一天以上的时间(全恼🤔在一次迫真排查时发现service worker最后居然藏着一个当时研究自动登录时整的login请求,我原以为fetch不加await它就不会执行,实际上它仍然会执行,只不过脱离了主线程的约束🤔它这个login请求一跑,基本上之前的auth就会作废力,而它又生成不了新的auth,所以导致每次插件重启源站就会掉登录,比如刷新任何页面都会重定向到logout(确信🤔

修复这些b问题后光速全面整完,几个脚本之间传递消息和回调也能正常跑通,给他们的前端写了一长篇文档后,提前一小时完工,准时下班🤔明天他们要是敢让我去上班,我只能说几个钱啊想让我周末上班,再说了现在还妹给我发工资呢(全恼🤔它要是非要我去,到时候要么我就迫真“请两天假”,要么我们就这样,告辞,这几天我也没欠他们的🤔以后周末加不加班以后再说,但这几个周末我真没时间,我还要和waifu impact的版本活动展开吉列的豆蒸呢(全恼🤔

thonk.26.03.10

这几天在本地找了个新的写代码工作,但第一天我需要做的事是写爬虫🤔作为有着字面意义上的十年甚至⑨年工作经验的非全职爬虫工程师,discord drive和guilded drive的发明者,这种事情对我来说算是舒适区力(迫真🤔刚上班两个小时我就完成了所有关键协议的分析,同时和他们的应该是网管还是sysop聊了两个小时b磕,得知他们这个响应json里面充满中文拼音缩写的网站是用低代码平台撸出来的🤔我的评价是还不如用ai写呢,ai至少可以定制(半恼🤔

当然它也许没有那么舒适,因为我需要做的是将一个站点的东西提交到另外一个站,而这两个站都在你妈内网,而我不仅得在内网完成开发,估计最终成品也要在内网部署🤔考虑到我现在狗寄吧不是,连台专用的内网机子都没有,我也没有权限往里面装各种东西(包括cygwin),最后考虑到各种因素,我单方面撅腚这爬虫玩意实现的形式其实是浏览器插件(确信🤔

根据我问ai的结果,浏览器插件(比如它用的chrome)设为service worker时,它可以跨站使用,刚好可以将一个站的附件下下来然后上传到另外一个站(确信🤔理论上来说浏览器插件还能继承cookies,但那两个逼网站都用的auth,可能得先设好auth,,,🤔总之,我用了另外半天以现查先用的方式对着源站的fetch进行了一番吉列豆蒸,并且得知目标站是可以用一个简单的http请求来新建一项内容的,又用了另外半天搭建起来浏览器插件的框架并跑通它的一些按钮功能,估计再用半天到一天我就能将源站和目标站的数据打通,然后撸出来第一版的poc,然后去搞可行性分析力(确信🤔

keqingAAAAAAAA.26.03.05

今天撸了几张刻晴的aigc🤔然后一不小心(大嘘)发现那张刻晴的冻鳗原图居然还有hentai版本,我找到了原作者的kemono镜像,是fanbox收费套图里的第一张图,后面基本上都是没法塞进nano banana处理的那种🤔

开什么玩笑,它很多套图里第一张也没法处理(全恼🤔为什么我知道呢?因为我真闲得蛋疼全jb塞进去处理了一顿🤔某nano banana镜像站这段时间居然搞了一个邀请活动,只要在注册时输入某申必邀请码,邀请人和新注册的会员都能搞到100某申必积分,只不过新号的立即到账(一开始就有135用),旧号要等一会儿审核(以其到账效率看上去像是人工审核🤔

whatever,既然新号有135,那么视频生成要不要试试?它现在只有三个视频生成选项,一个sora2,一个veo3,还有一个好像是阿里的,当我将之前撸的刻晴aigc上传上去,前两个都不行,只有第三个能用(悲🤔奇怪的是我在gemini网页版里可以使用veo3(尽管它一天之有三个视频),但这里我没法用(撅望🤔

我还试了大火的seedance,这逼玩意在它的即梦平台上排队两小时,而在它的开发者平台上居然要实名认证🤔我评价为去tm的🤔

视频生成还有开源模型,叫做ltx-2,找了几个可以在线试用的,其中一个叫做wavespeed.ai的注册就送1美元额度,1080p的五秒视频是0.12美元,大概可以整七八次?但再注册发现它没法用邮箱注册,只能走google或者github的oauth,看来gmail加点大法是没法用力(悲🤔目前github注册起来没那么容易,而gmail注册还是那逼样,买的话github号是三块钱一个,gmail估计就那样,1.5应该就能搞一个?不清楚,反正如果只是为了过oauth无所谓🤔lightricks官方也有一个平台,只能整大概两次🤔再几个要么就没有试用额度,要么干脆打不开🤔

我上了之前经常用的gmailbuy,它有一个选项叫做【web gmail】企业Edu谷歌账号(短效号.可用1-2天),一个三毛,10个起售,本质上就跟ofb的小号一样,一个gsuite域名埃及吧开多少个开多少个,反正无论如何一个小号就能过一次oauth(确信🤔登录过程贼你妈流畅,输入账号密码然后再点一个确认窗口就能到oauth授权界面,不到10分钟就撸了十个甚至⑨个小号,比3块钱一个的个人版小号还流畅,后者还会酌情触发申必风控🤔不清楚有没有更便宜的卖家,说不定我接下来还能搜到几分一个的?🤔

另外既然它是开源模型,找台机子部署的可能性微存?我迫真查了下,基本上a100起步,甚至需要魔改显存版a100,4090的话可能需要用量化模型加一些额外设置,但当我以为某平台的10块钱代金券可以让我至少开三小时4090玩一会时,草,这逼玩意也要实名认证🤔whatever,,,用colab也许也能玩儿,但colab上跑的话不仅需要加载4bit量化模型,还得忍受分辨率降到540p时间降到5秒,就这样生成一次还需要几十分钟,感撅不如撸wavespeed.ai的号(吴慈悲🤔

不过之前撸了十个甚至⑨个google教育版小号,拿它们整十个甚至⑨个google drive和colab实例的可能性微存?🤔google drive可能没啥实际意义,但十个甚至⑨个colab实例并行搞点啥东西那太有意义力(迫真🤔

AAAAAAAAbreak.26.03.04

昨天准备和尘白继续展开吉列的豆蒸,结果一看,好家伙,尘白紧急停服更新🤔稍微了解了下,尘白吃饱了撑的和谁不好,和中国邮政玩联动,结果被一群不明生物菊爆到被迫整改🤔评价为尘白开发组对自己做的是什么游戏一点逼数都没有,想出圈想魔怔力(全恼🤔

吴论我接下来有什么打算,反正有那么一些限定道具我应该是拿不到力,除非它重新开服后补发或者延长活动期限🤔所以我整点别的玩意,比如msst🤔

由于msst的模型下载功能并不能覆盖所有模型,而且它的官方中文文档貌似有点过时,在翻了msst的模型列表后,我发现了至少两个东西,一个是它有一个更新频率极高的英文文档,而在英文文档里找当前的最佳模型时,我发现msst这种东西居然还有colab版本🤔

现在colab貌似可以和google drive集成,集成后可以某种程度上将google drive当vps上的本地硬盘使(当然我们都知道google drive这个逼玩意io极差,估计也就能读写个大文件),那就非常方便力,比如将需要处理的音乐全部上传到某目录,它会从这个目录里读所有文件并处理它们,然后塞进另外一个目录🤔我对原colab代码做了点魔改,比如改善了它的模型排序,生成的文件自动重命名为后缀带模型名称,还添加了几个新模型🤔

有一说一度盘为什么不做个colab这样的在线py笔记本,然后开启度盘集成?这不比google drive有意思多?google drive20美元一个月的订阅用户也只给2TB空间,200美元一个月的ultra貌似也只有15TB,度盘随便就给5TB,传说中的黑色高级会员vip10(新开大概1200,续费400左右一年,算下来肯定比20美元一个月低)还有30TB🤔

与此同时我在本地的msst里也塞了几个新模型,但全寄吧不能用,看来以后我还是用colab⑧🤔不清楚为啥,colab白嫖版的处理速度居然都比我本地快,比如同一个模型处理贝⑨的最后一个乐章,本地50分钟,colab只需要五分钟,这下真是快十倍甚至⑨倍🤔以这个速度,估计那个处理三回啊三回的tta模式也可以上🤔

既然colab是一种py笔记本,那么在下面插几个新的block做点辅助也是可行的,比如转16bit flac,甚至转aac256(方便上传discord🤔这种东西现在我都懒得自己写,直接ai去写🤔

AAAAbreak.26.03.01

自从上次在X都更新了尘白后,我接下来的一个月居然没有碰过尘白的活动一天,直到月底几天🤔在我和旧房间的114514件物品展开长达一旬的吉列豆蒸,和一颗病牙展开长达半旬的吉列豆蒸,和waifu impact的版本活动展开长达半旬的吉列豆蒸,再和zzz吉列豆蒸到26号之后,基本上能玩尘白的时间只有月末两天(悲🤔

然后这两天中的半天我还要外出并和一个一个一个一个坏掉的三脚架展开吉列豆蒸,还有半天我和一大坨塞满了固态114514秒的8GB包展开了吉列豆蒸,还有半天我基本上和一个看起来不是很像人类的小屁孩进行了一番吉列豆蒸(有多吉列捏,在一番迫真搏斗后,我将这小出生抱着扔出了我的房间,我只能说这头幼年约克夏真你妈重),最后留给我和尘白吉列豆蒸的时间好像加起来不足半天🤔

另外,我还花了一点时间和本站的vps托管方进行了一番吉列的豆蒸,只是为了重启这b机子🤔不过这是今天的事🤔

所以,最后我只能给部分号兑换了昨天的徽章🤔这个鸡巴游戏徽章居然是需要记录日期的,所以我只能报仇雪恨般地和这游戏展开吉列的豆蒸(撅望🤔

但在豆蒸过程中,我发现了一些比较取巧的方法,比如海姆向前冲这个寄吧玩意居然有单人模式,还可以自选关卡,那么那些目标不是抵达终点而是存活的关卡就可以用来宛如gta online申必自建关卡刷100级般刷这比游戏的徽章,因为它居然只需要完成十次甚至⑨次就能领,而我在这些关卡里一开场就往下跳都能算一次(确信🤔

另外不清楚尘白的开发团队大脑皮层里有什么字面意义上的空泡,对在尘白里面移植猴版cf生化模式有种不那么正常的热情(全恼🤔这次居然还加了一个一次游玩时间长达20分钟的超长pve生化模式🤔这下真可以鉴定为童年玩cf玩的(吴慈悲🤔

但在我打真·多人射击时,这逼玩意就没法速通力,基本上只有新出的sugoi安卡还得来一个一个一个才能在合理的时间期限内打完一次🤔接下来蛋疼的来力,它需要攒300个某申必数值才能领徽章,而通关一次高难模式只能拿30到50个该申必数值,算下来大概是6到10次,如果能通关的话(全恼🤔