amdbitte.26.06.20

昨天做了一整天fileops,而在等fileops完成的过程中,我刷到了一个帖子讲如何白嫖amd的算力,我算是玩厌倦了端脑云,所以我试试amd的开发者平台🤔它领兑换券的地方和实际开实例的地方是完全分开的,一个需要用csdn账号登录,一个需要用github账号登录,就很蒙鼓🤔但熟悉了这个b设定后,一切貌似变得稍微好理解起来,它无非是在前者申请一个兑换券,一天最多可以兑换20小时(这什么雷霆设定),在不清楚等多长时间后得到一串申必数字,然后塞进后者,十成甚至⑨成像是豪猪的卡密兑换,尽管是不花钱的那种(确信🤔

它实例里装的显卡貌似是个7900xtx的同款gpu,显存48GB但不是hbm,它比5090好的地方貌似只有显存🤔它有114514个示例,其中有一个是用hermes agent驱动一个本机部署的qwen3.6小模型改代码,反正模型本身就在它的实例里,我就姑且演示一下🤔

反正它的演示case貌似可以跑,但那玩意才只需要改两行py代码,,,接下来让它部署个codex就很迷,死循环了半小时也搞不定(全恼🤔最后我手动将codex的参数整了进去才能用(悲🤔

为什么我需要往里面部署codex?当然是因为它那个内置模型没法将那台机子改造成云koitatu,它甚至都懒得试(🤔但codex的话,,,貌似也不怎么样,在一顿疯狂雷普后,它挖掘出了这玩意没法做云koitatu的真实原因:wine+dxvk一旦调用amd的gpu就会触发gpufense,这和端脑云的完全没有加载图形加速模块简直就是一对苦命鸳鸯(撅望🤔但端脑云那边至少到了可以串流wine desktop环节(尽管这一切都是用cpu计算的,本质上是套皮novnc),这b机子连这个环节都没到(全恼🤔

whatever,我现在对amd显卡跑llm突然产生了兴趣,比如在我主机的6900xt上跑一个?🤔接下来我发现主机的codex居然停留在一个非常牢的版本,也没有更新🤔可能牢版本codex没有自动更新选项,所以它就这样?反正这个版本并没有将会话和provider绑定,只要用codex resume,无论provider设成啥都能查到或者进入所有会话,所以我在后面才惊奇地发现新版本里会话和provider居然是绑定的?🤔但这牢版本也不是不能用,它在一番雷霆探索后发现diffgemma完全没法部署,因为它压根就找不到amd可以用的量化版本,但我至少可以部署那个huggingface上最你妈火的fable风味11b小模型,它量化完居然只有7GB,那就是它力🤔我让它解析出直链(hf解析直链要么需要梯子要么需要去镜像站,但解析后的链接就能随便下力)再去下模型,用aria2c下,实测速度能跑到800Mbps🤔看来我下次往端脑云部署模型的时候貌似也不用自己缓存一份🤔

顺便题一嘴,现在几乎所有的(普通硬件能够达到的,而非使用权重刻芯片里面的存算一体架构)最速tps传说,包括小米那个T级模型跑四位数tps的ultra方案,都使用的是4bit量化,,,🤔之前我们可能认为8bit量化精度比较好4bit不行,但现在的4bit是混合精度,一小部分比较关键的东西还是16bit甚至32bit,但别的都是4bit,,,另外一方面transformer架构的llm,它撅大多数时间都在等显存,那么量化位数越少它当然越快,hbm当然远优于gddr🤔但最重要的是,nv在50系之后有nvfp4这个优化数据结构,像diffgemma我用的就是nvfp4,反正就非常离谱,cherry studio显示的是五位数tps,不清楚真的假的🤔总之就是一句话,能开4bit量化就开4bit,剩下的显存空间开大上下文不香吗,顺便一提kv cache其实也可以量化,,,🤔当然小米那个实在是没什么学的意义,首先这是T级模型,就算4bit量化也有大概半个TB,至少得一个a100八卡集群才能放下,,,其次他们抛弃了开源llm推理框架自带的gpu计算方式开始自己写cuda算子,这个撅对不是一般人可以模仿的🤔

1145.14 secs later,,,

它整了一个人模狗样的api,塞进cherry studio里也能用🤔貌似它的runtime比我想象中的轻量很多,它只需要一个vulkan版本的llama.cpp(考虑到vulkan是非常通用的图形api,手机芯片搞不好也能跑),,,也不需要装什么rocm(我估计现在rocm应该也只有linux版),启动速度极快,几秒钟权重就加载到了显存里,然后就可以开启api力(确信🤔

但我本机还是别跑什么模型比较好,毕竟等我同时打开waifu impact、hsr和zzz时,可没有显存空间给某模型用,,,🤔

koitatu.slimed

我发现二号机上的koitatu居然还可以继续精简,比如它有一个50GB左右的mod大包看上去和我里面仅存的角色卡完全没关系,移除🤔此时加载某些卡片时会提示缺失某mod,将这些缺失的mod再从那个文件夹里补回来即可,也就多不到1GB(确信🤔接下来还有两个文件夹也可以移除,最终52.7GB🤔我接下来尝试用winrar压缩,实在是卡得要死,看来我得试试终极大法,acronis同款压缩算法,zstandard🤔

这个还是极其好使的,比如让codex写个一键脚本,只要将文件夹拖进去就能生存它的.tar.zst,或者反过来,将.tar.zst拖进去解压出文件夹,本质上是tar管道到zstd或者zstd管道到tar(确信🤔总之,它压缩成了一个38GB的大包,一个小时半后上传到了度盘,我看看它在顺网云那边需要下载+解压多长时间,,,🤔

cloudbitte.26.06.18

这几天我的主机动不动ff,所以我撅腚使用某个云电脑来打打尘白🤔首先它有一个叫做顺网云电脑的可以试试,它以前有什么一块五三个小时,现在美丽,现在只能一块钱两小时(悲🤔它的时长卡(无论是注册送的还是买的)都只能开一个4060节点,肯定没有6900xt好,但勉强能用(确信🤔

这玩意提供账号的方式也很有意思,它会提供两个文件,用它们替换顺网云电脑客户端里storage目录里的文件,再次重启后就可以登进去力🤔这个四舍五入相当于写入浏览器auth token(确信🤔登进去之后它貌似已经实名,直接开玩🤔它的客户端貌似没法开4k,此时下个uu远程,然后登进去,开启它的叫做超级屏的虚拟屏幕,然后就可以埃及吧开什么分辨率开什么,埃及吧上什么刷新率上什么(确信🤔

极其不幸的是,它的网络根本不支持今天下尘白玩,毕竟官方客户端居然只有10甚至⑨MB/s速度,,,这个速度下完它需要两小时差15分钟(全恼🤔而如果准备号安装包呢?它度盘下载速度高达(大嘘)370Mbps,那确实能在比如半小时还是20分钟来着下完,但我又没有准备,准备它需要我在二号机上下载再上传,现在那个b网络由于网线问题便乘了百兆,那算下来需要只是四小时才能完成下载上传,此时我已经回到家力(🤔

而如果让它做云koitatu呢?我现在二号机上用的精简版koitatu也有你妈110GB大小,用370Mbps一除,它光下载安装包就要40分钟,那么我就只有一小时多一点可以玩力(撅望🤔看来,它还需要继续精简,,,🤔

whatever,那这玩意就没啥卵用力🤔反正这种白嫖资源最大的问题其实是持续时间贼鸡巴短,端脑云也是这个问题,理论上说我是可以使用900分钟甚至800分钟的5090,但我往上面部署东西就要花好几个小时,以前音频api还好,那玩意流程已经非常成熟,只需要两个小时就能online,然后做训练也好做推理也好🤔但现在我又搞起了llm,部署开始四个小时起步,更何况部署完之后我还要经常修改代码,就很难绷🤔

bruhfei.26.06.15

今天仍然需要雷普zzz🤔就在我刚打完最后一个号的版本活动后,突然,我那台主机又掉线力(撅望🤔不清楚为啥,自从我去X州培训后,它只要掉线就意味着重启后主板状态码ff,这差不多只有一种解决方案:反复插拔cpu电源线,拔掉它后主板会断电然后几秒后重新上电,所以需要在它重新上电之前再将cpu电源线给插回去,这样来回几次后主板状态码才不会是ff🤔这玩意要是想远程操作的话可能需要在cpu供电插槽那里装一个esp32操控的继电器,然后它可以断电再通电,但这种东西我估计市面上没卖的,我要是用什么嘉立创做一个也不是什么一天能完成的🤔

既然我没法用主机,二号机上装个zzz又需要下载两三小时,最终我没有选择,只能用zzz cloud来玩剩下的那点东西🤔其实也没啥东西,就是邦布升级套件和一个称号没拿而已,直接用zzz cloud领了🤔它还有一个小活动,里面可以和vivian合影,很不幸的是我没法用4k合影,它这个zzz cloud最多也只有1080p(恼🤔

但无论如何,我总算在4点差几秒时打完了所有号的所有活动(包括我大号剩下的版本活动dlc环节,尽管那个dlc几乎啥都没给,但我就是打完了它),领完了所有能领的玩意,就这样🤔至于waifu impact和hsr肯定也只能用云游戏,我已经习惯力🤔

有一说一它为什么不考虑整个画质优先的云游戏版本,比如整个4k最高画质版,收费贵点也无所谓,尽管它现在这个1080p的版本也要你妈三块钱一小时🤔很多第三方云游戏服务可能在能开4k(waifu impact开4k其实要求非常低,2070就能跑,2060s甚至40hx也能勉强跑)的同时价格肯定比3块钱低,但官方云游戏除了可以按分钟收费(像我经常用来挂机领生日邮件的场景,最多也就20分钟出头)外,其实最方便的地方在账号凭据问题,用第三方云游戏导致ip到处飞会非常不方便🤔

不过如果是云koitatu的话,就没有账号问题力,,,它的问题反而是初始化过程巨长,而且根据第三方角色mod和插件的数量而变化🤔当然也可以通过使用某个固定的koitatu合集(比如某fisch上卖25还是50来着的不断更新合集)来解决,角色卡不用重启游戏才能加载,毕竟我的魔改角色卡是用它这个整合包里面的角色卡改的,,,🤔看哪个命硬的做个浏览器可以跑随时随地开撸的koitatu cloud玩玩🤔很不幸的是端脑云的肉便器没法改成游戏串流server,不然我早就去做力(撅望🤔

aiantics

这几天玩腻了音频api,开始往端脑云的肉便器上部署各种乱七八糟的模型🤔除了上次那个越狱版gemma外,这次还尝试了diffusiongemma,据说是用扩散模型的方法一次性生成几百token的玩法,能够在5090上跑几百token/s🤔但codex花了好几个小时都部署不明白,我现在可没有什么一块钱200个token美元的bugauth用(悲🤔我接下来甚至还有一个编程特化小模型等着部署呢,但那玩意应该简单些,至少它不是什么扩散模型🤔

另外gemini现在越来越北美豆包力,问个模型相关的问题,甚至在我明确让它开启联网搜索的情况下,它的回答里面居然还有qwen2.5这样的上古模型,啊?它不会联网搜索吗?🤔搞不好豆包现在都有可能比它强?毕竟豆包搞不好可以开联网搜索🤔我实在不成让codex或者我没用过的gemini cli去动用联网搜索工具找找吧🤔

现在端脑云肉便器都支持哪些东西?除了它自带的114514个我肯定不想用的comfyui模型和工作流外,它还有一个叫做wiebitte的申必api,这是图像处理api🤔然后有完整的msst/rvc/seedvc(尽管我整好rvc后就不再维护它力)音频工作流,llm有两个🤔还能整点啥东西,我实在不成将昔涟bot企业版部署上去?(迫真🤔

wiebitte

由于这几天疯狂雷普zzz,今天早上的课很明显没法上,更别说我甚至睡过了宾馆的早餐时间(悲🤔下午去教室迫真听课,它貌似在和一个长得像comfyui的玩意展开吉列的豆蒸,还好我不需要真的去从头开始拉线和写系统提示词,我只需要导入群里的某个申必json文件,给几个节点提供下知识库(应该是向量数据库),就能配置好rag交作业力(确信🤔它还可以导出成api,然后作业验收需要提供这个api的appid和登录凭据,牢师写了一个自动化测试py脚本,那玩意一看就是ai写的,不过这有什么奇怪的,教迫真ai的牢师自己不用ai那才叫奇怪🤔不过这个自动化测试的玩意不清楚为啥总是让我想起我还上大学的时候,我们的数据库牢师就是用自动化测试脚本来给数据库课程设计的成品进行评分的,它里面有一些奇怪的测试用例,如果数据库没设置某个约束的话铁出错🤔

whatever,由于这几天实在是没啥事,晚上我出去找地吃饭,尽管我现在花点小钱根本懒得看余额,但转了114514个饭馆总觉得它们没啥性价比,毕竟114514天之前我基本上只在家做饭,,,就在我绕着某师大转了一整圈之后,我发现它的西门旁边有一个天桥,上面全是人🤔上去一看,好家伙,原来师大的毕业生跳蚤市场在这儿🤔

我突然想起来力,16年前为了准备物理竞赛的实验环节曾经去师大做过大学物理实验,那时我们和师大的学生一样住对面的X天公寓,这个长几百米的天桥就能从西门直通到公寓,那时下面不是一个商业街而是一条河沟,现在看来它的部分地方被填埋,剩下的部分加上了水泥底,但水肯定是没有的,,,我去看看这些毕业生都在卖什么🤔

在1145.14秒的瞎几把逛后,我像以前那样买了一大堆没什么鸡巴卵用的东西,8块钱一个自拍杆手机支架二合一的玩意,15块钱一个某奶茶品牌联名的玩具相机,还有3块钱一本的看上去像是师大教授自己写的中文系教材,大学写作训练🤔里面的内容对于人类来说高低有点务虚力,但作为llm的系统提示词塞进去却刚刚好(sarcastic🤔等我回去将里面的某些章节扫描一下(现在扫描什么东西根本用不上扫描仪,直接随便拍一张或者几张照片然后随便找个vllm进行全文识别)编排进去,然后我那些部署在端脑云上的几十b小模型也许就可以去写小说力,,,🤔

但在我离开之前,我突然买了一个滑板,哪怕我之前完全没滑过这玩意🤔尝试滑了一段路程,给我累得够呛,最后还是租了辆电动车骑了回去🤔所以,我出门是要干什么来着?🤔

AAAAAAAA.26.06.14

这几天我都在疯狂雷普zzz🤔它这期的版本活动居然不是常驻,可还行🤔这游戏是不是涉及邦布的活动都不常驻?比如不知道多少期的邦布自走棋pvp?还有一系列送邦布的版本活动🤔

但这次它居然做了个超大型的邦布乐园,反正非常大,比传统意义上的marcel maze大十倍甚至⑨倍🤔里面塞的东西也有很多,甚至还能看到zzz世界里的部分名场景复刻(甚至包括某期邦布机甲活动的场景,,,这部分奇怪的是不在任何剧情线路里面,完全是个彩蛋类型的玩意),到那里时bgm也会换成对应场景的bgm🤔

全流程其实还是挺长的,战斗部分和上次邦布机甲差不多,除了加了一个e和终结技,但最有意思的是e除了可以cos几秒piperwaifu外还能格挡,只不过出于某种申必原因,它没有主游戏里的格挡稳定,如果是主游戏的话像第一个周本怪那样的怪物,角色应该能格挡掉所有攻击,但邦布貌似只能格挡掉第一次,后面几次不清楚为啥触发不了格挡,要嗯吃两到三次伤害(悲🤔此时反倒是闪避能够正常触发,就很难绷🤔

lisaAAAAAAAA.26.06.09

今天晚上他们组织了场考试,考的无非就是ai相关的玩意🤔当然我好像到今天也没有系统性地学习过ai相关玩意,以后也不大可能有机会系统性地学,也能随便考过,就是多选题貌似有点难做,,,🤔

whatever,我去搞点ai🤔当我可以一条命令开启20个端脑云节点,当我可以随便召唤四五百token美元的gpt auth时,我就有可能想干点大的,比如,,,往上面部署一个llm🤔前段时间排除了多卡并联的可能性,所以适合32GB显存(尽管它经常由于某种申必原因少那么一些)的5090部署的llm也就那些,不是qwen就是llama,但现在有一个新玩意,被号称是猴版gemini的gemma4,而5090完全可以放进去它那个31b dense,如果量点化的话(确信🤔我还能找到一个据说是uncensored的动态量化版本,现在挺流行这种量化方法的,号称只需要5bit甚至4bit空间就能媲美8bit,反正权重gguf只有16GB(🤔那就找个节点部署它⑧🤔

除此之外,我还想玩玩那个极其神奇的claude code game studio,很不幸的是我不用claude code或者claude模型(悲🤔所以我让codex将其移植到codex上便乘一个一个一个一个codex skill,这部分估计也是个中型工程,,,🤔移植完之后直接让它写个galgame,但我估计这玩意写hentai galgame的可能性不高,先不说别的,gpt image 2可不像nano banana pro一样可以生成奶子,,,🤔

wiebitte.26.06.08

昨天其实waifu impact的版本活动仍然没打完,除了大号外的剩下五个号还有剧情没过,到今天凌晨2点终于打完了所有剧情(悲🤔再随便干点什么就到了4点,然后早上8点半我要去X州参加培训🤔

我原计划是坐5点出发的某班绿皮火车去X州站然后再坐地铁去那儿,结果公司派了辆车,这样我好像还可以睡两小时,然后在车上补一小时🤔反正我是很难想象它是怎么不到40分钟就冲到了X州北高速出口,而在8点多一点就到了教室门口的,这叫什么,有自己的车就可以在高速上为所欲为?🤔

whatever,作为旁听人员,我好像不需要签到或者啥,理论上来说我不来好像也没啥问题🤔但这样高低有点过分,毕竟我不是一个人来🤔它这讲得毫无营养,给我整睡着力🤔我寻思它第一天放放水差不多得了,以后最好教点有用的东西,,,🤔其实它这个培训可能撅大多数环节是和某内网agent平台展开吉列的豆蒸,我寻思如果是这点屁事我好像也没什么必要非得去X州,而且一去就是十天甚至⑨天?不过反正宾馆不是我掏钱,,,🤔宾馆周围环境还算优越,对面就是教室,我从宾馆门口出发到教室居然只需要4分钟,而它楼下有个kfc,有个牛肉面馆,甚至还有个大型超市可以买点宾馆没有提供的生活用品,我反正没啥去别的地方的必要,,,🤔

与此同时我在整点ai玩意,比如在全自动注册端脑云的基础上,让昔涟bot开启x10或者x任意数量模式,和图片生成的xN不同,它需要在注册环节悠着点,比如图片验证得一个一个一个一个拖,拖完了得一个一个一个一个从gmail里轮询验证码(我估计这里如果乱序轮询肯定会出错),但注册完成后的步骤就可以并行搞力🤔不过现在我好像又失去了推理xx歌曲或者训练xx萌妹的兴趣🤔

而在没有人注意到的角落,某plus/team贩子居然在卖按照他的说法能一次性用200token美元的逆天auth,更逆天的是它的价格,居然只要1.9,而且在我没注意它的时候降价了三回啊三回,降到了1🤔这玩意确实挺能用的,实测10美元也就只消耗了百分之个位数,但出于某种原因,它的限额不是按5小时算的也不是按周算的,而是按月🤔可还行,这玩意十成甚至⑨成是什么试用,它不可能在一个月后续费,而实际情况下它也不大可能是月抛,更有可能是日抛甚至小时抛🤔这可真是难为我力,我反正找不到啥子办法一天用掉200个token美元,,,🤔要么我让它去写个galgame?或者写个koitatu插件?或者装个最近很鸡巴火的hermes agent哼哼雷普token?🤔

wiebitte

在短暂的缺货后,那个卖家直接将其降到了五毛,何意味啊🤔我现在多出400个可能几小时后就失效的token美元不知干什么好,,,🤔主要是端脑云这个傻逼玩意网络io如此之慢,不然我高低让codex往上面部署一大堆乱七八糟的模型上去🤔比如什么uncensored版deepseek,,,🤔

另外我发现之前跑rvc训练时的batch size貌似设得有点过于保守力,它开到40居然才占一半显存,我现在尝试探索它的上限,然后让它做一个真正的auto模式出来,,,

在一顿野兽探索后,它摸索出了这么一个一个表格:

batch size 峰值显存 相对基线增量 峰值剩余
4 6084 MiB 5577 MiB 26028 MiB
8 8167 MiB 7660 MiB 23945 MiB
12 9761 MiB 9254 MiB 22351 MiB
16 11507 MiB 11000 MiB 20605 MiB
20 13095 MiB 12588 MiB 19017 MiB
24 14721 MiB 14214 MiB 17391 MiB
28 16585 MiB 16078 MiB 15527 MiB
32 18081 MiB 17574 MiB 14031 MiB
36 19783 MiB 19276 MiB 12329 MiB
40 21461 MiB 20954 MiB 10651 MiB
batch size 结果 峰值显存 剩余显存
44 OK 23219 MiB 8893 MiB
48 OK 24909 MiB 7203 MiB
52 OK 26591 MiB 5521 MiB
56 OK 28205 MiB 3907 MiB
60 OK 29611 MiB 2501 MiB
64 OK 31319 MiB 793 MiB
66 OK,但极限 32023 MiB 89 MiB
68 OOM 32105 MiB 7 MiB

66或者68可以视为端脑云5090节点的极限,一个比较安全的值是52(确信🤔和我之前估计的14相比,这下真是多出了三倍啊三倍,,,🤔

AAAAAAAApaz.26.06.06

出于申必原因,我今天给我的好几个萌妹游戏撸了一大堆萌妹🤔我先尝试在hsr里抽waifuguang,30发歪了seele,然后再抽30发,好家伙,直接出waifuguang🤔有一说一我这个号确实最近好几次30发左右出,但连续两次30发出金那真是牛批🤔

接下来我还用掉了zzz上次充钱送的撅色兑换券,兑换了个jane和专武🤔而hsr那边我可是有一个一个一个撅色兑换券和一个一个一个武器兑换券啊啊啊啊啊,刚好兑换了我缺的三个萌妹和对应的专武,分别是robin,霍霍和waifupaz🤔它里面还有些别的选项,waifumei和专武我早就有,luocha既不如hsr barbruh又不如霍霍,可以当作不存在🤔

不过有一说一我一不小心凑齐了传说中的“医托纱鸟”追击队,,,很不幸的是这个队伍现在就是菜🤔而另外hsr现在我也发挥了我在waifu impact里的不拉撅色传统,在我兑换和抽了一大堆撅色后,我仍然保持1级的撅色已经达到了12个,,,🤔甚至连欢愉战舰我都懒得拉🤔

但今天最主要的事除了将之前几个号打完的版本活动领一遍东西再顺便清一下邮件外,我还需要给大号过过剧情🤔这部分看起来只需要花两小时多点,但我接下来还有五个号也需要过剧情,反正今天肯定是完不成力(悲🤔

luminethonk.26.06.04

这几天我的某vps用alipay续费没给我到账,我发了ticket它让我去找payssion(他们使用的支付中间商),我给payssion也发了邮件,他们很快回复我说是找到了那笔交易,得看看它的支付情况啥的🤔一天后我又去给vps那边的ticket发了跟进回复,到今天他们居然解决了这个问题,给我续上了费🤔这效率确实挺鸡巴慢的,从支付出错到恢复应该花了四天甚至三天,但至少给我赶在vps停机之前解决力,那我也没啥好说的🤔

不过这种类型的支付系统出错也没啥奇怪的,毕竟涉及到多个网站之间互相传消息,它总是有小概率自动不了,此时人工检查然后修复支付状态就van力(确信🤔不过至少我英文水平没沦落到这玩意也得靠gemini写,,,🤔

说到gemini,现在居然有人卖14块钱的gemini年度会员,啊?那我当年80买的算啥🤔这个价格真的比裸gmail账号贵不了多少,毕竟现在一个裸gmail账号也得六七块钱(恼🤔只需要再加一倍,就可以使用将近一年的黑色高级gemini pro,尽管我对gemini文字部分的使用量很难像去年用deepseek文游的时候直接干爆四五次上下文(gemini哪怕干爆上下文也只不过会忘掉之前写的东西而已,不会导致整个会话废掉),但如果我没有搞jiaotu那套玩意的话,我玩aigc不还得借助gemini webui,然后将昔琏bot做成自动操作浏览器,此时整多个gemini会员号也许就有用力(确信🤔现在不清楚怎样,但曾经nano banana pro一个gemini pro号一天也就三十多次,ultra貌似多一点点但也没多多少,那时某宝上有一个卖gemini共享会员的(我不知道写没写过,应该写过⑧),它最你妈逆天的是每天100次请求是只要发起请求就扣次数,无论请求是否成功,无论是什么类型的请求(哪怕发个output exactly: ojbk也扣🤔

而gemini的写代码功能基本上处于一个一个一个一个没什么人用的状态啊啊啊啊啊,哪怕deepseek都有人专门给它开发agent,但我就没有听说有人ever用过gemini cli做严肃的ai软件工程,可以说是沦落到和豆包还有grok坐一桌力(悲🤔所以最后你会发现google的ai pro套餐最有用的部分居然是5TB的gooogle drive,,,🤔这个可能用处也没那么大,首先我现在不用colab玩msst,colab我现在嫌慢,我会直接用我的端脑云肉便器,,,其次端脑云那个b实例它无论用什么drive上传速度还是那么慢,况且我蓝奏云用得好好的,我还写了json链接格式和适配该格式的全自动下载脚本🤔退114514步讲,google drive的那些空间又不是永久的,一年之后就会失效,而蓝奏基本上和度盘一样只要东西上传了上去就不会消失,除非手动删,,,

顺便我现在开始怀疑,或者说我怀疑了很久,端脑云的所谓吴卡模式它的效果是和人共享gpu🤔我对docker的gpu直通机制不怎么了解,不清楚它使用gpu是否是独占式的,但如果它能不独占的话,,,那么有一种可能正常模式可以独占或者优先调度gpu,而吴卡模式的调度会优先级低一点,,,?然后就能看到明明什么都没在跑,某些实例就是会有一半以上的显存被唐突占用,怎么清理都清不掉的那种🤔所以我前段时间无论是训练还是推理动不动失败的原因找到力,它推理时需要保留26GB显存才能全程流畅完成,而如果我刚好和某个正常模式启动的实例使用了同一张gpu,,,那它不就得在某个阶段申必出错吗🤔

所以我现在更改了bot的调度方式,分配任务之前先检查显存,比如设置一个2⑨GB的可用显存限制,只调度到高于这个值的实例上(确信🤔然后我去创建十个甚至⑨个实例,我tm就不信它们都有人用,,,🤔

cephalon.rekt.26.06.02

继端脑云自动创建实例并自动部署(尽管直到昨天才基本上摆脱了每次部署都需要个ai盯着)后,我今天搞定了半自动注册🤔现在让ai从头写一个注册机,ai通常来说是拒撅的,甚至连道德感极低的gemini都是拒撅的,这个拒撅甚至发生在向它提这个需求的前几秒(悲🤔

所以我尝试用另外一种方式完成它:在抓到注册相关har并让codex分析后,先让它写个用某邮件地址启动端脑云的发邮件流程的脚本,但验证码部分需要用户自己拖,就像jiaotu注册后的验证码环节(这部分撅大多数情况是自动运行的,除非注册得过于频繁才会刷出一个拖动的验证码界面)一样,它会打开一个浏览器窗口跑原版验证码js🤔对于jiaotu来说它获取两个申必字符串,而端脑云这边貌似更简单,它获取的是一个位置值,估计和服务器端对比差值在某个范围内就放行🤔感撅像是小学生学编程写出来的一样,,,这部分实现后就可以让它进一步写个用邮件地址(它当然是gmail)来获取验证码的部分,并为非gmail提供用户输入的fallback(我不觉得有人会用这个功能,但为了让它看起来不那么像全自动注册机,我还是迫真提了一嘴),这部分它用的是google app password(应该叫这名字)连接gmail的imap服务器找邮件,也能如预期找到验证码🤔接下来再让它完成剩余的注册网络请求,设置一个随机强密码,并在stdout里打出邮箱、密码和最重要的jwt token🤔就这样我完成了一个注册机(确信🤔

至此,(几乎)全自动端脑云音频api终于闭环起来力🤔现在去昔琏bot那儿改,加上了在塞往端脑云的邮箱地址里随机塞点(记得前几天我拷打gemini的问题吗,,,)本地记录用过的gmail变种从而避免重复但查邮件时去掉所有点的功能,我十成甚至⑨成确定codex没有意识到这意味着什么(这其实意味着一个gmail账号可以当作2的n次方个账号用,所以账号长度越长越好),它极其爽快地完成了这一任务,现在,我只需要输入一个没有任何变量的命令,它就能自动注册,自动创建实例并将其折腾成无卡(大嘘)模式,并自动部署脚本,基本上半小时后,我就多出了一台可以跑全自动萌妹模型训练和萌妹翻唱的节点,可以用大概800分钟,能训练大概一到两个waifu impact/hsr的萌妹(或猛男)rvc模型,推理可能几百首歌🤔

为了实现半小时撸一个节点的壮举,除去注册用的一两分钟和开实例需要的至少6分钟,剩下的时间也就20分钟多些,我开始哼哼优化脚本🤔我先让codex整了个profiler,从里面分析出它有那么十几到二十多分钟浪费在和pip的吉列豆蒸上(悲🤔从而也说明我之前弄的度盘alist缓存不够,还得接着缓存,比如将那几个组件的pip环境也打包了下下来🤔在一顿加了aria2c的128线程也慢到只有3MB/s的下载速度后(我这边的下载速度就是它的上传速度,可见它这网络是真的垃圾啊,白瞎了什么32核128GB内存还有5090的机子,,,),我终于将这些包下了下来,重新上传度盘,召唤了一个实例进行部署,发现它这次卡了四五十分钟🤔一看里面有三个组件不对劲,按理来说它们都是海外版实例,为什么还是没法通用组件,我暂且蒙古🤔但它们也没多大,用pip嗯装也就一分钟到两分钟,那就每次都卸了重装就是🤔

加了这层保险后,再部署实例就非常丝滑力,连续部署了两三台都不需要外部ai干预🤔目前为了追求速度,我没有部署全api,音频api我分成了两个阶段,目前阶段只部署萌妹翻唱用的msst+rvc,seedvc和gpt-sovits我放在了第二阶段(反正seedvc质量也不行,而且更生草的是,在一顿雷霆训练之后,我现在rvc可用的撅色比seedvc高出一倍),而名为wiebitte的脱衣工作流可能算第三阶段?🤔至于更早的那些没鸡巴卵用的impaint脱衣工作流,现在我都懒得关心能不能部署,能不能用,,,🤔

接下来我发现了更加生草的玩意,它的海外版节点和国内版节点,尽管网络分析出它们十成甚至⑨成在同一个机房,用着同一个出口ip,但它们里面的系统组件完全不一样,连系统(docker镜像)都不一样,一个ubuntu一个debian,啊?🤔更别说它们py版本和别的乱七八糟的也都不一样,就巨坑,我得准备两套alist离线包,至少那些pip包得准备两套(全恼🤔不过自从某申必卖家将国内版端脑云的账号从六毛涨价到一块五后,我就懒得在国内版节点上测试任何东西力(吴慈悲🤔我一个gmail可以创建几千个号,成本基本上可以忽略不计(🤔况且我并没有整国内版的注册机,我要驱动国内版的节点需要粘贴全套token然后加一个--internal参数才能搞,单纯嫌烦🤔

hsrAAAAAAAA.26.06.01

草,今天一大早就发现hsr居然今天更新,而不是两天后🤔这什么神人规划(全恼🤔但更神的是我无论怎么改hosts速度都只有不到10MB/s,在一顿野兽排查后发现是我那边网线的问题,我自己房间里的交换机和客厅路由器之间居然只有百兆(全恼🤔估计这个得等我回去重新插一遍网线🤔

不过往好里想它今天更新hsr,我明天就可以往度盘上传东西,而不是像之前那样等4号,4号说不定我要用来上传别的东西,,,

另外我撅腚拿经典gmail加点问题(就是一个长度为n的gmail邮箱可以通过中间随机加点的方式当作2的多少次方个catchall账号来注册某些网站)拷打gemini,而它果然没答对,因为它居然不知道发往[email protected][email protected]的邮件会发往同一个邮箱,答案应该是2的n次方(当然,如果gmail还有两个后缀,那答案是n+1🤔草,别的ai回答不出来我是可以原谅的,但gemini是google出的,它居然不知道这件事?啊?🤔什么北美豆包(全恼🤔