asoulbitte.22.05.15

最近很火(大嘘)的asoul某vtuber揭露行业内幕事件,有114514壬报道过,我就不重复了(确信🤔只不过这个asoul对炎上的回应可真にま生草的:

给10%提成就不算压榨了?wiebitte?asoul的资本家和所有壬脑子是被资本轮奸过114514次了罢(全恼🤔说真的,不会发公告就不要发嘛,就算在那儿迫真控诉司马睿啥都不干就抽掉了50%直播打赏都比这好使(大嘘🤔

等等,asoul的后台是字节蠕动?🤔草,难怪asoul剥削vtuber中之壬能敲骨吸髓到如此程度,一家用先进技术奴役全体人类、自家员工猝死都能掩饰过去的屑公司有什么好说的(全恼🤔按理来说自从vtuber便乘中之壬100%营业之后,中之壬其实比vtuber运营方权力大1145141919810倍,运营方能收个百分之几的佣金就不错了,比如cover株式会社我估计就是这么运作的🤔至于为什么asoul不是这样,而是相反的情况,我暂且蒙在中修特色资本主义里(半恼🤔

说实话我一开始是想着手撸出一个刺杀asoul老板的详细计划的,但看到它后台是字节蠕动之后,事情便得困难很多了(恼🤔我一般来说不是联帝反修壬,但此时我也有若干微秒的时间想联帝反修一次了,比如美帝再制裁一次tiktok吼不吼啊?🤔草,原来我也事一个一个一个一个加速壬啊啊啊啊啊(全恼🤔

但无论如何,这次事件再怎样,也算是有点正面作用的(迫真),比如以某个中之壬的悲惨(确信)遭遇,再一次向一般通过二刺螈揭露了vtuber这种商业模式是如何的反人类(如果真的是一般通过而非魔怔vtuber壬的话,很难不对相关中之壬的遭遇表示同情,并以中修朴素的反资文化氛围,开始厌弃它的对立面,也就是asoul和字节蠕动的资本家势力,以及vtuber这种玩意🤔

接下来非常有可能发生的不是asoul的老板或者字节蠕动的老板和它们的全家被吊路灯(顺便一提,如果中修现在真的已经便乘cyberpunk2022了的话,的确有壬需要像johnny手银一样提着小型核弹nuke掉字节蠕动/X度/X讯/X里四选一,或者用四颗小型核弹把它们分别nuke一遍,或者我建议你们暂且放过X里罢,不然你们上哪儿买服务器硬盘车,暗网吗(半恼),而是越来越少的壬会去看vtuber以及给它们打钱,这将从根本上橄榄vtuber剥削广大二刺螈incel的王道征途(确信🤔所以asoul啊,恁也和cover株式会社一样,事本世纪20年代二刺螈帝国主义最薄弱的一环啊啊啊啊啊(意味深🤔

或者它现在已经开始发生了:

没关系,20年代还剩七年半,大概还够你们这些死🐴玩意再翻上个六七次车,自裁,请(吴慈悲🤔搞不好vtuber这种屑商业模式,根本活不到2030也说不定呢(🤔2030搞不好有更顶的娱乐产品,比如全ai合成语音的二刺螈萌妹,完全不需要真壬配音的那种🤔每个壬都有智能二刺螈waifu,而且还要开源🤔

thonkeqing

当然,作为精神fsf壬和it反帝乐子壬,我觉得和反vtuber乐子壬的联合(迫真)还是挺有必要搞的,毕竟我们的敌人是it帝国主义,他们的敌人是二刺螈帝国主义,那么当it帝国主义和二刺螈帝国主义开始交配的时候,比如asoul的后台居然(大嘘)是字节蠕动,理论上来说我们就有共同的敌人(确信🤔其实我也极其讨厌整个vtuber业界和二刺螈帝国主义,所以我本来就是双料乐子壬(确信🤔

yajuubitte.22.05.14

这是今年第二个野兽节(确信🤔X都在下雨,而我在室内居然读出了比室外还高两倍的pm2.5,这足以说明我的某些邻居是多么的死🐴(恼

当然,我现在除了睡觉外很少在这鬼地方待了,而我不在的时候,只能用抽油烟机来强行通风(全恼🤔

babesbitte.22.05.12

昨天和今天的babes拖站基本上比较顺利,除了它的凭据貌似极易失效,大概每两小时到三小时失效一次(恼🤔但至少,我可以同时用8个ip拖它们,而不用像那个司马brcc一样担心经常换ip会橄榄我的账号🤔无论如何,有json的pornsite就是好拖,不像内容全在html里的低级网站(大嘘🤔至于凭据失效后生成的一大堆空文件,我大可直接忽略它们,然后用最后一个好文件伴随生成的currentprogress来重新开启github actions线程(确信🤔

另外一方面,在我对完成的文件查缺的过程中发现它的文件数量居然比应该有的数量多,这可真是太にま生草了,查缺直接便乘查重(半恼🤔那么,我用grep -c的方式查,也许我在指望看到一个0,但我只看到了1和2🤔既然如此,我得写个算法(迫真)去重,但无论如何我至少不用再和mofos打交道了(确信🤔

既然如此,接下来我们搞哪个站?naughty america?🤔

bruhfei

我对naughty america进行了一番迫真分析,发现它又改版了,而且这次改成了下载什么都需要来一遍验证码,麻烦程度仅次于xconfessions(恼🤔更坑爹的是它没有任何json,所有信息都扔进html里面,这样的话像mofos那样在json里面泄漏视频链接啥的也别指望了(全恼🤔

所以,哪怕我有114514美元我也不会去拖naughty america了,更别说我没有(🤔那么接下来还有什么站可以拖?czech casting?🤔还是接着搞完teamskeet?🤔

thonkeqing

所以我接着分析teamskeet去了,上次我只实现了单个链接的转discord tube和转mp4,但如何遍历链接我还没搞🤔这次我来看它的链接列表,此时它居然用到了json,但极其生草的是它大概只有前面一部分长得像json,后面基本上是纯html,然后np++的json解析器直接摆烂(全恼🤔所以此时还是得用分析html的方法,或者我一般来说懒得关心它用的是html还是json,毕竟它们都得用grep给正则了(确信🤔但what if我哪天开窍(迫真)了准备给github actions装上jq?🤔

barbruh.22.05.11

昨天晚上sexart的拖站还剩478三个线程,今天将它们挂上去之后一个小时都没有出结果(恼🤔

去掉sexart脚本的日志记录之后,我发现它居然一直在向discord drive上传文件,却一个返回的链接都没看到🤔那基本上就意味着它一直在重试上传最初的几个片段,至少我的discord drive代码是这么写的🤔

所以,破天荒的discord drive出现了问题(半恼🤔我将这个discord drive脚本下到本地,开启返回消息的显示,然后我发现discord返回了这么一条玩意:

{"message": "Invalid request origin", "code": 50067}

有意思,是不是我之前在discord drive上传discord的函数里留着一条-H 'Origin: https://discord.com' \所致?🤔把这条删掉后discord drive恢复了正常,而我拖sexart的那几个线程也陆续返回了结果🤔这可真是太乌龙了(🤔

thonk

另外一方面,之前搞的截图8GB档现在也可以开始上传了🤔我现在只要压缩出截图就开始做8GB档,并立即挪到某个6TB矿渣里面🤔现在它还剩个737GB,大概还能整个五六次(确信🤔

thonkeqing

我最后折腾出了一系列bash脚本,用来在那几个metart系网站的discord drive链接文件里找出大小异常的文件、以这些文件为线索构造需要重新下载的链接,最后再用重新下载好的正确文件链接替换掉原链接文件里大小异常的文件链接(还有它们对应的currentprogress🤔生草的是这玩意撸一遍之后还能检测出大小异常的文件,需要再撸一遍(恼🤔当然我现在设置的大小异常的标准是1到6位数,换句话说比1MB小的文件肯定能查出来,至于比1MB大的文件里面有没有其实没下完的文件,就不好说了(恼🤔

mofosthonk

草,mofos和teamskeet一样,也是下载权限得另外解锁(恼🤔但生草的是我用1美元搞到了mofos的试用权限后居然用另外1美元搞到了它的另外一个站babes的完整权限🤔尽管我仍然不能下视频,但我居然可以看它的所有视频,这可真有意思🤔而且更有意思的是这玩意的价格是每周1美元,一个月4美元,从某种程度上说比metart还要便宜(迫真🤔

看来,是时候使用我的那啥转discord tube脚本来搞这些片子了🤔先看下它用的是不是cloudflare stream🤔

bruhfei

在我迫真研究了一番它的api后,我发现了一个好消息和一个坏消息🤔好消息是它其实提供了下载链接,只不过没有在网页里显示而已🤔是不是有点像某个申必在线教育网站呢?它也是将完整版链接藏在了json里面,如果我没记错的话🤔,坏消息是它需要验证ip(恼🤔

看来,这玩意要是用github actions的话还是有点风险的(🤔

但这个json api貌似换各种ip来访问都不会有什么问题,所以也许我可以通过将解析代码写进github actions拖站脚本的方式来多线程搞它(确信🤔

wiebitte

当然,我还是在一顿魔改后把它的在线hls视频转discord drive的脚本也撸出来了,这样也许我可以实现像xconfession那样的自适应discord tube,来略微提升下这狗逼玩意的使用体验,毕竟对着一堆discord drive链接我也撸不出来(恼🤔

问题是它的某些视频片段动不动429,而且我重试了十几遍依然如此,看来这玩意基本上不是重试可以解决的了,いいよ!来いよ!我懒得折腾discord tube了,直接下视频罢(恼🤔

我突然在想现在有什么好办法二次加工一下我拖下来的这么多片子了(🤔其实如果我能搞到一大堆白嫖discord nitro的话,情况也许能好很多,比如我再像去年一样搞一个充满了nitro webhook的聊天室,或者好几个,然后开始动用github actions的机子进行discord tube转换(🤔

bruhfei.22.05.09

昨天晚上装的机子只是个最小系统,今天还需要装上别的玩意🤔

11451.4秒之后,剩下的几个组件也陆续装进去了,声卡用矿龙的pcie线引了出来,甚至还插上了大概两年没插过的子卡,硬盘和蓝光刻录机也全部接了上去,网卡天线也接上了,现在这台机子可以正常用了🤔

尽管它现在打游戏啥的不会导致断电或者固态掉线等问题,但我发现它现在有几率出现数据损坏(恼🤔比如我的firefox历史记录文件就坏过一次,而服务器管理器需要的xml文件也坏过一次,还有什么文件坏了我也不清楚(🤔这可真にま蛋疼🤔

另外我发现sexart的视频链接里面既有视频又有图包zip,看来我不能直接拿着metart的代码搞,得加点东西🤔

但至少我不到两小时就搞完了它的所有图片,而且至少看上去像是一次性搞完了的样子(确信🤔那么,我可以让它挂着下视频,然后出去转了(确信🤔

bruh

我出去转的时候发现了一个问题,某些视频下载之后生成的文件只有几百字节🤔回去后看了下log,发现它请求那个白嫖vps一分钟都没有响应,超时了🤔那么我估计白嫖vps那边也出现了超时,而且更有意思的是它下载下来的metadata上面写着timeout,服务器签名写着nginx,但我的白嫖vps上面装的是apache🤔所以,很明显是他们那边出了问题(恼🤔

无论如何,我在白嫖vps的脚本里curl相关命令加入了超时重试选项,就像我在discord备份脚本里那样🤔那个脚本也出现了卡住几十秒的问题,其实加一个2秒算超时重试114514次就能解决问题(确信🤔

当然,我在之前拖的metart资源列表文件里也发现了一些只有几百字节的文件,而且只有可能是几百字节而非其他大小,有意思🤔到时候这种资源肯定得重新下载,但如何替换掉原来资源列表文件里的项,还真是一个问题(恼🤔

fischlthonk.22.05.08

今天终于开始回X都了🤔尽管和来时相比,我还多出来一个行李箱,但这次感觉轻松多了,因为X州站的5和6站台是有自动扶梯的,而我的车在5站台🤔

而且等我坐下后,发现我旁边的两个座都是空的,可以把行李放在我身边,淡季就是にま爽(确信🤔

再说了,我这次居然订到了靠窗座位,所以理论上来说我也没什么必要到处逛了,还不如一直坐到X元🤔然而,我把那台1060笔记本裹成了汤圆塞进了行李箱里,不然我倒是可以掏出来玩玩,比如我昨天晚上收拾台式机前往里面拷了一份dirtyflix拖完(迫真)的metadata列表,我可以施展点antics,找出并没有完成下载的视频列表,方便我重新拖一遍🤔

另外我到X都后还得找些新的pornsite来拖,naughty america肯定是首选,但如果metart的兄弟站sexart也能以5美元一个月搞到的话,或者最多10美元的话,其实我可以优先搞这个🤔我记得sexart没有美式浪叫,不像naughty america几乎全たま是🤔metart的10TB内容到手顶多再多一条用来吹牛逼的谈资,但那些玩意真的不实用(恼🤔

另外mofos貌似可以搞一个7美元一周的会员,但那玩意如果是完整会员的话,信不信我一两天就能全站dump下来,加上调试脚本的时间最多三天,我现在知道怎么做(哼哼🤔当然,它的cdn要是限制ip的话,那就当我什么都没说吧(悲🤔不过我一般来说见过绝大多数的cdn都是不限制ip的,顶多限制过期时间(确信🤔

bruhfei

草,哪个天才设计的X元站外换乘通道🤔不过无论如何,我赶在停止检票之前一分钟还是两分钟来着完成了检票,上了这辆快车,不到一小时半应该就在X都了(确信🤔

回去打算先把电源换掉🤔

JAJAJAJAJA

回去第零件事是把行李箱里的冻品赶紧扔进冷冻室,那么第一件事当然就是换电源啦🤔

1145.14秒后,最小系统装好了,进系统后第一件事就是买sexart的会员(确信🤔它也有5美元优惠,而且更生草的是metart相关代码改个域名就能完全用来解析sexart,爽死🤔就是sexart相关的玩意体积都有点夸张,动不动20GB的4k视频,这可真是个问题(恼🤔

memo.22.05.06

既然我接下来几天要回去了,买一块新的主存储也便乘了一件我需要考虑的事情(确信🤔

接下来我准备做一个简短的记录,关于各种容量的硬盘平均二手价格(其实,我现在不介意主存储也用二手)和每TB价格之类的,时效性仅限今天:

  • 20TB硬盘现在普遍没货
  • 18TB硬盘,希捷的st18000nm000j平均1600(有时还能看见一个1500的),88.9/TB🤔西数/hgst的hc550平均1500,83.3/TB🤔东芝貌似也有18TB,平均1700,94.5/TB🤔
  • > 希捷有一个特殊的产品,叫做hsmr,hybrid smr,据说可以做到cmr/smr双模,就像现在的固态已经普遍是slc/mlc/tlc/qlc多模一样,目前能买到的是cmr模式18TB,smr模式20TB,但切换模式的方法没跟着硬盘一块流出来,所以也许可以当作普通cmr硬盘用,1400左右,77.7/TB🤔另外和那块极其生草的4TB氦气盘一样,这玩意我也找不到product manual(恼🤔
  • 16TB硬盘,希捷的st16000nm001g平均1200,75/TB🤔hc550平均1150,71.9/TB(其实我想强行钦定平均价格1145的🤔东芝的16TB平均1100,68.75/TB🤔
  • 14TB硬盘,希捷有st14000nm0048和st14000nm001g两个型号,前者是x14,后者是x16,平均都在1000左右,71.4/TB🤔其实,撸一个14TB的sas当主存储用也许是个不错的主意(确信🤔hc530只要900左右,64.3/TB🤔东芝和西数/hgst一样🤔
  • 12TB硬盘,希捷的st12000nm0007(这是x12,别的希捷12TB就不建议买了,性能连hc330那块空气盘都不如)平均850,70.9/TB🤔西数的hc520平均800,66.7/TB🤔东芝平均750,62.5/TB🤔
  • 10TB硬盘,此时有氦气盘和空气盘两个选项,希捷的st10000nm0016(只推荐买x10,理由同上)平均650(大嘘),65/TB🤔著名的hc330平均700,70/TB🤔西数的氦气盘就没啥意思了,价格也在700左右,还不如买hc330,至少hc330速度还快🤔东芝也有10TB空气盘,最便宜能到600,但平均的话还是700左右,70/TB🤔我觉得那个10TB的sas挺有意思的,可以考虑买一个做副存储用,反正每次都用hc330和st6000nm0034也怪没意思的(确信🤔

剩下的几个容量我就懒得查了,8TB仍然没有车,6TB矿渣有意思的是希捷hgst东芝三家都低到300,更小的容量价格基本上万年没变过了(确信🤔而我也可以考虑下次搞垃圾盘的时候朝着10TB及以上容量搞了(确信🤔

thonkeqing.22.05.05

昨天晚上设置好八线程metart之后就去impact cuties了,打完日常意犹未尽去chasm挖了一个小时矿,挖完矿接着意犹未尽,上批乎刷攻略去了🤔好家伙,上批乎刷攻略,可以说是作死了,果然我到五点还没睡(恼🤔

k-kawaii zhiqiong chan ist mein waifu! time to cum inside her tight virgin pussy(错乱

再次起来那些github actions早都跑完好几个小时了🤔我随便下了一个currentprogress看了眼,原来一个线程有2063个图集等着下,现在只剩685个了🤔目测剩下的这些两三个小时就能下完(确信🤔看来动用八个线程的确有立竿见影的效果(确信🤔搞不好今天下午就可以开始整合了(确信🤔

接下来我已经定好了回X都的计划,如果没什么差错的话8号就可以回了,所以我准备让这些线程在搞完metart之后搞dirtyflix或者teamskeet,应该是dirtyflix优先🤔naughty america看情况,等我回到X都再考虑搞不搞吧(🤔

wiebitte

我听说cuties impact 2.6无限期延期了,ayaka池子直接设置了一个240天的超长过期时间,包括ayaka池子的试用任务🤔除此之外它还在接下来的时间里安排了一系列的填充时间用活动,比如这个:

从此可以看出2.6至少延期到了下一个月(恼🤔反正我是不觉得他们会在活动还没结束的时候就开始快进到下一个版本的,哪怕X海提前清零了,而且他们做好了发布2.7的所有准备🤔那么很明显延期要在这个基础上接着延,延到下下个月我都不会感到奇怪,要知道X海现在还一天好几千例呢(全恼🤔

所以X海什么时候清零啊啊啊啊啊(半恼🤔当然他们要是一直延期的话其实对我来说算是利好,因为只要他们延期一个月,我就可以给k-kawaii yelan chan又称五星行秋(大嘘)再准备上个30抽(确信🤔

metart finished

终于,在折腾了两三回之后,metart的图包部分也全搞完了,它其实也会出现下载不均匀的情况🤔事后归类统计的时候居然发现少一项,检查log发现压缩包下载啥的都没有问题,就在最后将discord drive链接发送到我的聊天室这一步骤时出了问题,而且也没有设计重试机制,实在是令人哭笑不得(🤔

对之前单线程搞的那些也做了检查,行数是对的,但currentprogress的行数比预期值少1,查到了错乱的行后发现有一个项目没有currentprogress,而另外一个项目多出了一个wiebitte.m3u8,绝对是我某个时候测试cf2discordtube的时候搞的hls(确信🤔这些都修复好后,现在终于能完全对应了,我可以假设那些图片全部上传上去了🤔至于metart这几天又上传了什么新图片,我也懒得关心了🤔

最后,照例做个统计:

cat /thonkeqing/wiebitte/metart.images.combined.txt | awk 'NR%2==1' | sed 's/^.*\///g;s/.metadata.rar//g;s/^.*\.//g' | awk '{sum+=$1} END {print sum}'
# 7721533739955

草,7.02TB🤔再加上视频,我已经拥有了10TB的metart片子,而且也就是这一两天发生的事情(确信🤔现在去跑dirtyflix🤔

bruhfei

然而dirtyflix并没有按照预期跑起来,只有第一个线程有内容输出,别的线程半个小时了都吐不出一个文件🤔

这有可能是因为我把参数填错了,但线程1的输出也没有混进其他线程的视频,它还是只输出了它自己线程的视频🤔我开始排查别的玩意,比如那台白嫖vps能否输入id返回视频链接🤔哦豁,它现在返回不了了(恼🤔

不错,看来我那dirtyflix试用会员的确到了该过期的时候🤔不过这仍然没有解决其他疑惑,比如那些线程获取不了视频链接,为什么它们会一直卡住?🤔

等等,这个bug在我早期调试dirtyflix脚本时也出现过,一旦它获取不了链接,打包currentprogress的那条rar语句会将整个当前目录的所有东西都打包了,包括discord drive脚本,这样接下来它就不会返回任何东西🤔

有意思,但上次出现这个bug之后脚本会立即结束还是会一直卡,我却忘了(🤔

无论如何,我恐怕得想办法再搞一次dirtyflix试用会员,再谈这件事(🤔当然我可能还有一个选择,去拖teamskeet,但这个我实在是没啥兴趣🤔

barbruh

回去一检查,发现我居然在dirtyflix除了线程1外的其他线程文件里面写错了discord drive的文件路径:barbruh:

难怪只有一个线程能发东西🤔而且深入研究我发现了更加生草的事情,我现在算dirtyflix的过期会员,但我仍然可以用申必链接直接下视频和图包🤔总感觉尽管dirtyflix无限接近于russianflix,但他们站长的文化程度也无限接近于搜书盘的站长(确信🤔

既然如此,那么我可以接着跑八线程脚本了🤔只不过这次我遇到了bug,很多线程的第一个视频都只能拖两个版本的视频,而非正常的6个或者7个版本,有时连一个版本都拖不下来,直接上传一个currentprogress上去🤔打开看log,貌似curl解析的时候返回了0字节内容🤔但我换个浏览器访问解析链接却能解析出正确的内容🤔

看来我只能先在那儿插入一个占位符,以后再说🤔

我的另外一个线程半天不更新东西,取消log重定向后我发现它由于某种申必原因,下载速度奇慢,慢到了3MB/s(恼🤔看来这个破站的cdn就是不行啊🤔

我估计这个到时候整合的时候反而容易很多,因为我当时列举视频的时候就没有按照顺序列举,那么整合的时候也不需要管顺序,发现哪些视频没下完直接重新下就vans了(确信🤔

所以,naughty america什么时候搞(🤔

wiebitte.22.05.04

昨天晚上突发奇想,把上次做discord账号注册测试生成的8个32线程webhook(其实还有第⑨个,但那个里面只有10个线程,所以我没用到)全™用起来了,现在我可以八线程拖站(确信🤔除去正在拖dirtyfilx的一号线程和正在拖metart图片的二号线程,我大概还有6个线程可以用来拖metart的视频🤔这点视频才一千多个,刚好可以用来测试这群多线程玩意🤔

没想到github public actions居然没有限制同时运行的runners数量,随便开八个(确信🤔我估计如果每个线程能有150MB/s下载速度的话,这6个线程加起来再怎么说也能逼近8Gbps了吧🤔可以说是拖站史上(大嘘)带宽最大的拖站了🤔metart看起来可以吃得下,但如果换成naughty america的话我就不清楚了🤔

thonkeqing

6个小时之后,那6个线程居然提前完成了四个,剩下两个是超时结束的🤔看来将那个视频列表均匀分割的确会造成有的提前结束有的超时了还没搞完,基本上就和多线程discord频道备份脚本一个尿性🤔既然如此,我可以将那两个线程没搞完的列表整合一下,再分割成六份重新多线程去🤔

无论如何,这的确会给我事后将它们合并成一个装满discord drive链接的列表文件这件事造成困扰(恼🤔所以我只能最大限度地降低这种困扰了,比如先用wiebitte表情分割每次拖站再说🤔线程1-4是正常完成的,直接合并就vans了🤔线程5需要先和线程1-2的新内容先进行合并,然后再和线程6合并,再合并线程3-6的新内容,这样我觉得最后顺序就应该能整合适了🤔除非我中途觉得某些线程仍然闲得蛋疼,再整合并重新分割一次🤔

但现在看来,我这8线程的确可以说是神速,我觉得这顿视频整合完毕之后图片也可以至少7个线程铺开,至于dirtyflix那个线程它爱啥时候搞完啥时候搞完,我懒得关心(吴慈悲🤔

然后,等我搞完metart我就去搞naughty america🤔

stat

折腾了1145.14秒后终于将那几个频道备份了下来,一番迫真处理之后终于把metart所有视频的链接收集齐了,至少视频的数量貌似能对应上(确信🤔但在处理xconfessions时发现除以3居然比视频数量少1/3,一检查发现某个视频的currentprogress文件由于某种申必原因没有上传上去🤔当然这不是什么大问题,从别处复制一个占位就vans了🤔

接下来由于我的每一个单文件discord drive文件名后面都带有文件大小的准确字节数,我可以直接开始统计这些站的资源总量了,比如metart:

cat /lickeqing/metart.videos.txt | awk 'NR%2==1' | sed 's/^.*\///g;s/.metadata.rar//g;s/^.*\.//g' | awk '{sum+=$1} END {print sum}'
# 3353971940423
cat /lickeqing/metart.images.txt | awk 'NR%2==1' | sed 's/^.*\///g;s/.metadata.rar//g;s/^.*\.//g' | awk '{sum+=$1} END {print sum}'
# 1916462601911
cat /lickeqing/xconfessions.txt | awk 'NR%3==2' | sed 's/^.*\///g;s/.metadata.rar//g;s/^.*\.//g' | awk '{sum+=$1} END {print sum}'
# 202315174465

草,metart的视频总量居然高达3TB,而这些图片现在也占用了高达1.74TB的空间,我甚至还没有拖完,我觉得可能连三分之一都没达到🤔严格点来说这些视频我只花了将近10小时就搞完了(确信🤔看来,我得将接下来剩下的图片也八线程撸了,dirtyfilx可以以后再说(吴慈悲🤔至于xconfessions加起来只有188.42GB,如果我没有将每一个分辨率的视频都保存一遍的话恐怕只会更低(恼🤔

bruhskeet.22.05.03

实在是睡不着,起来随便分析了下teamskeet🤔它貌似根本就没有什么json api,直接分析网页就能分析出m3u8🤔但上次不清楚为啥触发了cf浏览器检查,我当时猜测是ip原因,这次我尝试用bitvise的ssh tunnel功能,通过这个ssh tunnel登录并且访问它的网页🤔这次终于可以从那台白嫖vps里解析出链接了,做成cgi-bin也能搞,输入id返回m3u8链接🤔就是不清楚过段时间它还能用不,因为至少浏览器那边它动不动就需要重新登录,每次重新登录都要来一波google验证🤔

它还有一个图集功能,很不幸的是下载链接会检查ip,换成github actions的话肯定没法下(恼🤔如果我用cgi-bin将那个压缩包的内容直接echo到stdout呢?理论上来说是可行的,设好content-type后哪怕浏览器都能直接下载,但我没那么闲得蛋疼🤔等等,如果它是302呢?如果302跳转后的那个链接不检查ip呢?

bruhfei

另外我发现czech casting居然没有任何优惠,所以恐怕我得上某个网站看白嫖版了🤔好家伙,它现在是把那个站的视频全删了吗,怎么一个一个一个一个都没了(恼?看来我得翻下旧硬盘了,打开笔记本硬盘备份,挂载11号盘,成功找到🤔

现在我有点怀念那个叫做0.5TB人类性爱艺术博物馆(大嘘)的onedrive了(悲🤔那时porntrex还非常好使,反正比现在好使多了,能按人物精确索引到任意pornsite的对应视频(确信🤔现在它只会瞎鸡巴取标题(恼🤔

反正无论如何,30美元我是真难以下手,我还是等那两个搞完后搞naughty america吧(🤔

要不我学那些迫真siterip壬挂盈利网盘盈利吼不吼啊?🤔我这再不堪也算是真·siterip,比那堆虫豸高级1145141919810893倍(确信🤔然后再以战养战🤔

proxy

最后我发现curl有一个叫做-i的参数可以返回整个响应体,基本上去除第一行就可以直接输出到stdout了🤔这样的话,我可以将teamskeet图片压缩包的内容直接返回给浏览器或者别的玩意,连http响应头都不用构造,四舍五入相当于代理了(确信🤔现在可能只能用单线程,因为我没什么办法传递range请求头进去(🤔

当然这一招也可以用来搞nitro delegation,只不过我现在不清楚cgi-bin如何将请求头也传进脚本,然后再传给脚本里的curl🤔而且这玩意执行起来肯定会比cloudflare workers慢很多就是了(恼🤔之所以teamskeet不用cloudflare worker,还不是因为后者的ip不固定,而这死🐴玩意干什么都检查ip(全恼🤔

而且既然它那么喜欢每过几个小时就重新登录,我再也不能将凭据硬编码到sh文化里了,得单独放个地方🤔然后每次凭据变了之后直接改那个文件即可🤔

除此之外我突然想到cloudflare能够代理ipv6网站,但它只支持代理那么几个端口,好在apache2支持同时监听多个端口,这样我就可以让它既保持对旧申必脚本的兼容性(因为里面地址全都是ip:端口这种形式)又加上对人类的兼容性(大嘘)了🤔它这个nat ipv4映射居然是ipv6的端口完全对应ipv4的端口可还行,不需要额外设置🤔