晚上群里有人日常撕逼,他们在迫真辩论的时候拿出了另外一场辩论赛作为依据,或者本来迫真辩论本身就是由这场辩论赛里某人的部分言论产生的误解(确信🤔尽管音频是公开的,但带字幕的视频在一个叫做wondrium的网站上,免费试用半个月,之后信用卡扣费20美元,还行,反正比pornsite便宜多了(大嘘🤔再说了,pornsite可不提供哪怕一天的免费试用,不然西方绝大多数的pornsite可要被我撸光了🤔所以我突然有想法,把这个网站的东西,比如那个辩论赛给拖下来🤔
我登上去一看,发现点击它的视频时网络请求出现了m3u8,事hls(确信🤔但直接下无论m3u8还是ts都是不行的,我以为和那些pornsite一样切换到vps的ip就能vans,但还是不行🤔看来这些玩意是要吃headers的,这样的话,用ffmpeg直接对着m3u8转mp4也是不行的,因为ffmpeg好像不支持加载headers(悲🤔
其实还有一种办法可以用来下载m3u8里面的ts分片,将m3u8下载到本地后直接对着它前面加一个-i
就vans了(确信🤔接下来那些片段在本地的文件名基本上相当于m3u8里面链接掐头去尾后的效果,前面截到最后一个/
,后面删掉?
后面所有的东西🤔用这种方法我们可以非常轻松地将m3u8处理成本地文件的格式,然后直接ffmpeg光速撸了(确信🤔
下游解决了,上游?什么情况下它会加载m3u8?🤔我发现只有在点击视频左边的播放按键的时候才会加载m3u8,此时它会先请求一个比如https://link.theplatform.com/s/jESqeC/media/guid/2661884195/ZV8635-L01?manifest=m3u
,然后m3u8会出现在它返回头的location
字段里,而且极其生草的是,这个请求居然没有代表身份的headers🤔这个m3u8本身只是用来索引其他m3u8的,其中第一个是码率最大的,挑选出它进行上述的下载和转mp4就vans了🤔
这个链接里的变量其实只有两个,一个是2661884195
,好像代表网页的id,另外一个是ZV8635-L01
,这部分左边好像也是网页id,右边是课程索引(因为它有时候一个网页有很多课程🤔有时它还有一个预告片,这个预告片的第二部分通常是纯数字(确信🤔而且这两者都能非常轻松地从wondrium课程的网页那里直接得到,它并不会像phpdisk网站或者pixiv那样将信息藏在哪个ajax里面,它会直接给出——这是唯一一次需要wondrium身份认证的地方🤔
这意味着什么?假如我的试用只剩几小时就过期了,我可以先去把它全站的课程网页全镜像一遍,然后慢慢分析,提取出上面说的两个要素,然后哪怕过期了我都可以慢慢拖着玩,因为剩下的步骤不需要任何身份认证🤔我甚至可以用一大堆github actions轮流雷普它🤔
说到github actions,我刚准备写一个可以部署到github actions的版本,然后发现今天github全站500了,真tm扫兴(全恼🤔
thonkeqing
视频拖了下来,我看了下,是个中美之间是否算敌国的辩论🤔我们的辩论内容大概是它里面的某个辩手是正方还是反方,基本上以我上传了原始视频而终🤔
而对那场辩论赛来说,它判断结果貌似依靠的是辩论赛前观众对辩题直接投票,辩论完后观众再投一次票,看两者区别🤔结果极其生草的是两次都是反方的票多,而且差距还拉大了🤔反方居然赢了可还行,看来美国壬并没有我预料到的那么魔怔🤔毕竟蓬猪早就被踢出白宫了不是吗🤔