这几天在本地找了个新的写代码工作,但第一天我需要做的事是写爬虫🤔作为有着字面意义上的十年甚至⑨年工作经验的非全职爬虫工程师,discord drive和guilded drive的发明者,这种事情对我来说算是舒适区力(迫真🤔刚上班两个小时我就完成了所有关键协议的分析,同时和他们的应该是网管还是sysop聊了两个小时b磕,得知他们这个响应json里面充满中文拼音缩写的网站是用低代码平台撸出来的🤔我的评价是还不如用ai写呢,ai至少可以定制(半恼🤔
当然它也许没有那么舒适,因为我需要做的是将一个站点的东西提交到另外一个站,而这两个站都在你妈内网,而我不仅得在内网完成开发,估计最终成品也要在内网部署🤔考虑到我现在狗寄吧不是,连台专用的内网机子都没有,我也没有权限往里面装各种东西(包括cygwin),最后考虑到各种因素,我单方面撅腚这爬虫玩意实现的形式其实是浏览器插件(确信🤔
根据我问ai的结果,浏览器插件(比如它用的chrome)设为service worker时,它可以跨站使用,刚好可以将一个站的附件下下来然后上传到另外一个站(确信🤔理论上来说浏览器插件还能继承cookies,但那两个逼网站都用的auth,可能得先设好auth,,,🤔总之,我用了另外半天以现查先用的方式对着源站的fetch进行了一番吉列豆蒸,并且得知目标站是可以用一个简单的http请求来新建一项内容的,又用了另外半天搭建起来浏览器插件的框架并跑通它的一些按钮功能,估计再用半天到一天我就能将源站和目标站的数据打通,然后撸出来第一版的poc,然后去搞可行性分析力(确信🤔