这段时间我在做一个xx迁移系统,我总共完成了纯手动版(真·古法编程),半手动版(搞出har让codex分析然后改进我的古法编程插件),半自动版(用agent+小模型而非codex+大模型分析har),现在应该是轮到了全自动版🤔
首先,如果我再去抓两份har然后让codex做,这很明显仍然不算全自动版,这顶多算3/4自动版🤔全自动指的是我只提供两个auth,两个站的网址,剩下的事情让codex自己看着办,它埃及吧干啥干啥(确信🤔而且这玩意至少我这次尝试的版本撅队不是牢总臆想的丢下一句话就能全自动干,我反正说的提示词至少不止一句,,,
总之,codex是能自动干,而且至少一开始干得人模狗样的,能通过钻研js摸索出api,,,过了将近一个小时,它居然还在干,而且为什么我的5h额度这么快就干到了0%?🤔好家伙,换了个workspace继续干,又过了一个小时,它耗掉了5h额度的70%,而且还没有干完(全恼🤔
我估计如果提供har的话,恐怕它不到10分钟甚至⑨分钟就干完力,无论是直接干还是让它写个小程序干,,,
最后在哼哼干了将近两小时(具体时间我没法统计,因为中途额度用光我停了一次换auth)之后,它撸了一个node.js脚本完成了迁移🤔这个速度有够慢的,考虑到我用的可是gpt5.4然后开了xhigh,这理论上已经是claude opus之外最好的编程模型🤔这要是进内网用一个十成甚至⑨成没有为写代码或者agent能力优化过的通用小模型,那它的性能表现如何我想都不敢想(撅望🤔况且,我让它输出每一步的思考过程和对应的系统提示词,它思考过程貌似打出来力,系统提示词不给🤔那我做个鸡巴的agent(🤔
不过本来全自动xx就是吃力不讨好的行为,我下午让它整个agent,具备网络请求能力,拿那个思考过程走走捷径,意思意思下差不多得了,交差我用之前开发的半自动成品🤔