这段时间我在雷普和gemini3同时发布的nano banana pro,当然也有人称其为nano banana 2🤔还是拿之前折腾过一段时间的ai generated cosplay(下面简称aigc)为例,我发现新模型生成的aigc,除了分辨率更高外,其实图像质量也高了不少,原冻鳗图像里面衣服等东西的细节也能更好地便乘3d,现在再和旧模型生成的玩意一比较(因为它现在只要用完pro的限额就会用旧模型处理同一组输入prompt,而这个限额可能只有三十多张,所以这个比较还是非常容易做的),,,草,旧模型生成的都是什么寄吧玩意(全恼🤔
而在特殊prompt的依从程度上,新模型也比旧模型好太多,比如我经常用的比基尼aigc这一块,旧模型不清楚怎么搞的吴论使用什么描述比基尼的词语(我还专门查了下比基尼的英文wiki页面找到了一堆词)都只能生成一种比基尼,但新模型能够随出各种穿得比较少的比基尼,甚至能露出小半个奶子的🤔而且更撅的是,被我迫真优化一顿后,它生成的部分照片还能看到比基尼下面若隐若现的乳头,反正我撅得irl比基尼要是真这样那它可能属于某种设计缺陷(🤔
顺便一提我之所以在旧模型时期开发出了比基尼aigc玩法,是因为我处理全裸的冻鳗图片时如果不加穿衣服的prompt它压根就生成不出来,加上穿衣服的prompt又会瞎鸡巴加衣服,所以最后我干脆整成了加比基尼🤔但现在它升级后压根就没法把任何全裸的图片甚至裸一半的照片当作输入,哪怕prompt里面写穿阿拉伯罩袍都不行🤔我现在只能通过脖子以下截肢的方式才能将其作为输入塞进去,反正生成的是比基尼aigc,只需要提供发色作为比基尼的配色即可(确信🤔
但现在有个问题,以我拙劣的英文水平,当然也有可能是模型自己的问题,它生成的比基尼样式极其随机,生成10张图片可能有四五种不同的微型比基尼,怎么办?🤔最后我想到一个办法,用另外一个nano banana pro会话处理某张我喜欢的比基尼萌妹irl的照片,让它提取出照片里面的比基尼样式,然后生成一个展示架上的比基尼的照片🤔反正目前它没法生成那种只有比基尼背景为白色或者透明背景的照片,那就只能退而求其次力🤔当然之后还可以让它做点修改啥的,比如改颜色,布料缩小一半之类的🤔
这张纯比基尼照片接下来会作为额外的输入塞进去,然后在prompt里面让它参照这张图片的比基尼样式,为原图里的萌妹佩戴这个比基尼🤔这样出品就会稳定很多(确信🤔不敢保证每张aigc都有乳头,但至少四分之三有(确信🤔而我的prompt至少目前里面没有一个nipple单词,有的话它也十成甚至⑨成出不了任何图🤔
final prompt
除此之外,aigc还需要处理各种复杂的情况,比如需要整的人物会超过1,甚至他们会来自不同的冻鳗照片,甚至不见得只有萌妹🤔而对这些乱七八糟的人物,有的需要上比基尼,有的不需要上,有的需要戴眼镜,有的不需要,场景有可能得重新整,有时候需要从某张原图里扒(比如喜闻乐见的hsr/zzz截图一键转aigc环节),然后他们之间的互动方式也有可能有很多种,反正一套prompt是不行的,甚至prompt里人称代词也得根据情况换,不然眼镜和比基尼的颜色都整不合适(全恼🤔
所以我最后缝了114514种用过的prompt,确定了这么一套玩意:
pic 1 is [char1] and pic 2 is [char2],
pls Generate a highly detailed realistic cosplay photo of [char1] and [char2],
and preserve [their/her/his] headband if [they/she/he] had any,
and then add [char1/char2/them] with strapless micro bikini with color matchin' [her/their] hair color and shape matchin' pic [2/3], # probably i shall use "another pic/bra pic"?
and then add thin, metal frames in a round style glasses with transparent lens and frame color matchin' [her eye color/their respective eye color] for [char1/char2/them],
and use the original background of [pic1/pic2]. / by a lake. / by a seaside beach. / at a comimarket.
Keep [their/his/her] hair style as same as the original illustrations. Exactly replicate the same pose, body posture, hand gestures, facial expression, and camera framing as in the original illustrations. Keep the same angle, perspective, and composition, without any deviation,
And make them do french kiss, / And make them hug each other but look at the camera,
and make the aspect ratio of this pic to be 16:9.
使用的时候需要根据实际情况删掉不需要的或者不符合上传图片情况的部分🤔尽管还是得改,但现在我可以对其中的常量部分进行某种优化力(确信🤔