安爸-超级家庭

OpenAI和谷歌接力干掉Photoshop

安爸 发布于

谷歌Gemini 2 flash发布后不久,

OpenAI的ChatGPT 4o也发布了自然语言P图功能,

甚至引发了美国人全民“吉卜力”热潮。

事实上,AI重绘功能,是MJ、Stable Diffusion至少用了两年的基本功能之一。

为什么之前没有那么火?

其实和LLM的基本逻辑有关。

长期以来,MJ、Stable Diffusion的玩家是个小众群体,

大家用工作流、提示词、ControlNet插件等方式玩的不亦乐乎,

还没有想到用自然语言控制这些工作流。

从谷歌和OpenAI的新功能来看,这应该是早就再开发的,

尤其是ChatGPT 4o,不太可能谷歌发布后立马就拿出来成品。

对于LLM玩家来说,万物都用自然语言控制,是大势所趋。

而AI绘画玩家虽然也在用自然语言控制画面,但还是误入歧途。

当年ControlNet出现的时候,就有两种观点,

一是生产力神器,未来可以取代Photoshop了;

二是异端,这种控制画面的方式不符合AI绘画的基本逻辑。

包括我在内,很长一段时间也习惯了ControlNet的方式来画图,

如今早已习惯ComfyUI这种工作流模式配合不同的节点来实现想要的效果。

甚至阿里、字节等团队,都拿出了开源的插件,对画面进行控制。

谷歌和OpenAI的自然语言P图的技术,从内核上来说,在开源AI绘画圈早就成熟了,但是就差那么一点点临门一脚。

2023年的时候,很多团队在用Stable Diffusion插件做电商图片工具,并取得了一些成绩。

随着自然语言P图普及,这类初创团队只好换方向。

当然了,我剩下的期待就是,DeepSeek v4是不是能有这个能力?

(文:路过银河AI)

OpenAI和谷歌接力干掉Photoshop最先出现在每时AI


扫描二维码,在手机上阅读