关闭广告

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

新智元433人阅读

  

  新智元报道

  编辑:Aeneas

  【新智元导读】面对画作总是词穷?现在,Midjourney推出了一个新的图像工具,可以反向操作,只要输入图片,它就会给你输出提示。

  Midjourney V5上线后,网友们用它生成了数不清的惊叹作品。

  在这个AI作画工具面前,人和人的差距,或许就体现在prompt上了。

  去年在科罗拉多州博览会艺术比赛上用AI打败了人类的获奖者,花了80多个小时,经过900次迭代后,才用Midjourney完成了《太空歌剧院》这一艺术杰作。而ta直接拒绝分享出自己的prompt。

  

  是的,现在很多时候,一行完美又专业的prompt,已经价值千金。

  而Midjourney仿佛深知我们的需求,最近,它上线了一个新功能——/describe,可以帮我们从图像中反推prompt。

  

  从图像反推prompt

  现在,如果你有一个想模仿的图像,但你不知道要用什么样的prompt去描述它,这时候,describe就帮你大忙了。比如,下图是新海诚的《言叶之庭》(「言の葉の庭」)。

  

  拖进图像后,Midjourney生成了下面四种prompt。

  

  根据这四个prompt,Midjourney又生成了类似风格的四幅图。

  简直完美。

  

  并且,Midjourney提供的描述也可以激发出用户的更多灵感。传统的画家可能会患有空白画布综合征,AI艺术家有时也会词穷,很难找到描述照片的词语。

  在Midjourney的Discord频道上,从「/describe」就可以启动文本描述过程了。

  

  Midjourney提供了一个拖放区,可以让你拖入图像。

  然后按下回车键,就可以等待prompt了。

  

  四个文本提示,包括描述性词语、样式详细信息和纵横比。宽高比在像素精确度方面与计算机类似,比如如果是一个16:9的图像,它会输出504:283。

  而四个文本提示生成后,你可以直接点击按钮,直接用它们生成图像,当然,在提交之前,你也可以选择自己优化提示。

  作家的意外收获?

  更有趣的是,Midjourney的这个新功能,竟然意外地让作家们获得了帮手。

  如果找不到完美的形容词来描绘一幅画,只需要把图像上传到Midjourney,文采斐然的句子就自动蹦出来了。

  而Midjourney返回的文本提示,真是让人惊喜连连。其中包括「palewave」、「cranberrycore」和「icepunk」等流行语,以及各种艺术家、摄影师和作者的姓名。

  而提示中出现人名时,甚至是可点击的链接,可以打开谷歌搜索,如果点击进去,你或许会获得更多的灵感来源。

  比如,上传Ross Burgener的一张绝佳的作品,Midjourney会这样描述:"极光在LED照明的冰屋上跳舞,给雪的颜色带来了蓝色调"。

  

  它认出了北极光,会在提示中给出建议——可参考艺术家Qlexis Gritchenko和摄影师Nathan Wirth。它采用的词汇包括 「极地冰山」、「发光的天空」和「空灵的雕塑」。

  网友们大喜,已玩疯

  现在,网友们已经玩疯了。

  有网友利用describe功能,生成了许多穿白色蕾丝裙的美女。

  

  

  有人输入了一堆珠宝的图像。

  

  得到了如下的prompt。

  

  根据这些prompt生成的图像如下。

  

  输入一个二次元萌妹。

  

  输出的prompt,出图效果很惊艳。

  

  输入一只气质憨憨的大捻角羚的照片。

  

  生成的prompt如下。

  

  输出的prompt生成的大捻角羚,气质更为冷峻。

  

  输入一只海滩上的狗。

  

  Prompt生出了四只埋在坑里的狗。

  

  输入穿着燕尾服的动漫人物。

  

  生成如下prompt。

  

  生成四张动漫人物。

  

  是RLHF?

  可以看到,Midjourney最近的进步,可以用飞速形容。

  英伟达AI科学家Jim Fan猜测,Midjourney一直在根据人类反馈(「RLHF」)进行大规模的强化学习,并且,这可能是有史以来规模最大的文本到图像强化学习。

  当用户选择放大图像时,是因为他们更喜欢它。如果不把这个过程当作奖励信号,那真是巨大的浪费。这些数据收集起来很便宜,而且完全符合用户群的需求。

  拥有的用户越多,可以做的RLHF就越好,然后获得的用户就越多。

  

  他还给出了一个免责声明,表示这就是自己的一个脑洞,自己并不认识Midjourney的人。

  但他们一定已经是这么做的,因为UI的格式看起来就像一个多项选择题。

  

  最后,要注意的是,同图像生成一样,describe功能需要使用积分,所以需要谨慎地考虑。

  而且现在,Midjourney的免费功能,已经彻底关闭了。

  参考资料:

  https://the-decoder.com/midjourney-new-image-tool-works-in-reverse/

  https://twitter.com/DrJimFan/status/1643279641065713665

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

消息称联想游戏掌机售价799美元, 9月1日发布

IT之家 浏览 466

拼多多狙击战:淘宝撤退,京东进军

新立场NewPosition 浏览 563

科技部副部长:以负责任的态度推动大模型发展

澎湃新闻 浏览 439

AFAC2024:让AI推动金融创新,像扫码支付一样服务千家万户

澎湃新闻 浏览 246

无论多少次 还是会为粉色疯狂心动!

美丽也是技术活 浏览 362

73岁王薇薇穿粉色包身裙走红毯 身材曲线尽显

情感启示录 浏览 246

外媒炒作中国300颗间谍卫星监视美澳演习

环球网资讯 浏览 249

夏天的衣服没必要太多,会这样搭配就足够了,简约时髦显气质

静儿时尚达人 浏览 133

抛弃前夫嫁200斤富豪,54岁杨澜全家定居美国!

我是娱有理 浏览 299

“大佬”纷纷出山,新基金“抄底季”有了“主心骨”?

华尔街见闻官方 浏览 227

台高官涉嫌接受性招待风波闹大 陈水扁之子卷入

枢密院十号 浏览 2298

男子在火车上被杀 家属:嫌犯逃离未果 返回补了几刀

封面新闻 浏览 379

“小米系”再撤退,大股东们为何抛弃“扫地茅”石头科技?

野马财经 浏览 454

皮肤衣到底是防晒神器 还是虚有其表?

一帐Camplus 浏览 266

短发最适合的3种风格,原来这么高级!

猫姐品衣有道 浏览 265

台媒:台陆军八军团弹药库附近昨突然起火

环球网资讯 浏览 267

下一代车要卖15万元,特斯拉如何持续压低成本

晚点LatePost 浏览 462

郭嘉文疑重回李泽楷身边 晒牵手照和鲜花有暗示

素素娱乐 浏览 307

星光熠熠...詹库杜东欧齐聚西部附加赛区

厝边人侃体育 浏览 203

从CEO换帅,看海底捞的用人逻辑

餐饮老板内参 浏览 147

普京赞扬牺牲飞行员 外媒称证实有俄军机被瓦格纳击落

环球网 浏览 369
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-2