前段时间腾讯的混元大模型开源了,据说是具备双语生成能力,对中国元素的理解能力非常强,于是带着好奇心花了点时间部署在本地跑了下看看。
中英双语生成
测试了下英文提示词,生成的图片意思对了。(不过这物件应该不对吧,电视机怎么看着像电脑?)
A cyberpunk style lab with some beakers in the lab, and a TV and an xbox
再来个用中文的提示词试试
一副山水画,一座寺庙, 在高山上。
生成的效果还不错。混元大模型还能用诗词或者俗语来生成图片。
枯藤老树昏鸦,小桥流水人家
明月几时有,把酒问青天
明月几时有有了,但是后半句在生成的图片中没看到...
尝试了其他几个,比如菜名,景区名。
臭豆腐
九寨沟
细节能力
官方说混元大模型能够理解文本中的细节,并绘制相应的图片。我尝试了几个提示词,总的表现还不错。
太阳微微升起,花园里的玫瑰花瓣上露珠晶莹剔透,一只瓢虫正在爬向露珠,背景是清晨的花园,微距镜头。
湖水清澈,天空湛蓝,阳光灿烂。一只优雅的白天鹅在湖边游泳。它周围有几只小鸭子,看起来非常可爱,整个画面给人一种宁静祥和的感觉。
风格是写实,画面主要描述一个亚洲戏曲艺术家正在表演,她穿着华丽的戏服,脸上戴着精致的面具,身姿优雅,背景是古色古香的舞台,镜头是近景
该项目至少需要11G的显存来运行,但我在2080,8G显存的电脑上也可以运行,不过是非常慢!低配的同学如果不怕费时间的话可以玩玩看!
关注公众号,发送【混元】关键字获取整合包。
制作不易,如果本文对您有帮助,还请点个免费的赞或在看!感谢您的阅读!