▌需求场景
今天打算把昨天发布的图文教程【AI学习】保姆级教程!手把手教你使用WPS AI 一键生成PPT(附体验效果)做成视频。
视频开头设计的画面是:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”。
那么问题来了,我该去哪找到符合这个画面描述的配图呢?
锅头寻思着,这个配图应该比较简单,随便找个文生图模型来做就能达到预期。
▌360智绘
刚好看到关于360智绘的文章,那就试试360智绘,看看效果。
在浏览器中输入网址https://aigc.360.com/ ,按回车进入360智绘页面。点击【文生图】功能图标区域,输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”。一顿登录操作后,生成图片如下:
该图片由360智绘生成
评价与反馈:看到后有些滴汗,小明怎么变身成了个大美女(PS:怪我没把小明性别做说明),完全看不出焦急的样子。这图没法用呀。
▌美图AI-WHEE
之前用过美图AI-WHEE,感觉体验还不错,试试它能不能满足我的需求。
在浏览器中输入网址https://www.whee.com/,按回车进入WHEE页面。输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【生成】。得到图片如下:
该图片由WHEE生成
评价与反馈:这张图片中小明变身成了个大帅哥,“PPT紧急”的字样很明显(这点给个赞),可为什么这个电脑摆放是反着的呢,大帅哥认真盯着电脑背面想干啥呢?这图还是没法用呀。
▌科大讯飞-讯飞星火
有种预感,锅头在寻找配图的路上越走越远了……
在浏览器中输入网址https://xinghuo.xfyun.cn/,按回车进入讯飞星火对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图片由讯飞星火对话生成
评价与反馈:这张图片中小明变身成了个中年大叔,表情是够焦急了,但是没看到PPT相关元素。配图没那么精准匹配的要求下,勉强也可以用。
既然讯飞星火测试了,那么就不能少了国产大模型宣传得最热门的百度文心一言。
▌百度-文心一言
在浏览器中输入网址https://yiyan.baidu.com/,按回车进入文心一言对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图片由文心一言对话生成
评价与反馈:这张图片中小明变身成了个小帅哥,表情认真但看不出焦急,也没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。
既然百度的文心一言测试了,要不再试试阿里的通义千问?
▌阿里巴巴-通义千问
在浏览器中输入网址https://tongyi.aliyun.com/qianwen/,按回车进入通义千问对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图片由通义千问对话生成
评价与反馈:这张图片中小明还是个小帅哥,依然是表情认真但看不出焦急,电脑屏幕有了代码界面但依旧没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。
既然百度的文心一言、阿里巴巴的通义千问测试了,怎能少了字节跳动的豆包。
▌字节跳动-豆包
在浏览器中输入网址https://www.doubao.com/chat/,按回车进入豆包对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图片由豆包对话生成
评价与反馈:这张图片中小明摇身一变大头儿子的感觉,不确定是否焦急,但依旧没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。
国产大模型,怎能少了智谱清言。
▌清华系-智谱清言
在浏览器中输入网址https://chatglm.cn/main/alltoolsdetail,按回车进入智谱清言对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图由智谱清言-GLM-4对话生成
评价与反馈:这张图片中小明看着是焦急了,电脑也有了,但又是在电脑背面显示文字,依旧没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。
国内文生图AI模型及应用工具的配图测得差不多了,但多少都有些瑕疵,不能完全满足锅头的配图诉求。
那么国外的文生图模型及应用工具表现又如何呢?
▌OpenAI-DALLE 3
在浏览器中输入网址https://openai.com/dall-e-3,进入OpenAI的DALLE3页面,点击【Try in ChatGPT】出现“Unable to load site”。由于某种原因,锅头现在无法直接使用 ChatGPT。
于是叫朋友帮使用ChatGPT-4 输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图由ChatGPT-4对话调用DALLE 3生成
评价与反馈:这张图片中小明看着是焦急了,电脑也有了,PPT元素和字体也有了,但又是在电脑背面显示文字,“紧急”被翻译成了英文。这张图需要的元素都有,瑕疵点就是文字出现在了电脑背面。
听说Stable Diffusion在文生图方面处于全球领先水平,特别是最近推出的Stable Diffusion 3。不过由于没充值会员,现在只能体验stable-diffusion-turbo。
▌Stability AI-stable-diffusion-turbo
在浏览器中输入网址https://stability.ai/,进入Stability AI的首页,点击【Try
SDXL Turbo】。输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:
该图由SDXL Turbo生成
评价与反馈:这张图片中发生了翻天覆地的变化,一群人坐在一起开会,看着投影屏幕上的PPT。已经不知道谁是小明,谁在焦急了。看得锅头倒是很焦急。
从这张图可以看出,stable-diffusion-turbo对中文的理解还比较差,中文转英文输出后,一切变了样。完全不能用了。
最后,试试我最近一直用得比较顺手、较少让我失望的ideogram。
▌Ideogram AI
在浏览器中输入网址https://ideogram.ai,进入Ideogram AI的首页,输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【Generate】。得到图片如下:
该图由Ideogram生成
评价与反馈:这张图片中可以看到小明焦急的表情、电脑屏幕上写着PPT EMERGENCY。提示词的内容都能get到了,还有小瑕疵是“紧急”不能以中文显示。一通测试下来,还是选择了Ideogram AI生成的图片。
▌互动时刻,请发表你的观点如果你是小明,绘选择哪几张图做配图? 多选
360智绘生成
美图-WHEE生成
文心一言生成
讯飞星火生成
通义千问生成
豆包生成
DALLE 3生成
SDXL Turbo生成
Ideogram生成
智谱清言生成
▌附:10款文生图模型及应用一览表▌内容来源[1] 锅头在10款文生图模型及工具的配图生成测试。