【AI测评】一张配图需求引发了10款文生图AI模型大比拼,谁是最强王者?百度?阿里?字节?OpenAI?

跟锅头一起学AI 2024-03-22 22:16:23

▌需求场景

今天打算把昨天发布的图文教程【AI学习】保姆级教程!手把手教你使用WPS AI 一键生成PPT(附体验效果)做成视频。

视频开头设计的画面是:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”。

那么问题来了,我该去哪找到符合这个画面描述的配图呢?

锅头寻思着,这个配图应该比较简单,随便找个文生图模型来做就能达到预期。

▌360智绘

刚好看到关于360智绘的文章,那就试试360智绘,看看效果。

在浏览器中输入网址https://aigc.360.com/ ,按回车进入360智绘页面。点击【文生图】功能图标区域,输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”。一顿登录操作后,生成图片如下:

该图片由360智绘生成

评价与反馈:看到后有些滴汗,小明怎么变身成了个大美女(PS:怪我没把小明性别做说明),完全看不出焦急的样子。这图没法用呀。

▌美图AI-WHEE

之前用过美图AI-WHEE,感觉体验还不错,试试它能不能满足我的需求。

在浏览器中输入网址https://www.whee.com/,按回车进入WHEE页面。输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【生成】。得到图片如下:

该图片由WHEE生成

评价与反馈:这张图片中小明变身成了个大帅哥,“PPT紧急”的字样很明显(这点给个赞),可为什么这个电脑摆放是反着的呢,大帅哥认真盯着电脑背面想干啥呢?这图还是没法用呀。

▌科大讯飞-讯飞星火

有种预感,锅头在寻找配图的路上越走越远了……

在浏览器中输入网址https://xinghuo.xfyun.cn/,按回车进入讯飞星火对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图片由讯飞星火对话生成

评价与反馈:这张图片中小明变身成了个中年大叔,表情是够焦急了,但是没看到PPT相关元素。配图没那么精准匹配的要求下,勉强也可以用。

既然讯飞星火测试了,那么就不能少了国产大模型宣传得最热门的百度文心一言。

▌百度-文心一言

在浏览器中输入网址https://yiyan.baidu.com/,按回车进入文心一言对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图片由文心一言对话生成

评价与反馈:这张图片中小明变身成了个小帅哥,表情认真但看不出焦急,也没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。

既然百度的文心一言测试了,要不再试试阿里的通义千问?

▌阿里巴巴-通义千问

在浏览器中输入网址https://tongyi.aliyun.com/qianwen/,按回车进入通义千问对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图片由通义千问对话生成

评价与反馈:这张图片中小明还是个小帅哥,依然是表情认真但看不出焦急,电脑屏幕有了代码界面但依旧没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。

既然百度的文心一言、阿里巴巴的通义千问测试了,怎能少了字节跳动的豆包。

▌字节跳动-豆包

在浏览器中输入网址https://www.doubao.com/chat/,按回车进入豆包对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图片由豆包对话生成

评价与反馈:这张图片中小明摇身一变大头儿子的感觉,不确定是否焦急,但依旧没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。

国产大模型,怎能少了智谱清言。

▌清华系-智谱清言

在浏览器中输入网址https://chatglm.cn/main/alltoolsdetail,按回车进入智谱清言对话页面。输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图由智谱清言-GLM-4对话生成

评价与反馈:这张图片中小明看着是焦急了,电脑也有了,但又是在电脑背面显示文字,依旧没看到PPT相关元素。这张图也没法用来配图突出焦急做PPT的主题。

国内文生图AI模型及应用工具的配图测得差不多了,但多少都有些瑕疵,不能完全满足锅头的配图诉求。

那么国外的文生图模型及应用工具表现又如何呢?

▌OpenAI-DALLE 3

在浏览器中输入网址https://openai.com/dall-e-3,进入OpenAI的DALLE3页面,点击【Try in ChatGPT】出现“Unable to load site”。由于某种原因,锅头现在无法直接使用 ChatGPT。

于是叫朋友帮使用ChatGPT-4 输入对话内容:生成一张图:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图由ChatGPT-4对话调用DALLE 3生成

评价与反馈:这张图片中小明看着是焦急了,电脑也有了,PPT元素和字体也有了,但又是在电脑背面显示文字,“紧急”被翻译成了英文。这张图需要的元素都有,瑕疵点就是文字出现在了电脑背面。

听说Stable Diffusion在文生图方面处于全球领先水平,特别是最近推出的Stable Diffusion 3。不过由于没充值会员,现在只能体验stable-diffusion-turbo。

▌Stability AI-stable-diffusion-turbo

在浏览器中输入网址https://stability.ai/,进入Stability AI的首页,点击【Try

SDXL Turbo】。输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【发送】。得到图片如下:

该图由SDXL Turbo生成

评价与反馈:这张图片中发生了翻天覆地的变化,一群人坐在一起开会,看着投影屏幕上的PPT。已经不知道谁是小明,谁在焦急了。看得锅头倒是很焦急。

从这张图可以看出,stable-diffusion-turbo对中文的理解还比较差,中文转英文输出后,一切变了样。完全不能用了。

最后,试试我最近一直用得比较顺手、较少让我失望的ideogram。

▌Ideogram AI

在浏览器中输入网址https://ideogram.ai,进入Ideogram AI的首页,输入提示词:小明焦急地看着电脑屏幕,屏幕上显示“PPT紧急!”后点击【Generate】。得到图片如下:

该图由Ideogram生成

评价与反馈:这张图片中可以看到小明焦急的表情、电脑屏幕上写着PPT EMERGENCY。提示词的内容都能get到了,还有小瑕疵是“紧急”不能以中文显示。一通测试下来,还是选择了Ideogram AI生成的图片。

▌互动时刻,请发表你的观点

如果你是小明,绘选择哪几张图做配图? 多选

360智绘生成

美图-WHEE生成

文心一言生成

讯飞星火生成

通义千问生成

豆包生成

DALLE 3生成

SDXL Turbo生成

Ideogram生成

智谱清言生成

▌附:10款文生图模型及应用一览表

▌内容来源

[1] 锅头在10款文生图模型及工具的配图生成测试。

0 阅读:1

跟锅头一起学AI

简介:持续学习AI知识和使用技巧,思考如何用AI高效学习办公