测评国内主流6大智能问答软件到底哪个最好用?
ChatGPT的出现引爆了智能问答市场,切切实实的改变了我们的生活和工作,赋能于各个行业,带来了技术和产业的变革,国产的大厂也纷纷跟进,做自己的智能问答平台,如百度的文心一言、字节的豆包、腾讯的Kimi、阿里的通义千问、科大讯飞的讯飞星火、昆仑万维的天工。
之前我也是科学上网用ChatGPT,还开了4.0的会员,但是自从国内有了智能问答软件,我就很少用ChatGPT了,今天我们就来全面测评一下,市面上这6大主流问答软件到底哪个最好用?
一、总览
备注:表格用AI生成的
二、功能
1. 文心一言
问心一言,主菜单包含对话、发现、发布(帖子、对话分享、创建智能体)、通知、我的。
对话,分为助手和最近,主要展示智能问答。
发现,分为智能体和社区,展示各种丰富的智能体,社区一个用户互相交流AI生成的地方。
发布,主要是发布帖子、分享对话和创建智能体,基本都是智能问答的变体,没有更加多样的功能。
通知,主要展示发布帖子收获的点赞、关注和评论。
2. 豆包
豆包,一进来是智能问答页面,点击返回,将回到主菜单,主菜单包含对话、发现、创建、通知、我的。
对话,展示最近的智能问答对话和一些常用的智能体。
发现,针对不同场景的智能体,并且点击创建可以自定义智能体,基本都是智能问答的变体,没有更加多样的功能。
通知应该就是展示一些系统通知或者一些需要时间模型生成的完成通知。
3. Kimi
Kimi,主菜单只有一个智能问答,智能体也隐藏在侧边栏,而且手机端不能自定义创建智能体,有微信的味道了,怎么简洁怎么来。
4. 通义千问
通义千问, 主菜单包含助手(智能问答)、工具、角色、巴黎2024。
助手,主要功能是智能问答,但多了奥运信息和每日新鲜事。
工具,其实就是不同类型的智能体,不同的是官方为了鼓励用户创建不同类型的智能体,用一百万作为激励,还会提供一些雅思口语、托福口语等专业智能体。
角色,创建不同的角色,可以给它对话聊天,官网还提供打造专属角色,如东方神话-十二生肖系列,通过抽卡的方式抽取不同有趣的角色。
巴黎2024,官方主推的智能体,如全民舞台,可以导入视频,视频中人物可以替换成自定义的人物;追星星的AI,关爱孤独症儿童的AI绘本,可自定义主题,生成AI绘本。
5. 讯飞星火
讯飞星火的主菜单有对话、智能体、空间、我的。
对话,包含星火对话、语音畅聊、日常提醒助手和一些智能体,智能体包括数学答疑助手、星火合同助手、讯飞晓医、讯飞公文、讯飞绘文、晓知、讯飞翻译机、讯飞智文、写作助手。
针对这些智能体,讯飞不只是一个输入框简单的智能问答,它针对了这些场景,进行深度的挖掘,做成了一个个小程序一样。
比如讯飞绘文,简直是自媒体工作者的福音,里面有选题库、灵感库,可以直接找到最热最火的选题,然后生成文章,并且提供AI配图,在线编辑完成后可以一键同步到百家号、微信公众号、头条号,而且还提供数据看板功能,可对这三个平台的用户量、阅读数、总收益进行直观的查看分析。
还有讯飞录音笔,这个属于科大讯飞的优势了,支持AI录音、同声传译,开会、出国旅游必备,识别准确率还是挺高的!
智能体,包含星火应用和应用广场,很丰富,移动端就可支持自定义创建智能体。
空间,里面可保存文档、图片、音视频,不管是AI生成的还是自己手机上传的,都可以在这里统一查看和管理。
我的,包含自己创建的待办、实时信息流、我的声音、我的智能体。
6. 天工
天工的主菜单有主页和我的,但是主页又分成了对话、搜索、音乐、智能体四个子模块。
对话、智能体,主要功能有智能问答和一些常用的智能体,主要分为创作、职场助手、图像、高考助力、校色效率、生活娱乐、研究分析、其他,里面主题还是蛮丰富的,移动端不能自定义智能体,需要通过网页端。
搜索,功能和交互类似百度,搜索框+信息流,但好的就是解决过滤掉了广告,搜索分为简洁、增强、研究。
简洁模式就是第一条回答是通过AI,AI会简单的进行回答,然后会将回答相对较好的网页答案给展示出来,增强模式会参考更多的内容,利用AI将答案进行拆解整理分析处理,展示大纲、思维导图,还可以直接将内容生成ppt,最后显示参考的相关网页内容。研究相比增强来说,内容整理更加专业,也去掉了参考的相关网页内容。
这个搜索给好评,我发现真的,自从有了智能问答之后,很少会用百度了,百度广告是真多!!
音乐,这个是天工创新的点,有别于其他智能问答app的,而且还专门开发了微信小程序天工AI写歌,可以根据一些关键词,选择对应的曲风,就可以快速的生成一首歌曲,我以《自由》为主题,一套词,会生成两种曲风的歌,词说实话写的还凑合,比较直白简单粗暴,曲的话我觉得还不错,有前奏、间奏、主歌、副歌,前奏是女生独唱,主歌换成了男生,曲子动感也不单调,乐器的使用也很丰富。
三、智能问答能力
1. 文字回答
1)语境辨析
问题:张三打了李四一巴掌,李四对张三说:”你是不是没吃饭”,李四说这句话含义是?
答案:表达张三打的轻了
从标准答案上看,文心一言回答的最好,敢于给出自己的答案,并且更接近人的分析,豆包、讯飞星火、Kimi、通义千问、天工只是分析,不给答案,让用户自己分析。
2)数学运算
问题:用5个1怎么计算得到6?
答案:(1+1)*(1+1+1)=6
从标准答案上看,文心一言和讯飞星火答案准确,其他都回答错误,文心一言和讯飞星火从回答的简洁和理解相对容易得角度上,文心一言较好,讯飞星火感觉把简单的问题复杂化了。
3)脑筋急转弯
问题:爸妈结婚了,为什么不邀请我去参加婚礼?
答案:那个时候你还没出生,怎么可能邀请你。
这个问题就是脑筋急转弯,文心一言和豆包知道这是个脑筋急转弯,因此直接给出了答案,更像人的反应。而讯飞星火、Kimi、通义千问、天工理解成了正常的问题,针对不同的场景给出了分析,不能说不对,只是说没有理解这个问题的本质。
4)实时热点
问题:美国最新的总统最有可能是谁?
答案:结合热点分析民主党的哈里斯和共和党的特朗普支持现状,以及提到退出竞选的拜登。
除了天工、讯飞星火,其他回答的都回答的相对正确,因为是不确定的一件事,AI只会给到分析,不会给到一个确切的答案,文心一言分析回答相对比较全面,豆包次之,最有意思的我觉得是Kimi,会结合国外的预测模型和博彩网站的赔率,来侧面反应胜率高低。
5)和自己产品有关的问题
问题:百度的文心一言、字节的豆包、腾讯的Kimi、阿里的通义千问、科大讯飞的讯飞星火、昆仑万维的天工哪个能力最强?
答案:正确的分析出各自的优势即可。
这个问题下,要批评一下天工和讯飞星火,让你全面介绍呢,不是让你借此宣传自己产品呢,其他的回答的都还不错,还是文心一言介绍的相对比较全面,挺有意思的是Kimi,哈哈,我狠起来连自己都批评【但在信息检索测试中,引用的文章发布时间有些杂乱,包含较早的文章】
2. 文生图
问题:帮我画一个骑摩托车的孙悟空,Q版。
Kimi不支持文生图,其他都可以,至于最后生成的结果来看,我人为豆包生成的最好,而且一下生成了4张,供用户挑选,文心一言、通义千问、讯飞星火的有点抽象了~
3. 图像识别能力
问题:里面有几个人,男生和女生各有几个?
答案:10个人,5男5女
文心一言:根据图片内容,里面有十个人。具体来说,男生有五个,女生也有五个。这些人都聚集在海滩上,跳跃着,似乎正在享受快乐的时光。所以,回答你的问题:里面有十个人,男生五个,女生五个。
讯飞星火:图像中有九个人,其中男生有六个,女生有三个。
通义千问:图片中有9个人。由于图片是剪影效果,无法确定具体性别,但可以大致看出有男性和女性的身形差异。
天工:在图中,有四个人物,包括两个男孩和两个女孩。他们看起来都玩得很开心。
这张图其实蛮有难度的,因为是背光,人脸识别难度大,豆包和Kimi不支持图像识别,其他软件都支持,从结果上看,文心一言最准确,而且还说明了人物的状态。讯飞星火、通义千问、天工虽然回答了,但是数量和男女都不对。
4. ppt
问题:帮我生成一个科技公司新人试用期汇报ppt
除了讯飞星火,其他产品都不具备直接生成ppt的功能,只能生成ppt大纲,虽然生成的ppt里面的字有些错乱,也没有相关配图,但聊胜于无,做ppt的小伙伴们都知道,做ppt最难的就是内容和排版找配图,内容现在大家生成的大纲基本都能满足需求,就是再优化一下排版和配图,或者内容图片我找好上传给我一个一键排版,绝对能极大的增加用户的工作效率。
5. 视频生成
除了讯飞星火,其他软件端暂时都不支持文字转视频功能,都只能生成视频脚本。
还可以根据自己定制形象,生成想要的视频效果,我自己生成下,然后输入一段两小儿辩日中的一些文字,文字表达和嘴型兼职一模一样。
四、总结
从功能层面上,功能丰富度和可玩性这方面来看,通义千问和天工有点意思,较强的娱乐属性;
从智能体上,我觉得最强的应该就是讯飞星火,支持视频、ppt生成,功能的深度和体验上不像是一个智能体,都可以单独做成小程序或者app;
很多人其实只用智能问答,用不上其他功能的话,但从界面上看,Kimi最简洁直接。
从AI智能问答能力上看,语境辨析、数学运算、脑筋急转弯、时事热点、和自己有关的问题上看,文心一言的能力相对较强,对于文生图看,豆包较强。
其实文心一言对于文字的处理能力强,也在意料之内,因为AI要智能,肯定是基于海量的数据训练,而百度作为搜索的入口,拥有海量的用户数据,这对于AI能力的提升有很大的帮助。
对于AI,我觉得现在的AI的软件其实是泛场景化的,针对不同的场景提供各种AI的能力,但是不同场景的用户有不同的使用需求和痛点,需要去深挖和研究,就像天工针对音乐这块的能力,这个就是它的亮点,降低音乐制作的门槛,提供音乐制作的效率。
还有我上面提到的ppt,其实已经有专门的网站,但是效果还是差强人意,如果真的可以通过一些文字直接生成一个高档上的ppt,或者我导入ppt给我一键排版,生成想要的配图,真的能解决用户的一大难题,商业价值也是巨大的。
各家其实都有各家的优势所在,如果用户想体验还要下载不同的app,我觉得最近周鸿祎联合16家大模型组成统一战线,一起发挥各自大模型的优势,一起为用户服务这个行为,值得点赞,大家共同发展,一起为了国产AI崛起而努力。
作者:晨阳产品笔记前阿里系高级产品经理,专注G端产品设计,公众号“晨阳产品笔记”。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!