一文谈谈文心一言对比ChatGPT4.0的差距

news/2024/4/28 5:28:19/文章来源:https://blog.csdn.net/weixin_37766296/article/details/130343403

对于想体验文心一言的朋友,可以进行申请尝试,快速入口

如果想体验ChatGPT的朋友,可以自行fq注册;但是由于现在限制注册并且不稳定,对于不会用梯子不想注册的朋友可以使用这个进行访问,快速入口

关于ChatGPT对我们的帮助,可以参考我往期博客

看到一篇国金证券的研报,其中对GPT4.0、3.5和文心一言做了一组详细测试。

最后立下的结论大致是这样:

从研报结论来看,国金证券说这三算是互有胜负,总体上GPT-4略胜一筹。

不过我仔细瞅了眼对比结果,感觉研报说的还是太委婉了...

尤其是在数字、代码、归纳和推理这些能力,GPT4几乎把文心一言给完爆。

我放一些研报中的案例,大家可以直观感受一下模型的差距~

第一个是简单数学问题,求线性方程组:

文心一言的回答,直接跳过计算流程,给了个错误答案,因为没有流程,连错哪儿都不知道

相比之下GPT4.0把算法流程给讲的比较清楚,也很细节。

重点是国金证券竟然说GPT4.0的Y值算错了,说GPT3.5算的Y=3/7是正确答案,看的我一脸疑惑。

大家看看,难道是我多年不做题,数学退化了?

其次就是文学创作这块,这俩也是有一些差距:

比如写一个刘红发大财的故事,文心一言理解成人物是刘红发

而且GPT4.0在故事的形象度、丰富度和生动度上来说要牛X不少,感觉已经有写小说的潜力了。

文心一言虽然故事也凑合,但细节度方面上看暂时被完爆…

接着看逻辑推理能力。

这环节文心一言又错了,直接顺推说,点了沙拉就一定点了牛排。

而事实上就是纯粹的错误。

GPT4.0给了正确的答案。

此外逻辑推理环节还有一个。

就是问“为什么我总是在最后一个地方找到丢失的物品”。

实际上这是给AI挖了个坑,本质上这是个谬论。

然而文心一言也压根没注意到这个问题,然后说了一通没有逻辑的解释。

而GPT4一开始就说出了问题的本质,“丢失的物品肯定是最后一个地方找到的”。

不过后面的解释我感觉没有必要,属于是明明说对了又强行解释一遍...

不过文心一言也不是完全没有优点,在一些中文类目,他经常会给出一些实操案例。

先不说能不能行,但它起码也算是有自己的特色了,敢于推荐...

比如同样都是问如何赚100万,文心一言给出了一些具体的实操案例,而不是空话,比较有趣。

这估计也和模型的调教方式有关哈。

GPT4在些问题里边回答的就比较像是套用模板,感觉过于死板。

然后就是在投资理财这块,直接问想买一个年化4%的理财,文心一言竟然给了一款具体名称的银行理财(其实是货币基金)

先不说合不合规,货基4%现在是肯定不可能做到的。

目前它最新的7日年化也只有2%左右,我也不知道文心一言哪来的结论。

不会以后问我想看个什么病,然后给我推荐莆田的某医院吧~

相比之下GPT要严谨很多,虽然说的也是空话为主,但涉及金融投资这块GPT似乎都是这个样,没法。

不过文心一言有一个案例挺牛,在揣摩男女情感心思上,这轮赢麻了。

这次是解释“你没有错,都是我的错”这句话,文心一言在男女吵架后对反话的理解完全到位,点赞。

不过后面补充这块就有点瞎扯了,大家自行判断。

而GPT的话,说的就是传统的字面意义观点,显然还是没完全理解我们中国特色表达方式。

但后面GPT也补救了一下,说不能完全确定,要看具体情况,算是挽回一些场子。

总的来说,研报中的测试大概就这些,对比结果一目了然,GPT4.0更严谨,“智商”似乎也更高一些。

不过文心一言在“情商”方面也算能打,有更多中文数据训练的优势,至少对话一些日常问题能应付。

好比GPT更像逻辑思维缜密的直男,而文心一言更像一个心直口快,大大咧咧的人。

只不过面对高难度题目来说,智商明显还不够,毕竟技术差距摆在那,慢慢来吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_102867.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PMP证书备考攻略+PMP知识点汇总

一,考PMP好处多 1.能力提升 大型项目,领导专业团队 2.升职加薪 晋升管理岗,优先升职加薪 3.招投标加分 具有PMP证书,企业招标有加分 4.转型利器 助力转型,拓宽职业发展 5.公司支持 企业鼓励学习,报销费用 6…

C++模板使用

感谢你的阅读!!! 目录 感谢你的阅读!!! 举个例子: template 有什么意义为什么要用模板 与typedef的区别 使用方法 模板:隐式实例化与显示实例化 和非模板函数以及多个模板类…

气传导耳机和骨传导耳机的区别是啥?气传导耳机有哪些优缺点?

本文主要讲解一下气传导耳机和骨传导耳机的区别、气传导耳机的优缺点,并推荐一些目前主流的气传导耳机款式,大家可以根据自身需求,选择自己感兴趣的部分观看。 气传导耳机和骨传导耳机不同点: 气传导耳机和骨传导耳机最大且最根…

什么是 MVVM?MVVM和 MVC 有什么区别?什么又是 MVP ?

目录标题 一、什么是MVVM?二、MVC是什么?三、MVVM和MVC的区别?四、什么是MVP? 一、什么是MVVM? MVVM是 Model-View-ViewModel的缩写,即模型-视图-视图模型。MVVM 是一种设计思想。 模型(Model…

windows安装sqli-labs靶场,两种方式

1、安装phpstudy 官网打不开了,下载地址在这儿https://download.csdn.net/download/weixin_59679023/87711536 双击安装 点自定义安装,选择安装目录,注意目录不要有空格和中文 安装完成启动红框内的两个服务 2、安装sqli靶场 这个包支持ph…

信息收集(三)端口和目录信息收集

信息收集(一)域名信息收集 信息收集(二)IP信息收集 端口是什么 "端口"是英文port的意译,可以认为是设备与外界通讯交流的出口。端口可分为虚拟端口和物理端口,其中虚拟端口指计算机内部或交换机…

关于package.json中版本锁定的方法和问题解决

前置知识:先了解一下package.json和package-lock.json的关系和区别,请看这篇文章 然后我们来说一下改怎么锁定版本? 首先肯定是要把package.json中的 ^ 这个符号去掉,但是如果你只去掉package.json中的 ^那就太天真了&#xff0…

必应,百度,神马头条,搜狗专用站长seo推送工具大全

软件介绍: 百度开始打击滥用api问题,针对这个问题已经开发了拟人推送系列功能,放心使用。 五合一高效推送软件,目前支持百度,神马,必应,搜狗,头条,谷歌六大搜索引擎同步…

优秀简历的HR视角:怎样打造一份称心如意的简历?

简历的排版应该简洁工整,注重细节。需要注意对齐和标点符号的使用,因为在排版上的细节需要下很大功夫。除此之外,下面重点讲述几点简历内容需要注意的地方。 要点1:不相关的不要写。 尤其是与应聘岗位毫不相关的实习经历&#x…

服务提供者 Eureka + 服务消费者(Rest + Ribbon)实战

1、Ribbon背景介绍 Ribbon是Netflix发布的开源项目,主要功能是提供客户端的软件负载均衡算法,将Netflix的中间层服务连接在一起。Ribbon客户端组件提供一系列完善的配置项如连接超时,重试等。简单来说,就是在配置文件中列出Load B…

【手把手做ROS2机器人系统开发二】熟悉ROS2基本命令

【手把手做ROS2机器人系统开发二】熟悉ROS2基本命令 一、上讲回顾 在上一讲开发环境搭建中,我们讲解了如何搭建Ubuntu系统环境和ROS2开发运行环境。 1.Ubuntu系统安装 2.ROS2系统环境安装 二、ROS2核心命令讲解 1、daemon-各种守护进程相关的子命令 查看帮助&am…

【计算机网络】网络命令的使用

文章目录 一、实验目的二、实验工具三、实验要求四、实验过程01 ping 命令的使用应用1:验证本地计算机上是否正确安装了 TCP/IP 协议应用2:测试某个目的主机可达性应用3:键入 ping,查看 ping 的其他参数含义 02 netstat 命令的典型…

可能是最强的Python可视化神器,建议一试

数据分析离不开数据可视化,我们最常用的就是Pandas,Matplotlib,Pyecharts当然还有Tableau,看到一篇文章介绍Plotly制图后我也跃跃欲试,查看了相关资料开始尝试用它制图。 Plotly Plotly是一款用来做数据分析和可视化的…

关于GeoServer发布的wfs服务的精度问题

本周基于arcgis/core组件,利用arcgis api for js 4.22版本加载GeoServer发布的同一数据源的wms和wfs服务,出现了偏移的问题。 分析:同一数据源不同的访问方式,出现了偏移,这是很严重的问题。初步判断为js api加载方式的…

HTB-SecNotes

HTB-SecNotes 信息收集8808端口80端口通过CSRF获取通过二次注入 立足tyler -> administrator 信息收集 8808端口 Windows IIS 10.0 可以从官方文档查看10.0版本可能的操作系统。 80端口 通过CSRF获取 目录扫描发现需要登陆后继续进一步操作啊。 对其进行简单的SQL注入测…

Ubuntu20.04安装CUDA和CUDNN

CUDA是GPU深度学习的运行库,那么cuDNN就是训练加速工具,两者要相互配合使用,所以一般机器学习需要训练引擎(tensorflow-gpu) CUDA cuDNN使用。想不安装cuDNN是不可以的,而且cuDNN版本要和CUDA版本相互搭配。 1、前置工作 查看…

MinIO快速入门

一、MinIO概述 官网地址:http://www.minio.org.cn/ 文档地址:http://docs.minio.org.cn/docs/ MinIO是一款基于Apache License v2.0开源协议的分布式文件系统(或者叫对象存储服务),可以做为云存储的解决方案用来保存海…

uniapp + vue3开发中组合式函数必须是一个同步函数

目录 vue3中的组合式函数用法: 官网示例异步组合式函数:同步函数写法 改造成导出async组合式函数时: uniapp无法使用async组合式函数的原因: vue3中的组合式函数使用时,导出的组合式函数必须是一个同步函数。 vue3…

推荐一个开源的区块链开发者工具网站

开源区块链开发者工具箱 https://ChainTool.tech 今天可以正式上线了。ChainTool 使用完全开源的方式编写一些开发者日常经常使用的工具。 关于 ChainToolDAO 大约在两个月前, ChainToolDAO 成立了,成立 ChainToolDAO 的来由是这样的:我是一…

【14】SCI易中期刊推荐——计算机 | 人工智能(中科院2区)

💖💖>>>加勒比海带,QQ2479200884<<<💖💖 🍀🍀>>>【YOLO魔法搭配&论文投稿咨询】<<<🍀🍀 ✨✨>>>学习交流 | 温澜潮生 | 合作共赢 | 共同进步<<<✨✨ 📚📚>>>人工智能 | 计算机视觉…