GPT-4和ChatGPT效果对比,差别太大了

news/2024/4/28 15:50:51/文章来源:https://blog.csdn.net/xixiaoyaoww/article/details/129605337

文|Serendipity@知乎

f8766ce2a81be54aa144c563a1daec87.png前言967d990b27da7c4169affb12a43118e7.png

GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~

9408727260144c54ad816808ab7c5e12.png

附 GPT-4 能力测试站(直接注册即可,无需魔法):

https://gpt4test.com

附 ChatGPT 能力测试站:

https://wowchat.cn

2ab09075ef6c62840ebe040ac42abd48.png测试一:文本真实性646f14b0c470a2b57daeca410b18daf7.png

GPT-4

还是我最喜欢的老问题——“林黛玉倒拔垂杨柳”

3a9cb203eae05cac57c8961f45bb8dcf.jpeg

GPT-3.5(即ChatGPT )

f82891219583d5876bf6e97ceae42fb6.jpeg

可以看出两点:

  • 关于第一个问题,GPT-4 的文字描写更好了

  • 关于第二个问题,GPT-4 应该加入了更多的知识,立马判断“但在原著中,并没有提及她在游园时倒拔垂杨柳这个情节。”,诈骗属性减少了些——GPT-4 比 GPT-3.5 更可靠。

此外,其在微积分以及司法考试上提升巨大。

3c1ba1551b79acbfac68244d66254177.jpeg

656f59f3fb06f8fa37bdfa5fd05bf2a2.png测试二:可靠性3152443cc7aef1ac8f3028a073924c7c.png

经典问题:西红柿炒螺丝钉这道菜怎么做?

GPT-4

207afd1513486793f7cec31b895522e5.jpeg

GPT-3.5(即ChatGPT )

1852410bd67f2512672f9aaef9e118c6.jpeg

可以看出,GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。而且,交互也更有创新型,给出了“推荐一个类似的美食”的回答。ChatGPT 则是回答 “西红柿炒螺丝钉是一道传统的中国家常菜”。对于中文的理解能力和回答能力上升不少,逻辑能力有所提升。

fa9836e07f00dbb676a4c16769c27e72.jpeg

dcd729925c4a5b8f0a7c009ebc89cca1.png测试三:数学能力ebd3d5c54edccba2b6e2c1bae0e859b9.png

简单测试了一个问题,可以看出GPT-3.5(即ChatGPT )的解题能力明显不如 GPT-4。

GPT-4

01c423a6bc5c463ab49497da2e50125c.jpeg

GPT-3.5(即ChatGPT )

8e76264d03e6df466555f38bcf56ac89.jpeg

很明显 GPT-4 做对了,而 ChatGPT 直接错了。

GPT-4 微积分

02d2a987bc6262c9d2993b93db53fb66.jpeg

76b7a225a29ed4a9d2fb0fb6dc56d0aa.png测试四:多模态e613a3d6ba4494d988ba04325e488cad.png

GPT-4 可以接受文本和图像提示,这与纯文本设置并行,允许用户指定任何视觉或语言任务。但是,因为现在用户还没法输入多模态信息,只能输入文本信息。所以我找了官网给出的样例来说明下这部分改动,也是 GPT-4 相对 ChatGPT 最强大的变化了。

图片解释

简单点说,就是输入一组图片,并且输入一个问题“解释图片内容,笑点是什么?”

9fa52a3b7e269f6d6a7bd225950c020a.jpeg

论文阅读

通过解析图片信息来总结分析论文内容

b99e8f80b80733de90797dabcf80a1b8.jpeg

做题能力

做题能力大幅增强,小镇做题家哭泣/(ㄒoㄒ)/~~

6c7dcfbdf5eed385927866daab9674c5.jpeg

670151ecd490e3c0df043e0291cef23a.png测试五:绕过能力5390e98aec581e4a7cca0281799f43e1.png

GPT-4

7baaa1fa96fadf30ccf8a56f6e160951.jpeg

GPT-3.5(即ChatGPT )

d07cd7a3c6dd126064c36e417d7dd374.jpeg

敏感信息屏蔽能力大幅度增强

e7415bbd7342fa83e1f20638ec54d6b9.png

46c834a031519c7d3438611af12ce79e.png总结b69a3176b58cb38010717288b7c9dc1b.png

因为 GPT-4 刚出的缘故,我也只是粗略测试一下。目前看来,能力确实提升不少,可惜的是多模态功能用户暂时无法使用。之后会再找更多些例子来测试下的,谢谢~

公众号“夕小瑶的卖萌屋”后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_247.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT平替版本推荐以及试用体验

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

免费chatGPT国内镜像,目前可访问

安利几款测试过的,chatgpt国内镜像网站,无需魔法和注册即可使用。 免费学习测试https://chat1.wuguokai.top/lite/chatgpt/?mchannel-web&vFullscreen&options%7B%22hideWidget%22%3Atrue%2C%22config%22%3A%7B%22enableReset%22%3Atrue%2C%22e…

特制自己的ChatGPT:多接口统一的轻量级LLM-IFT平台

©PaperWeekly 原创 作者 | 佀庆一单位 | 中科院信息工程研究所研究方向 | 视觉问答项目简称:Alpaca-CoT(当羊驼遇上思维链)项目标题:Alpaca-CoT: An Instruction Fine-Tuning Platform with Instruction Data Collection an…

CVPR2023论文速递(2023.3.23)!已接入ChatGPT总结!共26篇!

整理:AI算法与图像处理CVPR2023论文和代码整理:https://github.com/DWCTOD/CVPR2023-Papers-with-Code-Demo欢迎关注公众号 AI算法与图像处理,获取更多干货:大家好, 最近正在优化每周分享的CVPR论文, 目前考虑按照不同类别去分类…

ChatGPT详解

导读:ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large Language Model)效果能好成这样;惊醒是顿悟到我们对LLM的认知及发展理念,距离世界最先进的想法,差得有点远。我属于既惊喜…

【JAVA】让 ChatGPT 来浅说 AQS

前言又迎来了一年一度的金三银四,虽然说今年的大环境不好,但是招聘还是在火热进行中。面试过 Java 工程师的小伙伴都知道,Java 中的 AQS 是面试高频题,面试官上来就直接了当地问,AQS 知道是什么吧,来讲讲它…

使用 ChatGPT 生成完整的 Node.js API

借助由 OpenAI 训练的大型语言模型 ChatGPT,我们可以创建一个根据我们的特定需求量身定制的 Chrome 扩展程序,并且可以帮助简化我们的日常任务,而无需我们自己编写一行代码。让我们看看这是如何工作的……在此分步指南中,我们将向…

中科大学术ChatGPT镜像

中科大学术ChatGPT镜像 中科大学术版ChatGPT镜像,论文代码一套流,仅限群里使用:https://huggingface.co/spaces/cfwef/gpt ,如果想要分析给他人,请自行克隆部署。 之前在我这购买过付费版镜像(原镜像暂未恢…

ChatGPT技术解构

ChatGPT的训练主要分为三个步骤,如图所示: Step1: 使用有监督学习方式,基于GPT3.5微调训练一个初始模型;训练数据约为2w~3w量级(根据InstructGPT的训练数据量级估算,参照https://arxiv.org/pdf…

全网最详细中英文ChatGPT-GPT-4示例文档-从0到1快速入门语法纠正应用——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门语法纠正应用场景Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例其它资料下载ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字&#x…

已解决chatgpt报错出了些问题。如果此问题仍然存在,请通过我们的帮助中心 help.openai.com 与我们联系。

已解决chatgpt报错出了些问题。如果此问题仍然存在,请通过我们的帮助中心 help.openai.com 与我们联系。 文章目录报错问题报错原因解决方法千人全栈VIP答疑群联系博主帮忙解决报错报错问题 粉丝群里面的一个小伙伴遇到问题跑来私信我,想用chatgpt&am…

【原创】什么是chatGPT?Unity结合OpenAI官方api实现类似chatGPT的AI聊天机器人

一、什么是ChatGPT 最近chatGPT爆火,网络铺天盖地的各种文章视频,各种牛逼之声。倒算不上第一时间使用,发布隔了一周多,才从同事那里听说了这么个神奇的技术。这周阳了,持续发烧在家,忙着养病也没时间去了解…

ChatGPT 在做什么… 以及它为何发挥作用?最新关于ChatGPT的论文速递

作者:Stephen Wolfram,发表于 2023年2月14日原文链接:https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/文章字数:约 3.4 万字 —— 建议先点赞、收藏后阅读……ChatGPT 能够自动生成一些…

ChatGpt 让你的编程更简单 - Get More Done in Less Time

1 引言“AI will not replace your job, people who using AI will” - twitter userChatGpt不必多说了,一句话总结:”YYDS“。最近探索了一下在Code方面它能从哪些方面帮助我们,目前为止对我来说,具体有这么几个方面:…

ChatGPT几个有趣的玩法

文章目录1、开启一个VM2、以……的风格发文3、自动写代码用脚本编写一个多进程ping主机的程序3、用chatGPT学习loki4、客制化脚本生成一个自动建立软连接的脚本5、vscode 插件1、开启一个VM 在caht中输入一下内容 I want you to act as a Linux terminal. I will type comman…

chatgpt-4生成代码,看这一篇就够了

chatgpt-4生成代码,看这一篇就够了cursor示例pythondbscan 聚类voronoi 图像分割手写数字识别圆柱绕流matlab表白程序常微分方程常微分方程组2048小游戏C/C正则表达式匹配删除有序数组中的重复项n 皇后问题总结今天发现一个OpenAI的partnership基于gpt-4开发的好玩的…

ChatGPT成精了

ChatGPT 是OpenAI 发布的一个全新的聊天机器人模型。它到底有多厉害呢?我注册后体验了一下,你会感觉背后有个真人跟你在聊天。例如: 代码不仅可以运行,还特么有每行带有中文注释,这完全是降维打击StackOverflow。 再来…

ChatGPT | 分享论文 Rebuttal、Review 时可能会用到的 Prompt

ChatGPT 可以帮助润色学术论文,助力搞科研! 论文 Rebuttal, Review 过程中可能使用的一个 Prompt: Prompt:I want you to act as an English translator, spelling corrector and improver. I will speak to you in any language…

技巧|使用Chatgpt练习多种类型口语

练雅思口语——其实练什么语言、什么形式的口语都可以。 ChatGPT作为一款聊天机器人,自然可以用于对练口语——只要你的输入和它的输出都变换为语音的形式即可。 一、语音插件 首先,谷歌搜索voice control for chatgpt,点击第一个chrome……

ChatGPT的API接口的模型有多少种?这些模型都有什么功能或者在应用场景上有什么区别?【模型介绍使用与调用接口方法】

OpenAI 的 API 接口提供了多个 GPT-3 模型,每个模型针对不同的应用场景和任务进行了优化。以下是目前可用的 GPT-3 模型: davinci: 这是最大和最全面的模型,具有最高的准确性和灵活性,用于多种自然语言处理任务,如文本生成、对话系统、翻译等。 curie: 这个模型比 davin…