GPT-3.5(ChatGPT)训练和部署成本估算

news/2024/4/20 20:45:41/文章来源:https://blog.csdn.net/qq_31765191/article/details/129860244

因为ChatGPT(GPT-3.5)未正式公布参数量,暂时按照1750亿参数计算。
后续其他模型公布参数量后,可按参数量线性比例估算相关数值。

以下数值仅为理论估算,可能和实际数值相差很大,敬请谅解。

一、GPT-3.5磁盘占用估算

不同模型之间,磁盘、参数量可以按线性关系粗略估算;
yolov5x:参数量87.6M,磁盘占用166M
175B/87.6M = 1751024/87.6 = 2046
GPT-3.5磁盘占用估算:166
2046/1024 = 332G
所以GPT-3.5模型大小约为332G。GPT-3.5参数量是YOLOV5X参数量的2046倍。

二、GPT-3.5用于推理时显存占用估算

显存占用估算方法参考:https://blog.csdn.net/weixin_49305813/article/details/119179849
显存占用=模型显存(参数)+batch_size×每个样本显存(输出和梯度动量)
GPT-3显存占用:17510244 /1024 = 700G (参数为32float,占4个字节)
需要A100数量:700G/80G = 9块A100
所以,GPT-3.5仅做推理时,空转显存占用约700G,需要大约9块A100(80G)显卡。

考虑用户访问模型:
国信证券测算称,训练阶段每个Token的训练成本约为6N(推理成本为2N)。
根据Similarweb的数据,23年1月份当前ChatGPT日活约1300万人,每人平均1000字左右的问题,因此合计产生约130亿字(173.3亿个token)。假设24小时平均分配任务,需要的算力为
173.3亿21750亿/(51%24小时3600秒)=173000000002175000000000/24/3600/0.51/1000000000000000
=137 PetaFLOP/S
由于访问流量存在峰值,假定访问峰值是一天均值的5倍, NVIDIA 80GB A100 GPU理论算力是 0.312 PFLOPS。
需要A100显卡数量 137*5/0.312 = 2195块
所以,大约需要2195块A100可以满足日活约1300万人访问需求。

三、GPT-3.5训练使用的显卡数量估计

据OpenAI团队发表于2020年的论文《Language Models are Few-Shot Learners》,训练一次1746亿参数的 GPT-3模型需要的算力约为3640 PF-days。
如果是 NVIDIA 80GB A100 GPU, 理论算力是 312 TFLOPS,Megatron 利用 tensor parallel 和 pipeline parallel 并行技术能达到 51.4% 的利用率,也即是每秒能完成 0.160 PFLOPS。
一张A100卡需要跑3640/0.16 = 22750(天)
按照1个月的训练时间计算,需要A100卡数量估计 = 22750/30 = 758 (块)
据悉,训练Meta AI的OPT-175B使用了992张80GB的A100 GPU,每个GPU的算力达到了147 TFLOP/s。
所以,综合以上信息估计完成一次训练,A100卡的用量需求大约为1000块。

四、租赁价格估计

显卡(NVIDIA 80GB A100 GPU)的租赁价格为 1.5 刀每小时
综合上面的访问和训练用A100数量:2195+1000=3195;
还需要考虑并行训练、测试等用卡量,总体按10000块A100估计。
10000块A100一天的租赁费用:10000 * 24 * 1.5 = 360000刀 = 36万刀
注:以上未考虑英伟达对OpenAI的优惠价格。

五、其他机构预测(感觉比较离谱)

3月7日消息,市场调查机构TrendForce公布的最新报告指出,如果以英伟达A100显卡的处理能力计算,运行ChatGPT将需要使用到30000块英伟达GPU。
调查机构TrendForce在报告中指出,预估ChatGPT需要20000块显卡来处理训练数据。随着OpenAI继续在商业上部署ChatGPT和该公司的生成式GPT模型,可能需要超过30000块显卡。
目前英伟达 A100 显卡的售价在10000-15000美元之间,该售价取决于OpenAI需要多少显卡,以及英伟达是否会为AI公司提供订单折扣。TrendForce预估英伟达可以赚取超过3亿美元(IT之家备注:当前约 20.82 亿元人民币)收入。
ChatGPT训练阶段总算力消耗约为3640 PF-days(即1PetaFLOP/s效率跑3640天)。据普超资本微信公众号,GPT-3训练成本预计在500万美元/次。

六、参考

在这里插入图片描述

以GPT-3 175B为例,说明PF-days和flops的等量关系;
3.64E+03 PF-days=3640 * 1000 * 1000* 100010001000243600 = 3.14E+23 次浮点运算

NVIDIA 80GB A100 GPU 理论算力参考:
在这里插入图片描述

Megatron 利用率 参考:
GitHub - NVIDIA/Megatron-LM: Ongoing research training transformer models at scale
在这里插入图片描述

显卡租赁价格参考:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_296.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT是风口吗?爆火后的质疑猝不及防

作者观:首先要明确一点,ChatGPT代替不了人类,不要抱不切实际的期望。作为一款由OpenAI开发的人工智能聊天软件,该程序在一些人的眼里具有革命性的意义。有人说,这玩意儿可以在一夜之间让无数人失业,也有人将…

为什么要学习Python呢?有了 ChatGPT 还有必要学习 python 吗?

为什么学习Python呢? 学习 Python 的原因有很多,以下是一些常见的原因: 简单易学: Python 是一门易于学习的编程语言,语法简单、清晰明了,可以快速掌握基本的编程概念。应用广泛: Python 是一…

解锁ChatGPT超高级玩法,展示动态图片,纯干货分享!

文 / 韩彬(微信公众号:量子论)这段时间在玩ChatGPT,总是文字,我有点玩腻了,突然想让ChatGPT返回一张图片,可是它却答复:很抱歉,作为一个语言模型,我无法展示图…

ChatGPT: History is temporarily unavailable. We‘re working to restore this feature as soon as possib

ChatGPT聊天记录不可用?界面左侧栏History is temporarily unavailable. Were working to restore this feature as soon as possible.试试这个由于最近有ChatGPT用户爆出自己的历史聊天记录显示不是自己的,这很可能是一次数据泄露的BUG,目前…

科大讯飞刘聪:由ChatGPT浪潮引发的深入思考与落地展望

近期,以“生成式人工智能”(Generative AI)为核心技术的聊天机器人ChatGPT火爆全球。百度、阿里巴巴、科大讯飞、360等国内企业纷纷抛出ChatGPT相关进展,打造中国版的ChatGPT。 科大讯飞此前在投资者互动平台表示,Cha…

什么是ChatGPT ?以及它的工作原理介绍

ChatGPT 是 OpenAI 的最新语言模型,比其前身 GPT-3 有了重大改进。与许多大型语言模型类似,ChatGPT 能够为不同目的生成多种样式的文本,但具有更高的精确度、细节和连贯性。它代表了 OpenAI 大型语言模型系列的下一代产品,其设计非…

GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结的时代到来了?

ChatGPT 点燃了科技行业的明灯,GPT-4 能燎原吗? 谁能革得了 ChatGPT 的命?现在看来还是 OpenAI 自己。 人们一直在探讨AI下一步的发展方向是什么,特别是在ChatGPT引爆科技领域之后。许多学者认为,多模态技术将成为未…

我对ChatGPT的一些看法与思考

我对ChatGPT的一些看法与思考 文章目录我对ChatGPT的一些看法与思考1.什么是ChatGPT1.1 ChatGPT是干啥的1.2 ChatGPT的发布时间1.3 ChatGPT的图标2.ChatGPT的同类程序以及ChatGPT的优越性2.1 ChatGPT的同类程序2.2 ChatGPT相较于其他的优越性2.3ChatGPT已经开源的部分代码3.我对…

一块GPU搞定ChatGPT;ML系统入坑指南;理解GPU底层架构

1. 跑ChatGPT体量模型,从此只需一块GPU 在发展技术,让大模型掌握更多能力的同时,也有人在尝试降低AI所需的算力资源。最近,一种名为FlexGen的技术因为「一块RTX 3090跑ChatGPT体量模型」而获得了人们的关注。 虽然FlexGen加速后的…

大战谷歌!微软Bing引入ChatGPT;羊了个羊高·薪招纳技术人才;Debian彻底移除Python2;GitHub今日热榜 | ShowMeAI资讯日报

👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩韩信子 🎡 『微软Bing』将引入 ChatGPT,与 Google 一场大战难免 微软计划2023年3月底之前推出 Bing 搜索引擎的新版本,使用 ChatGPT …

ChatGPT目前存在四大严重设计问题, 全面使用前需要注意OpenAI正在努力解决

随着 Make-A-Video、ChatGPT、PaLM 和其他大型语言模型获得如此多的关注,重要的是要记住这些模型存在严重的设计问题。 ChatGPT 最近很火。人们一直在使用它来完成各种任务——从撰写销售电子邮件和完成大学作业,甚至作为 Google 搜索的可能替代品。将其与其他大型语言模型(…

ChatGPT技术

目录一、什么是ChatGPT?二、ChatGPT的技术背景三、ChatGPT的主要特点四、ChatGPT的工作原理五、ChatGPT为何成功?一、什么是ChatGPT? ChatGPT本质是一个对话模型,它可以回答日常问题、进行多轮闲聊,也可以承认错误回复…

【我用ChatGPT学编程】Vue-Router中history模式Nginx部署后刷新404的问题

前言 作为一个码农我们都知道ChatGPT实际上是一个十分好用的代码工具,它使用了MarkDown语法更符合我们的习惯,并且可以根据语义理解问题并且给出多种解决方案,所以这个系列就是用ChatGPT来给出对于在coding时遇到的各种Bug。 ChatGPT似乎可…

不仅仅是ChatGPT:分享一些AI时代的有力工具

本文已发表在哔哔哔哔-不仅仅是ChatGPT:分享一些AI时代的有力工具 前言 可以说AI技术在2022年底是一个技术奇点,完成突破之后,我们可以预见一个技术爆炸的时代。 在计算机的早期,人与计算机的交互只有键盘,是鼠标和G…

上知天文,下知地理,还能替人写脚本!人工智能的进阶ChatGPT

ChatGPT是OpenAI在11月30日推出的聊天机器人,于12月1日起对公众免费开放。 自从这东西出来之后,大家对此的讨论热情越发浓烈。ChatGPT具体可以干些什么? 帮你写论文、检讨书、情书,甚至情诗也能信手拈来。 以上都是网友测试它写…

文心一言发布!【中国版ChatGPT】附测试链接

文心一言是百度推出的生成式对话产品,2023.3.16正式发布12。它基于文心大型模型技术,被外界誉为“中国版ChatGPT” 文心一言测试链接: https://cloud.baidu.com/survey_summit/wenxin.html 文心一言与Chatgpt对比 文心一言在中文的支持方面…

New bing带着chatGPT来啦

话不多说,随着chatGPT的到来,GPT-4的升级,AI时代真的要来啦。现在微软浏览器 bing 已经接入最新的GPT版本,而且是免费,重要的事情说三遍,免费使用GPT,免费使用GPT,免费使用GPT&#…

chatGPT和文言一心,我的看法

最近,ChatGPT-4和百度的文心一言,确实很火啊,尤其是下面的这个图,简直火遍了全网。 先说下,这类模型的一些看法。 1. 技术优势:这两个模型都采用了最先进的自然语言处理技术,如深度学习、神经网…

35岁找工作,我求助了ChatGPT。这是ChatGPT给出的建议

最近网上很多热议中年人找工作遭遇歧视的问题。正好碰到ChatGPT热火朝天,帮大家问一下,大家看看你觉得这各答案还凑合吗 ?chatGPT是这么回复的:当您寻找新的工作时,以下是一些建议:完善您的简历和求职信&am…

全网最详细中英文ChatGPT-GPT-4示例文档-从0到1快速入门翻译编程语言应用——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门翻译编程语言应用场景Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例其它资料下载ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字&am…