火出圈的ChatGPT,如何让安全检测更智能

news/2024/4/26 15:50:39/文章来源:https://blog.csdn.net/olga5abl/article/details/129396969

ChatGPT是什么

ChatGPT(Chat Generative Pre-trained Transformer)是一款美国OpenAI研发的聊天机器人程序,能够通过理解和学习人类语言来进行对话,根据聊天的上下文与使用者互动,真正像人类一样聊天交流。它甚至能完成撰写邮件、视频脚本、文案、代码、论文等任务。

ChatGPT的算法基于Transformer架构,这是一种使用自注意力机制处理输入数据的深度神经网络。Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。ChatGPT使用了GPT-3.5大规模语言模型(LLM Large Language Model),并在该模型的基础上,引入强化学习来微调预训练的语言模型。这里的强化学习采用的是RLHF(Reinforcement Learning from Human Feedback),即人工标注方式。目的是通过其奖励惩罚机制,让LLM模型学会理解各种自然语言处理任务,并学会从helpfulness、honest、harmless三个维度判断什么样的答案是优质的。

ChatGPT模型的主要训练流程如下:

1、首先利用一系列问答对模型进行监督训练(也叫监督指令微调)。

2、利用强化学习对模型进一步指令微调,即模型在给定环境中,不断根据环境的奖励和惩罚,拟合到一个最适应环境的状态。具体来说,就是在人类的参与下训练一个奖赏网络,这个奖赏网络具有对多个聊天回复进行好坏排序的能力。

3、利用这个奖赏网络,进一步通过强化学习不断优化模型。

安全检测怎么做

在安全检测领域,越来越多的企业组织开始使用人工智能技术,来帮助检测网络流量中的潜在威胁。人工智能的优势在于,它可以处理大量的数据,快速准确地识别并分类异常流量。通过训练神经网络模型,人工智能可以自动化检测识别网络攻击、漏洞利用和恶意软件等行为,减少人工干预和误报,提高检测的准确性与效率。

当前主流的网络攻击检测,核心是基于DPI技术,发展出的针对HTTP访问的检测(WAF),以及针对操作系统的入侵防御检测(IPS)。即部署在应用前,在用户请求到达服务端之前对其进行扫描和过滤,分析校验每个用户请求的网络包,确保每个请求的安全有效,对无效或有攻击行为的请求进行拦截或隔离。目前,常用的攻击检测方式如下:

1、签名检测技术。基于事先编写的特定规则或模式(正则表达式)检测网络流量中的威胁,如病毒、恶意软件、入侵行为等。但是由于攻击手段多样化,有经验的黑客可以通过一些语句变化绕过检测。正则表达式是由关键字发展而来的,虽然在一定程度上降低了误报率,但由于正则表达式是基于字符串的过滤,只能检测预定好的攻击行为;针对一些比较复杂的注入方法,同样存在漏报率高的问题。

2、流量分析技术。通过对同类流量的来源IP、协议类型比例、流量上下行趋势等基础元素的建模分析,得到一些异常事件的分析结论。但是流量分析需要对网络流量进行捕获分析,所以需要较高的计算资源和存储资源,会使得整个系统比较庞大。

3、行为分析技术。通过监视网络流量的行为,检测出异常活动。例如,检测出某Web应用服务器访问非业务数据库、突发大量数据流、频繁访问尝试等,进而发现潜在的网络威胁。在这一过程中,会误报一些合法活动(例如临时下载等),且成熟的行为分析模型需要较长时间来训练和学习,因此防护效率可能较低。

4、基于语义的规则匹配。将检测引擎设计成SQL语义解释器或命令行终端,尝试理解用户输入的内容,判断是否有可能构成攻击。目前主要针对SQL注入,使用场景有限。

基于DPI引擎的检测方式,除了有这些使用限制外,还存在多种绕过流量解析引擎进行入侵的方法。例如,利用DPI引擎可能存在的HTTP协议解析缺陷,只识别80端口为HTTP流量,而Web应用端口在8080上,其HTTP流量会被DPI引擎解析为非HTTP,从而绕过应用层攻击检测。

哪些环节可以应用ChatGTP

我们按照DPI引擎的解包流程,将原始流量解析出关键字段数据,进行规则匹配。如果能匹配到规则,则说明报文存在攻击行为;如果不能匹配,则说明报文风险较低。DPI引擎收到的流量如下图:

DPI引擎会按照会话对流量进行分组,在同一个组中的报文,一般为同一五元组的请求响应报文:

DPI引擎会将流量按照协议层级进行拆解,直到解析出所有的字段。

DPI引擎会提取其中应用层的明文请求,作为待检测内容:

ChatGPT作为一种大型自然语言处理模型,可以理解HTTP原始报文信息,这样无论攻击出现在URL、Cookies还是Referer中,都能顺利检测到。

ChatGPT流量检测实践

ChatGPT、New Bing等攻击判断模块,会调用OpenAI相关API接口,使用提问的方式让ChatGPT、New Bing等进行攻击判断,示意代码如下:

import openai
openai.api_key = "sk-Bew1dsFo3YXoY2***********81AkBHmY48ijxu"	# api token 用来认证
def get_answer(prompt, max_tokens): # 定义一个获取答案的函数try:response = openai.Completion.create(model = "text-davinci-003",     # 模型名称prompt = prompt,                # 问题temperature = 0.7,              max_tokens = max_tokens,        # 返回内容的长度限制stream = False,                 # False就是一次性返回, True 就是一个个打出来像打字机, 返回的是迭代器, 需要后面代码处理. 此处没有处理 所以用Falsetop_p = 1,                     frequency_penalty = 0,          presence_penalty = 0           )return 0, response['choices'][0]['text'].strip()    # 获取返回值关键返回内容except Exception as e:                  # 异常处理return str(e), None

通过上述函数,就可以达到类似向ChatGPT提问的效果(使用模型为text-davinci-003),如下图:

ChatGPT会返回明确的是否存在攻击行为的结论以及行为描述,这样就完成了一次攻击判断。

如上图,可以将流量中大量需要判断的请求,分别存入不同的文件,由ChatGPT进行攻击判读,示例代码如下:

def main(read_dir = 'detect'):	# 定义main函数args = []					# 缓存列表global sign_req, all_req	# 识别计数for rf in walk_dir(read_dir, ['.txt']):		# 遍历待检测目录all_req += 1							# 总数据包数自增1content = read_fileA(rf, 'str')[:2048]	# 提取报文文件前2048个字符key_content = content.split('\r\n\r\n\r\n')[0][:1024]	# 提取http请求if len(key_content) < 10: continue						# 如果长度太小就不检测err, sign, disc = judge_attack(key_content, rf_rst)	# 调用ChatGPT接口进行攻击检测if sign: sign_req += 1								# 如果检测到攻击, 攻击计数自增1print('\r' + f' 已检测 {all_req: 4} 个报文, 识别到攻击 {sign_req} 个, 检出率: {sign_req/all_req:0.2%}', end='', flush=True) # 打印结论

如此就可以做到批量报文攻击检测。

攻击样本来自Nuclei对靶机的扫描和全PoC检测,因为有一些请求从单个报文中确实看不出来是否存在威胁。

上述情况可能需要更多上下文才能判断,此次已去除此类无法准确判断的请求例,尽量给一些人工条件下能够准确判断的样例,总体检测结果如下图:

可见ChatGPT对流量检测的准确率是非常高的,基本上相当于一个安全专家进行快速判断,其安全检测能力值得期待。

有兴趣的读者可以查看完整的项目源码,链接为:https://github.com/VitoYane/PcapSplit

未来展望

未来,ChatGPT在网络安全中将扮演什么角色、有什么影响,我们很难进行准确预测,这取决于它的使用方式和使用意图。来自人工智能的威胁并不是一个新问题,对网络安全从业者来说,重要的是及时意识到ChatGPT的潜在风险并采取适当的措施来应对。

安全专家预测,国家背景的黑客将率先在网络攻击中利用ChatGPT,而该技术最终会在更多的攻击组织中得到大规模的使用,防守方需要开始研发能够抵御此类攻击的系统。

从网络安全防护的角度来看,企业机构可以采取针对性的应对措施,对ChatGPT等类似模型进行培训,标记恶意活动和恶意代码,同时对其设置难以绕过的护栏。对于ChatGPT引发的威胁,可以向员工提供新型的网络意识培训,掌握识别社会工程攻击的知识,以便识别ChatGPT等人工智能工具创造的钓鱼攻击。

当然仅仅是这样还不够。ChatGPT等人工智能工具会以比人类罪犯更快的速度制造出新的威胁,传播威胁的速度也将超过网络安全人员的反应速度。企业机构跟上这一变化速度的唯一方法,是使用人工智能来应对人工智能。

总的来说:一方面,网络安全行业的研究人员、从业者、学术机构和企业组织可以利用ChatGPT的力量进行创新和协作,包括漏洞发现、事件响应和钓鱼检测;另一方面,随着ChatGPT等工具的发展,未来开发新的网络安全工具更加重要。安全厂商应更积极地开发和部署基于行为(而非规则)的AI安全工具,来检测人工智能生成的攻击。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_305.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT火爆科研圈,登上《Nature》《Science》正刊

ChatGPT火出圈了&#xff0c;几乎涉及到各行各业的每个领域&#xff0c;科研圈更甚。 《Science》期刊主编H. HOLDEN THORP发表关于ChatGPT的社论&#xff1a; “ChatGPT is fun, but not an author”。 “ChatGPT 很好玩&#xff0c;但不是作者” 文章指出&#xff0c;许多担忧…

盘点一下chatGPT的10个优点

大规模语言培训: ChatGPT是一个大型的语言模型&#xff0c;通过OpenAI进行了大量的训练&#xff0c;因此它能够理解和回答各种类型的问题。 实时回答&#xff1a;ChatGPT可以立即回答您的问题&#xff0c;没有延迟。 准确性高&#xff1a;ChatGPT通过大量的训练&#xff0c;使…

玩转ChatGPT:中科院ChatGPT Academic项目部署与测评

一、ChatGPT Academic简介 最近&#xff0c;以ChatGPT为代表的超大规模语言模型火出了圈&#xff0c;各种二次开发项目也是层出不穷。 比如说今天我们玩弄的这个“ChatGPT Academic”&#xff0c;在GitHub上已经13.7K的点赞了。 项目地址&#xff1a;https://github.com/bina…

ChatGPT 如何应用于决策?Rationale 带你狂飙!

ChatGPT 回答多领域问题的能力之强悍&#xff0c;引发了全球关注。许多人将 ChatGPT 视为对话式 AI 或生成式 AI 发展史上的一个重要里程碑。从 ChatGPT 本身的生产力来看&#xff0c;它可以帮助人们完成很多事&#xff0c;比如写项目申报书、写股票查询代码&#xff0c;甚至写…

【Unity】AI实战应用——Unity接入ChatGPT和对游戏开发实际应用的展望

ChatGPT for unity插件地址: GitHub - sunsvip/ChatGPTForUnity: ChatGPT for unity 用法: 打开Unity PackageManager界面.Add package from git URL粘贴插件地址添加 https://github.com/sunsvip/ChatGPTForUnity.git ——————————————————————————…

国内ChatGPT——阿里GPT如何和获取

如何获得阿里云大模型邀请码&#xff1f;阿里云的 AI 也开始进入企业测试了。您可以使用申请体验来测试此功能。如果没有邀请码&#xff0c;可以获得资格。如果有邀请码&#xff0c;可以直接获得资格并尝试使用。下面将介绍如何获得阿里云大模型的邀请码。 阿里云大模型邀请码…

#中国版chatGPT来了# 2023年开年,

ChatGPT及AIGC概念在全球爆火&#xff0c;引得一系列相关企业股价大幅上涨&#xff0c;市场落在百度、360等搜索引擎身上的目光明显增多ChatGPT是OpenAI开发的人工智能聊天机器人程序&#xff0c;于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并以强化学习训练。…

GPT-3.5(ChatGPT)训练和部署成本估算

因为ChatGPT&#xff08;GPT-3.5&#xff09;未正式公布参数量&#xff0c;暂时按照1750亿参数计算。 后续其他模型公布参数量后&#xff0c;可按参数量线性比例估算相关数值。 以下数值仅为理论估算&#xff0c;可能和实际数值相差很大&#xff0c;敬请谅解。 一、GPT-3.5磁…

ChatGPT是风口吗?爆火后的质疑猝不及防

作者观&#xff1a;首先要明确一点&#xff0c;ChatGPT代替不了人类&#xff0c;不要抱不切实际的期望。作为一款由OpenAI开发的人工智能聊天软件&#xff0c;该程序在一些人的眼里具有革命性的意义。有人说&#xff0c;这玩意儿可以在一夜之间让无数人失业&#xff0c;也有人将…

为什么要学习Python呢?有了 ChatGPT 还有必要学习 python 吗?

为什么学习Python呢&#xff1f; 学习 Python 的原因有很多&#xff0c;以下是一些常见的原因&#xff1a; 简单易学&#xff1a; Python 是一门易于学习的编程语言&#xff0c;语法简单、清晰明了&#xff0c;可以快速掌握基本的编程概念。应用广泛&#xff1a; Python 是一…

解锁ChatGPT超高级玩法,展示动态图片,纯干货分享!

文 / 韩彬&#xff08;微信公众号&#xff1a;量子论&#xff09;这段时间在玩ChatGPT&#xff0c;总是文字&#xff0c;我有点玩腻了&#xff0c;突然想让ChatGPT返回一张图片&#xff0c;可是它却答复&#xff1a;很抱歉&#xff0c;作为一个语言模型&#xff0c;我无法展示图…

ChatGPT: History is temporarily unavailable. We‘re working to restore this feature as soon as possib

ChatGPT聊天记录不可用&#xff1f;界面左侧栏History is temporarily unavailable. Were working to restore this feature as soon as possible.试试这个由于最近有ChatGPT用户爆出自己的历史聊天记录显示不是自己的&#xff0c;这很可能是一次数据泄露的BUG&#xff0c;目前…

科大讯飞刘聪:由ChatGPT浪潮引发的深入思考与落地展望

近期&#xff0c;以“生成式人工智能”&#xff08;Generative AI&#xff09;为核心技术的聊天机器人ChatGPT火爆全球。百度、阿里巴巴、科大讯飞、360等国内企业纷纷抛出ChatGPT相关进展&#xff0c;打造中国版的ChatGPT。 科大讯飞此前在投资者互动平台表示&#xff0c;Cha…

什么是ChatGPT ?以及它的工作原理介绍

ChatGPT 是 OpenAI 的最新语言模型&#xff0c;比其前身 GPT-3 有了重大改进。与许多大型语言模型类似&#xff0c;ChatGPT 能够为不同目的生成多种样式的文本&#xff0c;但具有更高的精确度、细节和连贯性。它代表了 OpenAI 大型语言模型系列的下一代产品&#xff0c;其设计非…

GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结的时代到来了?

ChatGPT 点燃了科技行业的明灯&#xff0c;GPT-4 能燎原吗&#xff1f; 谁能革得了 ChatGPT 的命&#xff1f;现在看来还是 OpenAI 自己。 人们一直在探讨AI下一步的发展方向是什么&#xff0c;特别是在ChatGPT引爆科技领域之后。许多学者认为&#xff0c;多模态技术将成为未…

我对ChatGPT的一些看法与思考

我对ChatGPT的一些看法与思考 文章目录我对ChatGPT的一些看法与思考1.什么是ChatGPT1.1 ChatGPT是干啥的1.2 ChatGPT的发布时间1.3 ChatGPT的图标2.ChatGPT的同类程序以及ChatGPT的优越性2.1 ChatGPT的同类程序2.2 ChatGPT相较于其他的优越性2.3ChatGPT已经开源的部分代码3.我对…

一块GPU搞定ChatGPT;ML系统入坑指南;理解GPU底层架构

1. 跑ChatGPT体量模型&#xff0c;从此只需一块GPU 在发展技术&#xff0c;让大模型掌握更多能力的同时&#xff0c;也有人在尝试降低AI所需的算力资源。最近&#xff0c;一种名为FlexGen的技术因为「一块RTX 3090跑ChatGPT体量模型」而获得了人们的关注。 虽然FlexGen加速后的…

大战谷歌!微软Bing引入ChatGPT;羊了个羊高·薪招纳技术人才;Debian彻底移除Python2;GitHub今日热榜 | ShowMeAI资讯日报

&#x1f440;日报合辑 | &#x1f3a1;AI应用与工具大全 | &#x1f514;公众号资料下载 | &#x1f369;韩信子 &#x1f3a1; 『微软Bing』将引入 ChatGPT&#xff0c;与 Google 一场大战难免 微软计划2023年3月底之前推出 Bing 搜索引擎的新版本&#xff0c;使用 ChatGPT …

ChatGPT目前存在四大严重设计问题, 全面使用前需要注意OpenAI正在努力解决

随着 Make-A-Video、ChatGPT、PaLM 和其他大型语言模型获得如此多的关注,重要的是要记住这些模型存在严重的设计问题。 ChatGPT 最近很火。人们一直在使用它来完成各种任务——从撰写销售电子邮件和完成大学作业,甚至作为 Google 搜索的可能替代品。将其与其他大型语言模型(…

ChatGPT技术

目录一、什么是ChatGPT&#xff1f;二、ChatGPT的技术背景三、ChatGPT的主要特点四、ChatGPT的工作原理五、ChatGPT为何成功&#xff1f;一、什么是ChatGPT&#xff1f; ChatGPT本质是一个对话模型&#xff0c;它可以回答日常问题、进行多轮闲聊&#xff0c;也可以承认错误回复…