ChatGPT必将在文档处理领域大有所为,未来以来,拭目以待【文末送书】

news/2024/4/29 6:53:35/文章来源:https://blog.csdn.net/u014534808/article/details/129822519

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦
💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通
😁 2. 毕业设计专栏,毕业季咱们不慌忙,几百款毕业设计等你选。
❤️ 3. Python爬虫专栏,系统性的学习爬虫的知识点。9.9元买不了吃亏,买不了上当 。python爬虫入门进阶
❤️ 4. Ceph实战,从原理到实战应有尽有。 Ceph实战
❤️ 5. Java高并发编程入门,打卡学习Java高并发。 Java高并发编程入门

文章目录

    • 1. 前言
    • 2.现有图像处理流程
      • 2.1. 图像不清楚咋办?
      • 2.2. 问题图像轻松识别!
    • 3.ChatGPT在文档图像处理领域中展望
      • 3.1. ChatGPT的简介与原理
      • 3.2. ChatGPT在图像领域的展望
    • 4. 总结
    • 5. 如何免费获得ChatGPT相关图书呢?
      • 5.1. 评论获得
      • 5.2. 关注【码农飞哥】抽奖获得

1. 前言

文档处理和图像处理是人们在日常生活中不可或缺的一部分。从商业合同到医学报告,人们需要文档来记录和传递信息。这些文档有时非常复杂,需要花费大量的时间和劳动力来处理。 然而,随着技术的进步,我们已经看到了许多革命性的工具和技术的出现,可以简化文档处理的过程。其中最有前景的是 ChatGPT 技术,它能够自动识别和处理文档中的信息,同时它也可以识别图像并且理解图像表达的信息。本文由现有图像识别领域和文档建模领域的一些突破出发,进而探讨 ChatGPT 技术在文档处理和图像处理中的应用和未来发展趋势。

2.现有图像处理流程

首先,我们需要了解何为图像处理呢?通俗易懂的说就是通过计算机来处理图像,从图像中提取有价值的信息。如下图所示:

在这里插入图片描述

人类可以通过听觉感知(耳朵)来识别语音信号;通过视觉感知(眼睛)来识别图像信号;通过运动感知(手)来识别轨迹信号。

同理,计算机也可以通过相应的技术来处理这些外部信号。计算机可以通过语音识别技术来识别语音信号;通过OCR(Optical Character Recognition,光学字符识别)技术来识别图像信号;通过手写识别来识别轨迹信号(手写信息)。

识别完成之后就可以对识别到的信号进行后续处理,从而提取图像或语音中的文本/结构/语义等信息。

2.1. 图像不清楚咋办?

然而,理想很丰满,现实很骨感,在实际场景中图像识别会存在诸多的痛点和难点。如下罗列了几种常见的图像问题。

  1. 如何处理图像形变(弯曲,折叠,皱等)的问题呢?

手持镜头拍照得到的文档图像往往存在着复杂的几何形变,包括拍摄视角、纸张本身的折叠、褶皱、弯曲以及厚度等因素,都会造成拍摄图像存在畸变。

如下图图片右边发生了折叠,并且拍摄角度倾斜,有无关的区域,对这图像不处理直接去进行OCR识别是比较困难的一件事。

图片折叠

  1. 如何去除图像中的摩尔纹呢?

当我们对着电脑屏幕拍照时,所拍摄的图片会出现彩色的高频率条纹,也就是摩尔纹,如下图所示的图片。该图片不仅仅出现了摩尔纹,而且还存在倾斜的情况,这些情况给图像识别带来了很大的困难。

图片存在摩尔纹

  1. 拍摄的图片模糊不清晰该如何处理呢?

有时候受限于拍摄角度和拍摄光线的影响,用户所拍摄的照片内容非常不清晰,并且图片中还存在污渍,如下图所示:
图片不清晰

2.2. 问题图像轻松识别!

上述图像问题一度让我感到十分困惑,不过近期,我在CSIG企业行-走进合合信息的直播中通过郭老师的讲述了解到, 合合信息是如何通过一系列自研的关键技术来处理这些问题。下图展示了整个OCR识别的过程,即在接收到一张图片之后,扫描全能王所进行一系列操作。

OCR流程图

  1. ROI提取:首先,识别到一张图像之后,将图像分为若干个待提取信息的区域,然后按照区域提取信息。

  2. 形变矫正:针对图像的形变矫正,合合信息采用基于位移场网络学习方法的系统构架,可对形变文档进行智能矫正,包括弯曲矫正与透视矫正,同时智能定位文档边缘,切除多余背景。

  3. 图像恢复:合合信息采用多重神经网络技术,通过分析暗角、摩尔纹的形成原理,对图像中存在的干扰因素进行对应处理,可去除所有样式的摩尔纹,同时保证图像信息完整、颜色不失真。与此同时,通过合合信息阴影处理技术,可以智能消除图像中的阴影,提升材料规范性与后续的识别准确性。

  4. 质量增强:通过增强锐化提升图像质量、突出文字,使之达到清晰可读的效果。

    下面我们可以看下上述三张图片增强之后的效果。
    图片折叠增强

图片去摩尔纹
图片不清晰

  1. 经过上述四个步骤的处理之后,就可以得到能够清晰方便识别的图像,接着就可以对文档进行智能扫描,识别分析,图片转成Word/Excel等操作。
    识别结果

    文档和图像识别的问题解决了,那么将这些技术与ChatGPT结合会碰撞成怎样的火花呢?

3.ChatGPT在文档图像处理领域中展望

3.1. ChatGPT的简介与原理

ChatGPT 是一种基于人工智能和自然语言处理技术的大型语言模型。它的基本原理是使用深度学习算法对大量的文本进行训练,并利用这些训练数据来生成自然语言的响应。

ChatGPT 通过学习大量的数据来获得对自然语言的理解和应用,因此它能够识别并理解文档中的关键信息,然后生成符合人类语言习惯的文本回复。ChatGPT 可以被用于自动化文档处理、对话系统,问答系统,图像识别等场景。

它的原理是基于自回归语言模型(Auto-Regressive Language Model),它是一种基于深度学习的自然语言处理技术,可以用来生成自然语言文本。它使用一种叫做Transformer的模型,它可以训练一个模型来预测下一个词,从而生成文本。

与此同时,ChatGPT还能够通过人类反馈进行强化学习,从而对齐人类指令。

方法总体上包括三个不同步骤:

  1. 预训练语言模型(LM),也就是收集演示数据并训练有监督策略。

  2. 收集数据,训练奖励模型:也就是手机比较数据并训练奖励模型

  3. 使用强化学习对LM进行微调,也就是使用PPO强化学习算法针对奖励模型优化策略。

步骤 1 只进行一次,而步骤 2 和步骤 3 可以持续重复进行:在当前最佳策略模型上收集更多的比较数据,用于训练新的 RM 模型,然后训练新的策略。具体如下图所示:
人类反馈进行强化学习

目前,最新版的ChatGPT-4 已经可以进行图像识别,并且可以完全理解图片,下图的案例中,我们向ChatGPT提问:如果剪断绳子,会发生什么?ChatGPT给出的回答是:“气球会飞走”。这就说明了ChatGPT已经可以做到对图像的识别以及可以对图像进行逻辑分析。

在这里插入图片描述

3.2. ChatGPT在图像领域的展望

那么,我们完全可以合理的展望ChatGPT在未来图像文档领域的广阔作为,我认为有如下几个作为。

  1. 图像分类与标记:未来ChatGPT应该可以对大批量的图片进行分类与标记,用户只需要上传需要分类和标记的图片给ChatGPT,然后通过自然语言告诉ChatGPT按照怎样的维度对这些图片进行分类和标记。比如上传一批美食的图片,可以让ChatGPT按照美食的菜系进行分类,也可以让ChatGPT按照美食口味进行分类。

  2. 智能绘图:用户可以通过语音指令或手绘工具,让ChatGPT帮助创建或修改简单的图像或文档,如流程图、简单草图等,我认为我们还可以上传一张已有的流程图或者其他的UML图,让ChatGPT来检测所上传的图片的语法错误,以及逻辑错误,并做相应的修改。

  3. 图像检索:ChatGPT可以处理海量的视觉数据,并能够将关键字与图像的语义特征相匹配,从而准确地检索相关的图像。

  4. 图像生成:ChatGPT可以基于给定的文本描述生成与之匹配的图像。如生成照片、插图,logo等,未来ChatGPT生成的图像将更加有创意,有内涵。

  5. 图像生文:在不远的未来,ChatGPT必将可以具备看图写文的能力,我们只需要上传一张图片给ChatGPT。然后告诉他需要写一篇什么样题材的文章。ChatGPT就可以给我们生成一篇原创的作文。

4. 总结

本文首先介绍了在图像文档处理领域里的一些最新的进展,然后结合ChatGPT在图像文档领域中的应用场景做了一些展望。
ChatGPT作为划时代的大型语言模型,可以说它真正的实现了人工智能。它通过海量的入参,海量的训练模型,实现了对自然语言很好的理解能力。未来必将实现图生文,文生图,图像分类识别,图像检索等即有用又有趣,更能提高生产力的好功能。

5. 如何免费获得ChatGPT相关图书呢?

为了回馈广大粉丝们的厚爱,帮助小伙伴们更好的了解ChatGPT的使用以及原理。本博主决定给小伙伴们送出共4本【Python机器学习:数据建模与分析 ChatGPT背后的逻辑】。在此特别感谢 机械工业出版社有限公司的赞助,所有图书均包邮包邮包邮!!!!

《Python机器学习:数据建模与分析》,本书采用理论与实践相结合的方式,引导读者以Python为工具,以机器学习为方法,进行数据的建模与分析。本书共13章,对机器学习的原理部分进行了深入透彻的讲解,对机器学习算法部分均进行了Python实现。除前两章外,各章都给出了可实现的实践案例,并全彩呈现数据可视化图形。
在这里插入图片描述

所有获奖用户先三连:评论,点赞,收藏。

5.1. 评论获得

  1. 本文优质评论两条,且该评论点赞数是最高的,分别获得《Python机器学习:数据建模与分析 ChatGPT背后的逻辑》一本!
    如果2条评论点赞数并列第一的,以评论的时间谁早!

5.2. 关注【码农飞哥】抽奖获得

关注【码农飞哥】公众号,私聊博主,博主会随机抽取两个小伙伴,获得《Python机器学习:数据建模与分析 ChatGPT背后的逻辑》。

统计截止时间:2023/04/02 18:00:00

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_219.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT与网络安全的跨时代对话

前言 ChatGPT:是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。G…

爆火的ChatGPT到底能做什么?5分钟带你进入AI的大门

刘润说过:AI不会让你失业, 会使用AI的人, 才会让你失业。ChatGPT不会淘汰你, 能驾驭ChatGPT的人, 才会淘汰你。最近一个月,不管是各大新闻网站,还是朋友圈,ChatGPT都被刷爆了,火爆程度空前,有人焦虑&#x…

「ChatGPT国内首款学术优化工具首发」代码解析、论文润色全覆盖:未来以来,你来不来

♥️作者:白日参商 🤵‍♂️个人主页:白日参商主页 ♥️坚持分析平时学习到的项目以及学习到的软件开发知识,和大家一起努力呀!!! 🎈🎈加油! 加油&#xff01…

建议收藏chatGPT说的编译安装nginx教程

写在前面 这个是当下最流行最时髦的AI神器chatGPT和我一起合作写的一篇通用技术文章,请读者笑纳! chatGPT说 咚咚咚,咚咚咚,嘿嘿;咚咚咚,咚咚咚,嘿嘿;AI等一会,我来发答案…

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。 项目名称:中文LLaMA&Alpaca大语言模型本地部署 (Chinese LLaMA & Alpaca LLMs) 项目地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca 以…

释放 OpenAI 的 ChatGPT API 的力量:使用 Python 轻松进行命令行对话

最近,对话式 AI 变得越来越流行,原因很容易理解。凭借自动执行日常任务、提供客户支持甚至生成创意内容的能力,对话式 AI 正在迅速改变我们与技术交互的方式。OpenAI 的 ChatGPT 是当今可用的最强大的对话式 AI 工具之一,这是一种…

ChatGPT的智能性体现在哪里?就当前的发展路径而言,ChatGPT 还有更好的路可以走吗?

最近 ChatGPT 真的是太火爆了,连我儿子的小学老师都和我在微信上关于这个话题聊了很久。 ChatGPT 的智能性主要体现在它能够处理各种自然语言的问题,并且具备一定的理解、推理和生成能力。在语言理解方面,ChatGPT 可以理解语言的含义和语法结…

无需GPU无需网络“本地部署chatGPT”(更新中文模型)

想当初图像生成从DELL到stable diffusion再到苹果的移动部署过了两三年吧 聊天bot才发展几个月就可以边缘部署了,如果苹果更新silicon,npu和运存翻倍,争取apple watch也能本地内置,最快ios18 mac、ipad、iPhone能内置吧 又是一个平…

手把手教会你如何通过ChatGPT API实现上下文对话

前言 ChatGPT最近热度持续高涨,已经成为互联网和金融投资领域最热门的话题。 有的小伙伴可能需要在公司搭建一套ChatGPT系统,那使用ChatGPT的API显然是最好的选择。 不过ChatGPT的API都是无状态的,没有对话管理的功能。 你调用API发送一个…

文心一言(中国版ChatGPT)内测申请体验

百度十年,汇成一言 文心一言 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮…

用ChatGPT生成openAI全景报告

“云孚科技基于业内领先的自然语言处理、知识图谱、语义匹配、智能写作等技术,打造了云孚开源情报系统YFINT,并结合ChatGPT模型成果,重磅推出OpenAI调研报告。”ChatGPT简介 2022年11月30日,总部位于旧金山的OpenAI推出了其最新作…

干货!​如何打造我们自己的“ChatGPT”?| 大佬思辨

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!火爆全网的ChatGPT究竟是什么?为什么这么强?ChatGPT会取代搜素引擎吗?ChatGPT凸显的能力会是metaverse的有力支撑吗?ChatGPT的火爆背后, AI发展路向何方?2022年12月…

ChatGPT 工具论 我能用它做什么

​ 前言 bing版ChatGPT现在已经可以使用了。试用下来,相较于原版本ChatGPT,更加流畅,数据库也是最新的,在这里梳理下它能为我做什么。 1.搜索代码片段 我目前最想用过的功能就是这个,以前在CSDN上太难找到直接可以用…

天润融通首席科学家田凤占:如何客观看待ChatGPT在智能客服领域的商业化落地?

天润融通首席科学家田凤占:如何客观看待ChatGPT在智能客服领域的商业化落地? 2012年到2022年,AI革命历经了十年的黄金发展期。从互联网、金融、汽车、工业制造,再到医疗健康、零售、物流等,AI技术在现实生活中的应用持…

ChatGPT Prompt工程:设计、实践与思考

作者 | 太子长琴 整理 | NewBeeNLP大家好,这里是 NEewBeeNLP。ChatGPT 火爆出圈了,有些人惊叹于它的能力,当然也有部分人觉得也就那样。这就不得不提 Prompt 了,据说【相关文献1】,ChatGPT 效果好不好完全取决于你的 P…

如何使用ChatGPT开发Unity小游戏

写在前面 首先我们需要知道ChatGpt的语料学习机制,所以为了让它更加“精准扶贫”,钥匙君建议大家在提问之前先引导它进入你想要它成为的角色,ChatGpt在国外已经被“玩坏”,在游戏领域也切实提高了不少码农的工作效率,…

漫画科普ChatGPT:绝不欺负文科生

图文原创:亲爱的数据 你所热爱的,都值得拥有一个名字。 世界上里程碑式计算机,问世之时大多拥有自己的名字。 我认为,假如计算机的诞生是元年,下一个元年将会是“奇点”。 不是比特币,不是虚拟现实&…

【ChatGPT】基于GO语言实现的微信聊天和图片生成机器人

ChatGPT-DreamStudio WeChat Robot 🎨基于GO语言实现的微信聊天和图片生成机器人🎨 个人微信接入ChatGPT,实现和GPT机器人互动聊天,同时支持基于文本生成图像。支持私聊回复和群聊艾特回复。 GitHub源代码地址 实现功能 GPT机…

微软发布ChatGPT 版必应 用的是 .NET 技术

微软在今天在Redmond 线下举办媒体一场活动,发布了新版的微软必应,在桌面上推出了测试版,移动版也即将推出。微软首席执行官纳德拉称Al-powered搜索为公司自云15年以来最大的事情。2023年1月初,微软已经在讨论将OpenAI的技术纳入W…

python 调用 chatgpt

1. 安装 openai 的包: 我们在 pycharm 中安装包 pip3 install openai 2. 我们查找 chatgpt 账户的 api 的 key 1. 首先我们进入到官网: OpenAI 2. 接下来我们点击 api 即可: 3. 查找自己账户的 key: 我们依次点击 Personal &…