【Python】PaddleHub图像分类

news/2024/4/20 3:23:52/文章来源:https://blog.csdn.net/qq_51701007/article/details/129162392

目录

一、环境配置:

 二、问题需求

三、实验内容

1、准备数据集

 2、拆分数据集

3、载入数据集

4、生成数据读取器

5、配置策略

6、组建Finetune Task

7、开始Finetune

8、预测

四、总结:


一、环境配置:

线上环境:

飞桨AI Studio - 人工智能学习与实训社区

线下安装:

环境要求——python>=3.6、paddlehub>=1.7.0

使用pycharm创建项目:

python环境3.7

 安装paddlehub库

 pip install paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple

升级paddlehub库

pip install --upgrade paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple

 二、问题需求

图像分类是计算机视觉的重要领域,它的目标是将图像分类到预定义的标签。近期,许多研究者提出很多不同种类的神经网络,并且极大的提升了分类算法的性能。本文以自己创建的数据集:五位女演员图片,并使用PaddleHub中图像分类预处理模型进行小样本的迁移训练。

五位女演员分别是:

刘亦菲:

迪丽热巴:

 

 古力娜扎:

 安妮海瑟薇:

 斯嘉丽约翰逊:

 

三、实验内容

1、准备数据集

(1)建立数据文件夹:

        分别用来存储不同演员的照片。

 (2)使用爬虫爬取图片,保存到目录

import os
import time
import requests
import re
import time
import urllib3
urllib3.disable_warnings()def imgdata_set(save_path,word,epoch):q=0     #停止爬取图片条件a=0     #图片名称while(True):time.sleep(1)url="https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={}&pn={}&ct=&ic=0&lm=-1&width=0&height=0".format(word,q)#word=需要搜索的名字headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36 Edg/88.0.705.56'}session = requests.session()try:response = session.get(url, headers=headers, verify=False)except:response=requests.get(url,headers=headers,verify=False)# print(response.request.headers)html=response.text# print(html)urls=re.findall('"objURL":"(.*?)"',html)# print(urls)for url in urls:time.sleep(1)print(a)    #图片的名字response = requests.get(url, headers=headers,verify=False)image=response.contentwith open(os.path.join(save_path,"{}.jpg".format(a)),'wb') as f:f.write(image)a=a+1q=q+20if (q/20)>=int(epoch):break
if __name__=="__main__":save_path = input('你想保存的路径:')word = input('你想要下载什么图片?请输入:')epoch = input('你想要下载几轮图片?请输入(一轮为60张左右图片):')  # 需要迭代几次图片imgdata_set(save_path, word, epoch)

你想保存的路径:./data_diy/di
你想要下载什么图片?请输入:迪丽热巴
你想要下载几轮图片?请输入(一轮为60张左右图片):2 

 

每个人物保存五十张。

 

由于爬虫下载的图片有可能失效,在数据量较小的情况下,人为排除失效图片。

清理好后,图片名字会乱,下面重新给图片命名:

import os
import randomdef rename():i = 0path = "data_diy/di"  # 读取的文件夹路径filelist = os.listdir(path)  # 该文件夹下所有的文件(包括文件夹)for files in filelist:  # 遍历所有文件i = i + 1Olddir = os.path.join(path, files)  # 原来的文件路径if os.path.isdir(Olddir):  # 如果是文件夹则跳过continuefilename = str(i)  # 文件名filetype = '.jpg'  # 文件扩展名Newdir = os.path.join(path, filename + filetype)  # 新的文件路径os.rename(Olddir, Newdir)  # 重命名return Trueif __name__ == '__main__':rename()

处理文件名参考

python实现文件重命名_python 文件重命名_王过836的博客-CSDN博客

解决报错:

FileExistsError: [WinError 183] 当文件已存在时,无法创建该文件。附文件重命名代码_略孤狼的博客-CSDN博客_fileexistserror处理好的数据集可以打包为zip格式压缩包上传线上环境:

通过该指令进行解压:

!unzip -o /home/aistudio/data_diy/data_diy.zip

 2、拆分数据集

将数据集拆分成四个部分

新建训练集、测试集、验证集和标签四个txt文本文件,并在标签列表中记下五个分类名称。

 手动拆分训练集合测试集和验证集,通常按照8:1:1的比例进行拆分。

5个文件夹中各有50张图片,总共有250张图片,所以按照8:2的比例划分,训练集有200张,测试集和验证集50张,将测试集和验证集按照对应的方式划分则测试集和验证集数据相同。

所以训练集为:

an:1.jpg~40.jpg、si:1.jpg~40.jpg、liu:1.jpg~40.jpg、di:1.jpg~40.jpg、gu:1.jpg~40.jpg

测试集为:

an:41.jpg~50.jpg、si:41.jpg~50.jpg、liu:41.jpg~50.jpg、di:41~50.jpg、gu:41~50.jpg

验证集为:

an:41.jpg~50.jpg、si:41.jpg~50.jpg、liu:41.jpg~50.jpg、di:41.jpg~50.jpg、gu:41.jpg~50.jpg

文件内容格式: 

 使用代码分别编写数据集:

file_names = ['data_diy/train_list.txt','data_diy/test_list.txt','data_diy/validate_list.txt'
]
path_list = ['data_diy/data/liu/','data_diy/data/di/','data_diy/data/gu/','data_diy/data/an/','data_diy/data/si/'
]
#编写训练集
with open(file_names[0],'w+',encoding='utf8') as f:for i in range(5):for j in range(1,41):aline = path_list[i] + str(j) + '.jpg ' + str(i)+'\n'f.write(aline)#编写测试集
with open(file_names[1],'w+',encoding='utf8') as f:for i in range(5):for j in range(41,51):aline = path_list[i] + str(j) + '.jpg ' + str(i)+'\n'f.write(aline)#编写验证集
with open(file_names[2],'w+',encoding='utf8') as f:for i in range(5):for j in range(41,51):aline = path_list[i] + str(j) + '.jpg ' + str(i)+'\n'f.write(aline)

 训练集

 

测试集

 

验证集

安装matplotlib库:

 pip install matplotlib

查看图片

#显示图片
import matplotlib.pyplot as plt
import matplotlib.image as mpimgimg = mpimg.imread('data_diy/data/an/1.jpg')
img1 = mpimg.imread('data_diy/data/di/1.jpg')
plt.figure(figsize=(10,10))
plt.subplot(1,2,1)
plt.imshow(img)
plt.axis('off')
plt.subplot(1,2,2)
plt.imshow(img1)
plt.axis('off')
plt.show()
print("                安妮海瑟薇                                     迪丽热巴")

3、载入数据集

 线上版:

from paddlehub.dataset.base_cv_dataset import BaseCVDatasetclass DemoDataset(BaseCVDataset):	def __init__(self):	# 数据集存放位置self.dataset_dir = "data_diy"#数据文件保存目录super(DemoDataset, self).__init__(base_path=self.dataset_dir,train_list_file="train_list.txt",validate_list_file="validate_list.txt",test_list_file="test_list.txt",#predict_file="predict_list.txt",label_list_file="label_list.txt",)
dataset = DemoDataset()

 

4、生成数据读取器

生成一个图像分类的reader,reader负责将dataset的数据进行预处理,接着以特定格式组织并输入给模型进行训练。

当我们生成一个图像分类的reader时,需要指定输入图片的大小

data_reader = hub.reader.ImageClassificationReader(image_width=module.get_expected_image_width(),image_height=module.get_expected_image_height(),images_mean=module.get_pretrained_images_mean(),images_std=module.get_pretrained_images_std(),dataset=dataset)

5、配置策略

在进行Finetune前,我们可以设置一些运行时的配置,例如如下代码中的配置,表示:

  • use_cuda:设置为False表示使用CPU进行训练。如果您本机支持GPU,且安装的是GPU版本的PaddlePaddle,我们建议您将这个选项设置为True;

  • epoch:迭代轮数;

  • batch_size:每次训练的时候,给模型输入的每批数据大小为32,模型训练时能够并行处理批数据,因此batch_size越大,训练的效率越高,但是同时带来了内存的负荷,过大的batch_size可能导致内存不足而无法训练,因此选择一个合适的batch_size是很重要的一步;

  • log_interval:每隔10 step打印一次训练日志;

  • eval_interval:每隔50 step在验证集上进行一次性能评估;

  • checkpoint_dir:将训练的参数和数据保存到cv_finetune_turtorial_demo目录中;

  • strategy:使用DefaultFinetuneStrategy策略进行finetune;

更多运行配置,请查看RunConfig

同时PaddleHub提供了许多优化策略,如AdamWeightDecayStrategyULMFiTStrategyDefaultFinetuneStrategy等,详细信息参见策略

config = hub.RunConfig(use_cuda=False,                              #是否使用GPU训练,默认为False;num_epoch=3,                                #Fine-tune的轮数;checkpoint_dir="cv_finetune_turtorial_demo",#模型checkpoint保存路径, 若用户没有指定,程序会自动生成;batch_size=3,                              #训练的批大小,如果使用GPU,请根据实际情况调整batch_size;eval_interval=10,                           #模型评估的间隔,默认每100个step评估一次验证集;strategy=hub.finetune.strategy.DefaultFinetuneStrategy())  #Fine-tune优化策略;

6、组建Finetune Task

有了合适的预训练模型和准备要迁移的数据集后,我们开始组建一个Task。

由于该数据设置是一个二分类的任务,而我们下载的分类module是在ImageNet数据集上训练的千分类模型,所以我们需要对模型进行简单的微调,把模型改造为一个二分类模型:

  1. 获取module的上下文环境,包括输入和输出的变量,以及Paddle Program;
  2. 从输出变量中找到特征图提取层feature_map;
  3. 在feature_map后面接入一个全连接层,生成Task;
input_dict, output_dict, program = module.context(trainable=True)
img = input_dict["image"]
feature_map = output_dict["feature_map"]
feed_list = [img.name]task = hub.ImageClassifierTask(data_reader=data_reader,feed_list=feed_list,feature=feature_map,num_classes=dataset.num_labels,config=config)

7、开始Finetune

我们选择finetune_and_eval接口来进行模型训练,这个接口在finetune的过程中,会周期性的进行模型效果的评估,以便我们了解整个训练过程的性能变化。

run_states = task.finetune_and_eval()

8、预测

当Finetune完成后,我们使用模型来进行预测,先通过以下命令来获取测试的图片

import numpy as np
import matplotlib.pyplot as plt 
import matplotlib.image as mpimgdata = ["data_diy/di/50.jpg","data_diy/liu/44.jpg"]label_map = dataset.label_dict()
index = 0
run_states = task.predict(data=data)
results = [run_state.run_results for run_state in run_states]for batch_result in results:print(batch_result)batch_result = np.argmax(batch_result, axis=2)[0]print(batch_result)for result in batch_result:index += 1result = label_map[result]print("input %i is %s, and the predict result is %s" %(index, data[index - 1], result))img = mpimg.imread(data[0]) 
img1 = mpimg.imread(data[1]) 
plt.figure(figsize=(10,10))
plt.subplot(1,2,1)
plt.imshow(img)
plt.axis('off') 
plt.subplot(1,2,2)
plt.imshow(img1)
plt.axis('off') 
plt.show()

最后的预测效果并不怎么理想,五个人识别一顿扒瞎,最后只好弄成二分类的了,还勉强说得过去。

四、总结:

        结果错误的三大原因:

        1、数据样本太少了

        2、模型调参不到位

        3、预训练模型的选择可能不是太适合

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_72862.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA线程入门简介

线程入门简介什么是程序?什么是进程?什么是线程?单线程与多线程并发与并行线程的使用用java查看有多少个cpu创建线程的两种方式继承Thread类,重写run方法实现Runnable接口,重写run方法多线程机制为社么是start?源码解析什么是程序? 是为完…

字符串转换为二进制-课后程序(JAVA基础案例教程-黑马程序员编著-第五章-课后作业)

【案例5-4】 字符串转换为二进制 【案例介绍】 1.任务描述 本例要求编写一个程序,从键盘录入一个字符串,将字符串转换为二进制数。在转换时,将字符串中的每个字符单独转换为一个二进制数,将所有二进制数连接起来进行输出。 案…

win10下 WSL2安装及配置

目录 一. Windows中WSL2(子系统)安装前提条件 二. Windows中WSL2(子系统)安装步骤(默认安装C盘) 选择包安装模式(选择到其他盘安装) 三. Windows中WSL2(子系统)设置默认root用户登…

35-Golang中的方法

Golang中的方法方法的介绍和使用方法的声明和调用方法的调用和传参机制原理方法的声明(定义)方法注意事项和细节讨论方法和函数的区别方法的介绍和使用 在某些情况下,我们需要声明(定义)方法。比如person结构体,除了有一些字段外(年龄,姓名……

Apollo规划模块代码学习(1): 算法架构原理、运行机制一文详解

文章目录 1、Apllo算法框架原理2、Apollo规划模块概述3、规划模块代码框架1、重要数据结构2、运行机制1、Apllo算法框架原理 Apollo开源自动驾驶平台中,高清地图模块提供了每个在线模块都可以访问的高清地图。感知和定位模块提供了必要的动态环境信息,可以在预测模块中进一步…

优思学院:六西格玛管理的优势有哪些?

六西格玛的优势有哪些呢?以下我们来探讨一下。 一・降低企业整体成本 对企业而言,不良品要么被废弃,要么需要重新加工,或者需要在客户现场维修或更换,这些都会增加企业成本。根据美国的统计数据,执行3σ管…

Socket编程 | TCP服务器 之 并发阻塞模型(多进程实现)

TCP服务器IO模型 之 并发阻塞 1. 引言 在 Linux 环境下多进程的应用很多,其中最主要的就是网络/客户服务器。多进程服务器是当客户有请求时,服务器用一个子进程来处理客户请求。父进程继续等待其它客户的请求。这种方法的优点是当客户有请求时,服务器能及时处理客户,特别是…

docker 部署centos7.9并打包成docker

下载centos基础镜像 docker pull centos:centos7 运行镜像 docker run -itd --name centos-test -p 60001:22 --privileged centos:centos7 /usr/sbin/init 进入容器 docker exec -it ebec90068696 /bin/bash 配置容器信息 安装ssh服务和网络必须软件 yum install net-to…

MongoDB在Windows、Linux、Docker环境下的安装

MongoDB在Windows、Linux、Docker环境下的安装DockerDocker安装远程连接WindowsWindows安装服务相关命令压缩包形式安装Mac、Ubuntu、Centos一键安装MacUbuntucentos源码安装使用Atlas免费MongoDB云数据库申请云数据库连接测试Docker Docker安装 拉取镜像 docker pull mongo…

洛谷P5736 【深基7.例2】质数筛 C语言/C++

【深基7.例2】质数筛 题目描述 输入 nnn 个不大于 10510^5105 的正整数。要求全部储存在数组中,去除掉不是质数的数字,依次输出剩余的质数。 输入格式 第一行输入一个正整数 nnn,表示整数个数。 第二行输入 nnn 个正整数 aia_iai​&…

数据结构与算法(二)(Python版)

数据结构与算法(一)(Python版) 文章目录递归动规初识递归:数列求和递归三定律递归的应用:任意进制转换递归的应用:斐波那契数列递归调用的实现分治策略与递归优化问题和贪心策略找零兑换问题贪心…

系列四、多表查询

一、多表关系 项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结 构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:一对多…

Sprng依赖注入(二):setter注入是如何工作的?

文章示例环境配置信息jdk版本:1.8开发工具:Intellij iDEA 2020.1springboot:2.3.9.RELEASE前言在Spring依赖注入(一):字段注入的方式是如何工作的?中主要分享了Spring bean依赖注入方式中的字段注入方式及其工作过程&a…

基于Pytorch,从头开始实现Transformer(编码器部分)

Transformer理论部分参考知乎上的这篇文章 Transformer的Attention和Masked Attention部分参考知乎上的这篇文章 Transformer代码实现参考这篇文章,不过这篇文章多头注意力实现部分是错误的,需要注意。 完整代码放到github上了,链接 Trans…

联想小新 Air-14 2019IML电脑 Hackintosh 黑苹果efi引导文件

原文来源于黑果魏叔官网,转载需注明出处。硬件型号驱动情况主板Lenovo LNVNB161216处理器Intel Core i5-10210U / i7-10510U已驱动内存8GB DDR4 2666已驱动硬盘康佳KAK0500B128(128 GB/固志硬盘)已驱动显卡Intel UHD 620Nvidia GeForce MX250(屏蔽)无法驱动声卡Cone…

轮播图、阅读注册协议、网页时钟、随机点名、小米搜索框、轮播图点击切换——web APIs练习

目录 一、获取元素(DOM) 1. 随机轮播图案例 2. 阅读注册协议(定时器间歇函数的应用) 3. 轮播图定时器版 4. 网页时钟 二、事件基础(DOM) 1. 随机点名案例 2. 轮播图点击切换(重点&#…

【计算机网络 -- 期末复习】

例题讲解 IP地址(必考知识点) 子网掩码 子网划分 第一栗: 子网划分题目的答案一般不唯一,我们主要采用下方的写法: 第二栗: 路由跳转 数据传输 CSMA/CD数据传输 2、比特率与波特率转换 四相位表示&am…

ElasticSearch 学习笔记总结(一)

文章目录一、 数据的 分类二、 ElasticSearch 介绍三、 ElasticSearch 搭建四、正排索引 和 倒排索引五、ES HTTP 索引 操作六、ES HTTP 文档 操作七、ES HTTP 查询数据1. 条件查询2. 分页查询3. 排序查询4. 多条件查询5. 全文检索 完全匹配 高亮显示6. 聚合查询八、 ES HTTP 映…

Scalable but Wasteful: Current State of Replication in the Cloud

文章目录ABSTRACT1 INTRODUCTION2 REPLICATION IN THE WILD3 CURRENT APPROACHES TO SCALING STATE MACHINE REPLICATION4 EFFICIENCY METRIC5 INEFFECTIVENESS OF CURRENT APPROACHES PER NEW METRIC6 CONCLUSION AND FUTURE DIRECTIONSABSTRACT 共识协议是部署在基于云的存储…

面试热点题:stl中vector与list的优缺点对比、以及list的迭代器与vector迭代器的区别

vector的优点 下标随机访问 vector的底层是一段连续的物理空间,所以支持随机访问尾插尾删效率高 跟数组类似,我们能够很轻易的找到最后一个元素,并完成各种操作cpu高速缓存命中率高 因为系统在底层拿空间的时候,是拿一段进cpu&am…