首页 > 分享 > 基于度学习的猫狗分类识别

基于度学习的猫狗分类识别

✍作者简介:机器学习,深度学习,卷积神经网络处理,图像处理
B站项目实战:https://space.bilibili.com/364224477
希望大家多多支持,我们一起进步!
如果文章对你有帮助的话, 欢迎评论 点赞 收藏 加关注+
‍♂ CSDN个人主页:@purple的个人主页

目录

实验背景

实验目的

实验环境

实验过程

1.加载数据

2.数据预处理

3.构建模型

4.训练模型

5.模型评估

源代码

实验背景

近年来,深度学习在计算机视觉领域取得了巨大的成功,尤其是在图像分类任务上。图像分类是计算机视觉领域的基本问题之一,而猫狗分类作为图像分类中的经典问题,吸引了广泛的研究兴趣。猫狗分类问题具有很高的实际应用价值。在现实世界中,人们经常需要对动物进行分类,如在宠物识别、动物行为分析和动物保护等领域。传统的图像分类方法通常需要手工设计特征提取器和分类器,这在处理复杂的图像数据时面临着挑战。 深度学习通过学习端到端的特征提取和分类模型,不需要手动设计特征提取器,因此在猫狗分类问题上具有巨大的潜力。卷积神经网络(Convolutional Neural Networks,简称CNN)是深度学习中最常用的模型之一,特别适用于图像数据的处理。猫狗分类问题的研究可以帮助我们深入理解深度学习在图像分类任务中的应用,并且可以为其他图像分类问题的研究提供经验和指导。此外,研究人员还可以通过比较不同深度学习模型的性能和对比传统方法的效果,评估深度学习在猫狗分类问题上的优势和局限性。 此外,随着深度学习模型的不断发展和算力的提升,研究人员可以尝试更复杂的模型架构、数据增强技术和迁移学习方法,以进一步提高猫狗分类任务的准确性和鲁棒性。因此,基于深度学习的猫狗分类实验具有重要的研究价值,可以推动深度学习在图像分类领域的发展,同时为实际应用场景提供更好的解决方案。 12345

实验目的

本实验的目的是基于深度学习方法进行猫狗分类,通过设计和训练深度神经网络模型,实现对输入图像进行准确的猫狗分类。具体目标包括: 1.建立一个高性能的猫狗分类模型:通过深度学习技术,构建一个能够从原始图像数据中自动学习到猫狗分类特征的神经网络模型。该模型能够准确地对输入图像进行分类,具备较高的分类准确率和泛化能力。 2.探索不同深度学习模型的性能差异:比较不同深度学习模型(如卷积神经网络、残差网络等)在猫狗分类任务上的性能表现,评估它们的准确率、召回率、精确率等指标,并分析其优势和不足之处。 3.优化模型性能:通过调整模型的超参数、网络结构以及训练策略等,进一步提高猫狗分类模型的性能。例如,可以尝试不同的激活函数、优化器、学习率调度等,以提高模型的收敛速度和泛化能力。 4.数据增强和处理:应用数据增强技术,如随机裁剪、旋转、翻转等,扩充训练数据集的多样性,提高模型对于各种场景和变化的鲁棒性。同时,对原始图像数据进行预处理,如图像归一化、均衡化等,以便更好地适应模型输入要求。 5.评估模型性能:使用独立的测试数据集对训练好的模型进行评估,计算分类准确率、混淆矩阵等指标,评估模型的性能。同时,可以与其他传统方法进行比较,验证基于深度学习的方法在猫狗分类问题上的优越性。 1234567891011

实验环境

Python3.9

Jupyter notebook

实验过程

1.加载数据

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

首先导入本次实验用到的第三方库

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

接着定义我们数据集的路径

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

定义训练集、测试集、验证集生成器

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

将生成器连接到文件夹中的数据
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

可视化一些数据图片,来个九宫格展示

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

2.数据预处理

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

3.构建模型

构建模型、定义优化器

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

保存模型

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4.训练模型

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

5.模型评估

将模型训练和验证的损失可视化出来、以及训练和验证的准确率

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

对验证数据集进行评估

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

对测试数据集进行评估

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

将模型的混淆矩阵一热力图的形式展示
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

源代码

import numpy as np import random import matplotlib.pyplot as plt %matplotlib inline from sklearn.metrics import confusion_matrix import seaborn as sns sns.set(style='darkgrid', font_scale=1.4) import os os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' from tensorflow import keras from tensorflow.keras.preprocessing.image import ImageDataGenerator from tensorflow.keras.applications.inception_resnet_v2 import InceptionResNetV2, preprocess_input from tensorflow.keras.layers import Dense, Flatten from tensorflow.keras.models import Model from tensorflow.keras.optimizers import Adam # 数据集路径 train_dir = './train' test_dir = './test' CFG = dict( seed = 77, batch_size = 16, img_size = (299,299), epochs = 5, patience = 5 ) train_data_generator = ImageDataGenerator( validation_split=0.15, rotation_range=15, width_shift_range=0.1, height_shift_range=0.1, preprocessing_function=preprocess_input, shear_range=0.1, zoom_range=0.2, horizontal_flip=True, fill_mode='nearest') val_data_generator = ImageDataGenerator(preprocessing_function=preprocess_input, validation_split=0.15) test_data_generator = ImageDataGenerator(preprocessing_function=preprocess_input) # 将生成器连接到文件夹中的数据 train_generator = train_data_generator.flow_from_directory(train_dir, target_size=CFG['img_size'], shuffle=True, seed=CFG['seed'], class_mode='categorical', batch_size=CFG['batch_size'], subset="training") validation_generator = val_data_generator.flow_from_directory(train_dir, target_size=CFG['img_size'], shuffle=False, seed=CFG['seed'], class_mode='categorical', batch_size=CFG['batch_size'], subset="validation") test_generator = test_data_generator.flow_from_directory(test_dir, target_size=CFG['img_size'], shuffle=False, seed=CFG['seed'], class_mode='categorical', batch_size=CFG['batch_size']) # 样本和类的数量 nb_train_samples = train_generator.samples nb_validation_samples = validation_generator.samples nb_test_samples = test_generator.samples classes = list(train_generator.class_indices.keys()) print('Classes:'+str(classes)) num_classes = len(classes) # 可视化一些例子 plt.figure(figsize=(15,15)) for i in range(9): ax = plt.subplot(3,3,i+1) ax.grid(False) ax.get_xaxis().set_visible(False) ax.get_yaxis().set_visible(False) batch = train_generator.next() imgs = (batch[0] + 1) * 127.5 label = int(batch[1][0][0]) image = imgs[0].astype('uint8') plt.imshow(image) plt.title('cat' if label==1 else 'dog') plt.show() base_model = InceptionResNetV2(weights='imagenet', include_top=False, input_shape=(CFG['img_size'][0], CFG['img_size'][1], 3)) x = base_model.output x = Flatten()(x) x = Dense(100, activation='relu')(x) predictions = Dense(num_classes, activation='softmax', kernel_initializer='random_uniform')(x) # 构建模型 model = Model(inputs=base_model.input, outputs=predictions) for layer in base_model.layers: layer.trainable = False # 定义优化器 optimizer = Adam() model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy']) # 保存模型 save_checkpoint = keras.callbacks.ModelCheckpoint(filepath='model.h5', monitor='val_loss', save_best_only=True, verbose=1) early_stopping = keras.callbacks.EarlyStopping(monitor='val_loss', patience=CFG['patience'], verbose=True) # 训练模型 history = model.fit( train_generator, steps_per_epoch=nb_train_samples // CFG['batch_size'], epochs=CFG['epochs'], callbacks=[save_checkpoint,early_stopping], validation_data=validation_generator, verbose=True, validation_steps=nb_validation_samples // CFG['batch_size']) history_dict = history.history loss_values = history_dict['loss'] val_loss_values = history_dict['val_loss'] epochs_x = range(1, len(loss_values) + 1) plt.figure(figsize=(10,10)) plt.subplot(2,1,1) plt.plot(epochs_x, loss_values, 'b-o', label='Training loss') plt.plot(epochs_x, val_loss_values, 'r-o', label='Validation loss') plt.title('Training and validation Loss') plt.xlabel('Epochs') plt.ylabel('Loss') # Accuracy plt.subplot(2,1,2) acc_values = history_dict['accuracy'] val_acc_values = history_dict['val_accuracy'] plt.plot(epochs_x, acc_values, 'b-o', label='Training acc') plt.plot(epochs_x, val_acc_values, 'r-o', label='Validation acc') plt.title('Training and validation accuracy') plt.xlabel('Epochs') plt.ylabel('Acc') plt.legend() plt.tight_layout() plt.show() # 对验证数据集进行评估 score = model.evaluate(validation_generator, verbose=False) print('Val loss:', score[0]) print('Val accuracy:', score[1]) # 对测试数据集进行评估 score = model.evaluate(test_generator, verbose=False) print('Test loss:', score[0]) print('Test accuracy:', score[1]) # 混淆矩阵 y_pred = np.argmax(model.predict(test_generator), axis=1) cm = confusion_matrix(test_generator.classes, y_pred) # 热力图 plt.figure(figsize=(8,6)) sns.heatmap(cm, annot=True, fmt='d', cbar=True, cmap='Blues',xticklabels=classes, yticklabels=classes) plt.xlabel('Predicted label') plt.ylabel('True label') plt.title('Confusion matrix') plt.show()

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135 选题指导,设计代做: https://space.bilibili.com/364224477 设计代做项目方向涵盖:

基于Python,MATLAB设计,OpenCV,,CNN,机器学习,R-CNN,GCN,LSTM,SVM,BP目标检测、语义分割、Re-ID、医学图像分割、目标跟踪、人脸识别、数据增广、 人脸检测、显著性目标检测、自动驾驶、人群密度估计、3D目标检测、CNN、AutoML、图像分割、SLAM、实例分割、人体姿态估计、视频目标分割,PyTorch、人脸检测、车道线检测、去雾 、全景分割、 行人检测、文本检测、OCR、姿态估计、边缘检测、场景文本检测、视频实例分割、人脸对齐、超分辨、去噪、强化学习、行为识别、OpenCV、场景文本识别、去雨、机器学习、风格迁移、视频目标检测、去模糊、活体检测、人脸关键点检测、3D目标跟踪、视频修复、人脸表情识别、时序动作检测、图像检索、异常检测等毕设指导,毕设选题,毕业设计开题报告, 123

相关知识

基于深度学习的猫狗图片分类研究(数据集+实验代码+4000字实验报告)
PyTorch深度学习:猫狗情感识别
基于Pytorch框架的深度学习densenet121神经网络鸟类行为识别分类系统源码
R语言深度学习玩转宠物世界:宠物识别与品种分类
语音情感识别调研
基于深度学习的宠物猫排泄物图像分类及其在宠物猫智能家居系统的应用研究
PyTorch猫狗:深度学习在宠物识别中的应用
基于卷积神经网络通过声音识别动物情绪的方法及系统
原创 宠物AI识别接口全开放:狗脸识别、猫脸识别、鼻纹识别、品种识别、相似度比对
基于深度学习的宠物狗活动监测系统设计

网址: 基于度学习的猫狗分类识别 https://m.mcbbbk.com/newsview282347.html

所属分类:萌宠日常
上一篇: 旷视推出鼻纹识别解决方案 助力“
下一篇: 宠物行为分析方法、装置、设备及介