摘 要:中国古代壁画是我国文化遗产的重要组成部分,记录着各个时代的宗教信仰和社会生活等内容,具有丰富的文化内涵。随着数字化壁画图像越来越丰富,如何从海量资源中找到研究者所需素材是一个亟待解决的问题。古代壁画识别是指利用计算机技术对壁画图像进行分类和标注,从而更好地管理、保护和研究古代壁画。本研究提出了一种基于卷积神经网络的古代壁画朝代分类方法。该方法通过对古代壁画的图像进行预处理和特征提取,然后将其输入卷积神经网络中进行训练和分类。实验结果表明,本研究的方法均能够获得较好的分类效果。为了验证该算法的可行性及优越性,本次实验采用了来自八个不同朝代的古代壁画数据库进行实验。实验结果证明,本研究得到的方法具有较高的分类准确度和稳定性。综上所述,研究提出的基于卷积神经网络的古代壁画朝代分类方法为古代壁画的保护和研究提供了新思路和方法,具有一定的实际意义和应用价值。
关键词:古代壁画朝代分类;卷积神经网络;图像识别
1.3 本文主要工作
第一章:引言。提出了基于卷积神经网络的古代壁画朝代分类方法,探讨利用深度学习技术提高古代壁画分类准确度的可行性。为古代壁画研究提供思路和方法。
第二章:相关理论。主要介绍了图像特征提取,卷积神经网络和神经网络接口。
第三章:基于卷积神经网络的古代壁画朝代分类方法。介绍了本算法卷积网络结构,算法使用的各种函数,以及对算法实现进行介绍。
第四章:算法实验。从准确率,平均精确率,平均召回率,F1值的等方面对不同数量的训练集和测试集进行实验对比分析。
第五章:结束语。总结论文工作。
2.2 卷积神经网络
卷积神经网络(CNN)是一种被广泛应用于图像处理与识别领域的深度学习模型。它能够自动学习和提取图像特征,因此受到了广泛的关注和应用。CNN最早可以追溯至1980年代,当时主要用于语音信号识别。但是由于硬件条件较差,网络规模较小,无法在复杂任务中应用。2006年,Hinton等人提出了深度置信网络,重新引起了人们对深度学习的关注。同年,LeCun等人在论文中描述并使用了现在常用的卷积神经网络结构,称之为LeNet-5,并成功地应用于手写数字识别。
2012年,Alex Krizhevsky等人提出了名为AlexNet的CNN模型,并在ImageNet Large Scale Visual Recognition Challenge竞赛上取得了非常好的成绩,证明深度学习在图像处理领域具有重要性并带动了深度学习的热潮。之后,又相继出现了VGG、GoogLeNet、ResNet等一系列经典CNN模型。CNN不断获得新的理论成果和技术突破,如Dropout技术用于缓解过拟合问题、Batch Normalization技术用于加快网络收敛速度、Depthwise Separable Convolution技术用于减少CNN参数量等。这些技术的应用不仅提高了CNN的性能,而且也丰富了其应用场景。
随着GPU计算能力的增强和深度学习框架的逐渐成熟,CNN的训练效率也有了很大提升。现在,使用TensorFlow、PyTorch等深度学习框架构建、训练和部署CNN模型已变得轻松便捷。
总之,从最初的DBN到如今的各种经典CNN模型,CNN的发展历程凝聚了众多学者的智慧和努力。随着深度学习技术的不断成熟和硬件条件的不断提高,CNN在图像处理领域的应用前景将会更加广阔。
2.3 神经网络的接口—Keras
Keras是一个高层次的神经网络API,基于Python语言实现,能够在TensorFlow、CNTK或Theano之上运行。它被广泛用于深度学习领域,以快速构建和测试各种神经网络模型。
1. keras.models:该库包含了各种预定义的神经网络模型,例如Sequential、Model等。这些模型可以通过添加各种层来进行自定义,也可以使用已有的权重进行预测。
2. keras.layers:该库包含了各种不同类型的层,例如全连接层(Dense)、卷积层(Conv2D)、池化层(MaxPooling2D)等。你可以使用这些层构建自己的神经网络模型。
3. keras.optimizers:优化器是深度学习中非常重要的组件之一,它们用于更新神经网络权重以最小化损失函数。该库包含了各种优化器,包括Adam、SGD、RMSprop等。
4. keras.losses:损失函数也是深度学习中非常重要的组件之一,它们用于衡量预测结果与真实结果之间的误差。该库包含了各种损失函数,包括均方误差、交叉熵等。
5. keras.metrics:该库包含了各种评估指标,例如精准度(Precision)、准确率(Accuracy)、召回率(Recall)和F1等。这些指标可以用于评估模型的性能。
6. keras.datasets:该库包含了各种常用的数据集。
7. keras.preprocessing:该库包含了各种图像和文本预处理工具。
8. keras.callbacks:该库包含了各种回调函数,这些回调函数可以在训练过程中对神经网络模型进行监控,并采取相应的行动。
总之,Keras是一个非常丰富和强大的神经网络API,它提供了各种功能和组件,方便开发者进行深度学习的研究和实践。
3.1 网络结构
本研究使用了卷积神经网络(Convolutional Neural Network, CNN)进行特征提取和分类。该模型采用了多层卷积层和池化层来提取图像特征,并通过全连接层实现对图像的分类识别
图3.1 卷积神经网络的整体结构
4.3 数据集
壁画:敦煌壁画在构图方面的特点,与自然图像相比有本质上的差别。壁画图像的纹理更加复杂,由于绘制于墙壁;其色调存在一定的色彩梯度变化,颜料使用矿物质颜料且存在一定的主观意向性;多元的文本内容包括艺术形象如供养人、佛、菩萨、建筑等;同时也存在主观性和多义性,不同朝代的壁画图像在各方面都有较大差异性。
各朝代部分壁画图像如图4.1所示。
图4.1 各朝代壁画图片
4.4实验及实验结果分析
1. 实验一:设置2108个壁画图像,其中1708个壁画图像作为训练集,400个壁画图像作为测试集,且这些壁画图像都是对导师提供的数据集进行数据增强后所得保证了数据集的有效性。以北魏,北周,隋朝,唐朝,五代,宋朝,西夏,西魏共8个朝代,对算法训练。本次实验所用数据集结构如表4.1所示。
图4.2 各朝代壁画分类情况统计
2. 实验二:为验证本算法网络对训练集和测试集中壁画数量的敏感性,分别随机抽取总样本数的62.05%、71.54%、81.02%作为训练集,实验一中训练集所占比例为81.02%,剩余样本作为测试集,验证训练集和测试集数量对算法准确率的影响。实验结果如表4.4和图4.4所示。
目 录