一、神经网络在二维零件图特征识别中的应用(论文文献综述)
熊辛[1](2021)在《基于行为特征优化和深度学习的行为识别研究》文中进行了进一步梳理行为识别是控制科学和计算机领域的研究热点,近年来越来越受到学术界和工业界的关注。行为识别在智能工业、智慧养老、文娱、VR/AR和智慧城市安防建设等领域都有较大的社会需求和广泛的应用场景。现有方法在行为特征提取方面存在不足,特征提取不准确、不充分等问题,制约了行为识别的有效应用。现有的研究在行为特征优化提取方面,在低层单一特征、中层多特征、高层结构化信息特征三个层次都存在一定的问题。问题一是现有人体异常行为识别方法缺失了低层的时序维度行为特征,仅在二维图像层面或采用二维卷积分析具有时空特性的人体行为,导致了动作特征的类内差距增大,类间差距减小。问题二是现有的行为识别方法缺乏对中层的模态融合特征提取,忽略了对骨架信息与RGB信息模态融合的研究。这种基于单一模态信息的方法使得人体行为特征提取不准确,导致在较多分类的任务中准确率不理想。问题三是现有的方法缺失了对行为高层几何特征的提取。在像素级行为特征的表达上存在尺度不确定性和背景干扰,没有充分利用骨架关节点的坐标信息进行特征提取,导致行为特征表达能力不强、表征不充分、鲁棒性不足。对于行为识别来说,高质量的行为特征是准确完成识别任务的关键。本文主要从行为特征的优化和提取入手,在低层的时序维度行为特征优化、中层的行为特征模态融合和高层的行为几何特征提取三个方面展开研究。针对问题一,本文提出了一种基于人体骨架信息的三维连续降池化异常行为识别方法。首先通过姿态估计算法去除了场景和外观等干扰信息。然后通过所提出的人体骨架行为特征聚类模块,获得时序注意力更强、包含动作特征更多的优化视频序列。最后通过所提出的三维连续降池化神经网络,提取骨架的时空信息,最终获得行为识别结果。针对问题二,本文提出了基于行为序列优化和双流网络的行为识别方法。所提出的行为序列优化方法针对现有方法在行为活跃区域中表现出行为特征注意力弱的问题,优化多镜头视频中行为活跃区域的特征,增加了行为活跃区域的比例,并且去除冗余序列,优化了特征的提取。所提出的基于三维卷积的双流融合网络分别提取骨架和RGB两种模态的特征,提取时空特征的同时,融合RGB数据和骨架数据两种模态进行分类打分。最后通过分数融合得到行为分类的结果。针对问题三,本文提出了一种端到端的基于人体骨架特征优化和自适应图卷积神经网络的行为识别方法。提出的人体骨架特征优化方法SFO(Skeleton Feature Optimization)使图神经网络更有效地聚合其他节点特征,提高了图卷积神经网络对行为特征的表达能力和注意力。针对图卷积易过平滑和现有方法对人体行为特征提取能力弱的缺陷,提出的自适应图卷积神经网络主要创新在自适应池化操作APO(Adaptive Pooling Operation)、图结构掩码GSM(Graph Structure Mask)和有向图映射DGM(Directed Graph Mapping)三个方面。APO通过引入可学习的高频特征分量有效缓解了图卷积过平滑的问题,GSM和DGM分别增强了图卷积对人体图结构及其有向图信息的提取能力,优化了行为特征的提取。本文对所提出的方法进行了分析和实验,部分研究成果已在多篇SCI期刊上发表。实验数据表明本文所提出的方法优化了行为特征的提取,在多个公共数据集上取得了优于现有方法的识别准确率,证明了所提方法的有效性。本研究对推动行为识别技术在智能工业和智慧城市中的实际应用具有重要意义。
蔡畅[2](2021)在《基于神经网络的手语运动区域分割与手语识别研究》文中提出手语是听障人士交流的主要方式,主要通过手臂以及手部动作、身体运动轨迹以及面部一些细微的动作来表示。但对于不熟悉手语的人群来说,要理解手语的含义十分有难度。根据世界卫生组织数据显示,在全球范围内,患有残疾性听力损失的人数已达4.66亿之多。研究手语识别对于听障人士之间相互交流以及听障人士与非听障人士交流有着重要意义,能够促进听力及语言障碍者获取更加便捷的学习、工作与生活方式。手语识别的目的是将手语视频或图像翻译为文本或者语音输出。根据识别对象的不同,手语识别可分为孤立词识别与连续语句识别。同时,手语运动区域分割后的运动区域图像以及运动区域的识别可以用于智能人机交互领域。近些年深度学习的迅速发展,使得计算机视觉领域的研究有了另一个维度的思考方式,通过不同研究者的实验,证实了基于深度学习的算法具有泛化能力强、建模能力出众以及提取特征丰富有效的优势。基于此,本文在使用深度学习方法的基础上,进行了手语运动区域分割与手语识别研究,主要的研究内容包括:1、为了提升手语运动区域分割的准确性与直观性,提出了基于Deeplab V3+与Mobile Net V2的手语运动区域分割方法。采用该算法进行手语运动区域分割,不仅能够将运动区域有效分割,还能够保留运动区域在原图像中的位置信息,进一步得到直观的运动区域轨迹。2、将手语运动区域分割模块与手语特征分析模块联结以实现手语RGB图像序列的运动区域分割、跟踪、表征以及识别。在手语运动区域分割的基础上,提出了基于分割图像的手语识别方法。由于动态手语数据源多为视频格式,所以不仅空间上手语运动区域非常重要,时间域上运动轨迹同样对于手语词的识别结果有重要意义,故采用基于时域位移模块的残差网络作为手语分析的主干网络,不仅能够有效进行手语时空域建模,还仅保留二维卷积的计算参数量。最终在含有500词的大型手语数据集SLR500上,获得了89.1%的识别准确率。3、为了实现对手语完整图像以及运动区域图像的全面分析,在运动区域分割的手语识别框架基础上,增加基于手语全局图像分析分支,形成改进的手语分析双流网络,最后将两分支的分类结果进行数据融合,最终在SLR500数据集上得到了94.7%的识别准确率。
张兴园[3](2020)在《基于深度学习的手绘草图生成、识别及应用研究》文中研究表明在整个人类文明进程中,手绘草图一直用作一种直观的表达方式和基本的交流工具。随着电子设备的发展和触摸屏的普及,即智能手机、平板电脑、手写画板和智能手表的出现,草图可以通过手指滑动的方法更加方便地获取到。不同于传统的包含丰富颜色和纹理信息的图像,草图在视觉线索上更加稀疏且包含的细节更少,但是人们很容易识别出草图所属的目标类别,这表明人类对物体的神经视觉表征具有内在的稀疏性,因此稀疏的草图研究可以帮助我们更好地理解人类认知过程,同时促进高效视觉分类器的设计。此外,草图作为一种沟通和交流的方式,不同的人能够快速正确地识别出感兴趣的目标和内容,从而克服了文化、语言、时间和年龄的障碍。因此,手绘草图的研究可以促进人类知识和信息的传播以及情感的交流。本文以手绘草图为研究对象,深入研究了基于深度学习的图像识别技术在草图识别相关任务中的应用,其中包括草图生成和分类、基于草图的图像检索和行为识别等热点领域。草图识别是上述任务的核心基础,本文方法旨在得到更优的草图表征方式,从而能够准确、高效地实现草图识别的目的,因此本文对草图相关问题进行研究具有非常重要的理论意义和实用价值。本文主要的研究内容和成果如下:(1)针对目前草图训练集的缺乏和基于草图的图像检索准确率低及推广能力不足的问题,本文提出了基于多尺度策略的草图生成模型。首先,提出了多尺度的卷积神经网络生成粗略草图,利用多尺度和多层次学习提取图像的底层和高层特征,从而更充分地利用了不同层次的信息;然后,提出了基于粗略草图与修正模板匹配的图像细化方法,利用图像处理中的形态学操作,基于两步走策略并通过加权求和得到最终的细化草图;最后,提出了薄板样条插值策略,对细化的草图进行非刚性变形,以解决不同背景人员在绘制过程中的草图样式变化问题。实验结果表明,本文方法在公开数据集上取得了很好的草图生成效果,同时解决了基于草图的图像检索任务中的跨域检索问题。(2)针对目前大部分深度卷积神经网络在构建草图表征时,都将草图当做普通的纹理图像,而没有考虑形状信息对提取草图特征的重要作用,本文提出了一种基于双分支的草图特征提取网络。首先,利用传统的卷积神经网络提取原始草图的外观特征;然后,提出了基于草图轮廓关键点集的神经网络来提取草图的形状特征,该分支将草图的轮廓关键点集作为输入,引入仿射变换来解决神经网络对草图旋转和平移的不变性问题,同时采用最大池化来聚合所有点的信息解决草图采样点顺序的不变性问题;最后,提出将外观特征和形状特征融合,并对特征向量进行L1归一化实现草图分类器SVM的训练。实验结果表明,考虑草图在缺乏颜色和纹理信息的情况下引入轮廓点集表示,可以挖掘出更多隐含的形状特征,进一步提高草图识别和检索两大任务的准确率。(3)针对草图具有稀疏和抽象的结构特点,前面提出的方法都没有考虑草图局部特征提取对形状表征的影响问题,同时基于深度卷积神经网络的草图识别方法虽然能够提取外观特征和形状特征,但是忽略了不同特征之间的相互学习。本文提出了一种基于互学习的端到端手绘草图双分支网络。首先,提出了多层特征融合的卷积神经网络来提取草图的外观特征,利用多个浅层中间卷积层输出的特征与最后全连接层输出相结合,并使用全局平均池化保留显着特征、降低特征维度;然后,提出了基于图卷积的神经网络提取草图的形状特征,通过对每个采样点利用K近邻算法构建图,再利用图卷积网络提取局部特征来增强草图形状的表达能力;最后,提出了互学习策略同时优化两个识别网络,通过引入类别一致性损失和视觉注意一致性损失来约束两个分支。实验结果表明,该模型的识别性能优于现有方法,可以提高草图识别和基于草图的图像检索任务的准确率,并能通过微调模型的方式推广到其他风格的草图识别任务中。(4)针对目前很多基于不同模态的神经网络进行视频行为识别时,都没有考虑人的形状信息对识别准确率影响的问题,本文将草图特征应用到行为识别的预测任务中,提出了基于中层语义表示的卷积神经网络用于行为识别。首先,提出了一种注意力导向的草图生成模型,利用草图生成网络从动作视频中提取人的形状结构以生成原始草图,与此同时,使用注意力引导机制,对原始草图进行区域修正,去掉无关区域和噪音信息,从而生成与行为识别相关的判别性区域;然后,提出了基于原始草图和点表示草图的双分支神经网络模型,对视频关键帧进行选取并输入网络,分别提取纹理信息和点集表示的形状信息,从而实现基于视频草图的行为识别;最后,对多个模态的行为识别分数进行决策级融合,将融合后的结果作为最终的行为识别结果。实验结果表明,视频草图模态对行为识别起到了积极的作用,有效提升了系统预测的性能,降低了识别误差。
侯健[4](2020)在《基于深度学习的非模型法步态识别研究》文中指出步态识别是一种新兴的生物特征识别技术,其相对于人脸识别与指纹识别等身份识别技术具有识别距离远、难以伪装等优点,在近些年来受到了国内外研究学者的广泛关注。同基于模型法的步态识别相比,非模型法的步态识别构建简单,计算量低,计算效率高,对目标图像质量的要求低。非模型法的步态识别分为类能量图法和视频序列特征法两种。类能量图法将一个周期内的图像序列生成一幅图像,这幅图像通常为步态能量图,当运动对象的衣着、采集设备的角度发生变化时,步态图像的轮廓也随即发生较大的变化,这些变化将对步态识别产生影响。视频序列特征法需要将一个周期内的步态轮廓图按照顺序进行输入,丧失了步态识别的灵活性,且在实际生活中,由于外界因素干扰通常很难取得完整周期内的步态轮廓图。针对以上问题,为了提高跨视角多步行条件的步态识别的准确率,实现步态识别的灵活性,本文结合深度学习的优秀性能,展开了基于深度学习的非模型法步态识别研究,具体工作如下:(1)在步态能量图法中结合深度学习提出了一种基于胶囊网络和反馈权重矩阵的步态识别方法。传统卷积神经网络在池化过程中会产生损失,且无法准确反映步态能量图内部特征属性之间的关系,本文使用胶囊网络,采用向量的方式表示特征,保留了特征属性之间的关系。以往的突出身体不同部位重要性的方法只适合用于静止图像,且突出的部位是固定的,本文采用反馈权重矩阵更新输入图像。在一层胶囊网络,基于卷积层输出的步态特征计算反馈权重的情况下,在CASIA-B的步态能量图数据库和OU-ISIR的步态能量图数据库下进行实验,实验结果表明该方法相较以往方法擅长于提取垂直和平行行走条件下的特征,且在CASIA-B的步态能量图数据库穿着大衣的步行条件下达到61.1%的平均识别准确率,表明该方法擅长于提取穿着大衣步行条件下的步态特征。(2)在视频序列特征法中结合深度学习提出了一种基于集合池化层的步态识别方法。为了实现步态识别的灵活性,采用了集合池化层实现步态轮廓图的无序输入,输入的步态轮廓图可以为不连续的非完整周期的步态轮廓图。为了更好汇聚浅层和深层的集合信息,采用了多层全局管道的方法。将水平金字塔池化进行改进,为步态识别建立一个更具有辨别力的空间。首先对CASIA-B数据库的步态轮廓进行预处理得到归一化图像,然后进行实验,实验结果表明该方法能实现步态识别的灵活性,在输入图像仅为7帧步态轮廓图的情况下达到了80.1%的识别准确率。
王策[5](2020)在《递归图和卷积神经网络在桥梁损伤识别中的应用》文中提出大跨桥梁服役要求通常为一百年,为使桥梁满足使用年限要求,诸多学者开展了大量关于桥梁损伤识别的研究,应用各类信号分析技术对桥梁损伤状况进行判别。然而桥梁信号的非平稳性及环境因素的复杂性制约了传统方法在该领域的进一步发展。因此,寻找新的非平稳性分析方案及特征挖掘技术日趋重要。本文通过斜拉桥损伤模拟和简支梁试验研究,验证了基于递归图和卷积神经网络的方法在该领域应用的可能性,并通过递归量化分析挖掘信号非平稳性变化,表征损伤程度变化趋势。具体研究工作如下:(1)首先本文论述了桥梁损伤识别、递归分析技术和卷积神经网络的国内外研究现状,对递归分析和卷积神经网络的理论背景、发展状况、研究现状进行了详细的描述和分析。对递归技术的基础理论进行了初步的验证,掌握了递归所需的技术和理论要点,为后续开展相关研究奠定了技术和理论基础。递归图为本文的主要研究对象,通过相空间重构的方式将一维加速度信号转换为二维图像信息,挖掘加速度信号内所蕴含的损伤信息。应用卷积神经网络对递归图进行分类处理工作,对表征不同损伤信息的递归图进行分类。递归量化分析是递归图的微观表现形式,对递归图信息进行分析、计算,对递归图进行定量、定性,在本文被用以揭示损伤程度的变化。(2)将上述递归图和卷积神经网络用于斜拉桥损伤模拟,探究如何将二者联合用于桥梁损伤识别,验证该方法应用在桥梁损伤识别领域的可能性。建立多组斜拉索损伤工况,对斜拉索损伤信号进行递归图分析和卷积神经网络分类,分类结果表明,该方法具备较高的精确度,但对损伤程度的敏感度有待进一步优化。(3)运用递归周期密度熵挖掘信号中包含的损伤程度信息。考虑到桥梁损伤信号的非平稳性特征,本文运用递归量化分析法中递归周期密度熵区分不同信号的非平稳性程度,用以表征信号损伤程度的变化。通过模拟发现,递归周期密度熵可有效体现信号的非平稳性变化,评价信号内包含的损伤程度变化信息,可提升递归图表征信号损伤程度和损伤位置的客观性及有效性。(4)最后,本文在递归图和卷积神经网络方法的基础上,引入递归周期密度熵理论,开展简支梁验证性试验。通过试验验证了该方案在实际中应用的可能性,通过递归周期密度熵分析,获取了信号在损伤程度发生变化时的非平稳性变化方式,有效提升了识别损伤程度的准确率。
张锐[6](2020)在《行人步态识别方法研究》文中进行了进一步梳理近年来,随着人工智能技术的不断发展,智能安防被广泛的应用到实际生活中,为平安城市提供保证,保障人民的安全。如今,城市中各个重要位置均安装有摄像头,一个庞大的天网时刻预防、打击犯罪活动。依靠视频监控对行人轨迹进行描述和对特定人员进行检索成为重要的任务。这其中步态识别便是关键技术之一。步态识别通过人的走路姿态和体型进行身份识别,是重要且稳定的生物特征识别技术,该研究有极高的应用价值。基于深度学习的步态识别研究取得了较大的进展,同时多个公共步态数据集的建立也为算法的评估提供平台。然而,当前步态识别的研究工作仍存在一定问题。首先,主流的步态数据集均在无背景干扰的室内采集,志愿者按固定路径行走进行拍摄。使用背景差分法或帧差法对视频图像进行处理得到行人轮廓图。这种模拟场景下的数据及轮廓提取方法与真实场景存在巨大差异,使得研究与实际应用有较大鸿沟。其次,当前的步态识别工作多采用浅层网络进行研究。尽管浅层网络能关注到局部特征且不易发生过拟合现象,但其有限的学习能力及全局特征的缺失导致识别性能较低。随着计算机视觉通用网络的不断改进,如何使用更深的网络来提升步态识别的准确率成为当务之急。最后,步态识别任务中存在跨视角识别的难点。对于同一行人,轮廓和行走轨迹随拍摄视角变化而改变明显,导致跨视角匹配的准确率相较于同视角匹配降低较大。针对上述步态识别研究中存在的问题,论文做了以下工作:1.设计了一个针对监控场景的步态轮廓图提取方法,并构建监控场景步态识别数据集。首先提出一个对监控场景中环境复杂、光照条件变化有很好鲁棒性的步态轮廓图提取方法。此方法包含检测模块、追踪模块、轮廓提取模块。针对视频图像中行人分辨率占比较小的问题,论文增加检测网络特征图尺寸,调整初始化参数。针对追踪模块提出了一个强特征追踪器。最后结合轮廓提取模块,建立了一个校园监控步态数据集,以评估步态识别算法的性能,搭建步态识别研究与应用间的桥梁。2.提出了一个多尺度步态识别网络,选取合适的骨架网络,融合步态能量图的全局特征和局部特征,为步态识别任务提取更有辨别力的特征。整个网络结合Arcface损失函数和难样本三元损失函数进行学习。在多损失函数的监督下,训练一个端到端的多尺度识别网络。实验证明,Arcface损失函数配合难样本三元损失函数可以最大程度的提升网络对步态特征的辨别能力。网络中全局特征和局部特征在一定程度上进行互补,融合后的特征有更强的辨别力。3.实现了一种基于生成对抗网络的跨视角步态识别方法。在步态识别任务中,跨视角识别是最具挑战性的任务。同一行人不同视角下拍摄的轮廓图存在明显差异。本文设计了一个对抗网络结构并加入三元身份损失,将不同视角下的步态能量图转化成固定视角下的步态能量图,同时保留行人身份信息。实验证明生成图像的特征可辅助原始图像得到更高准确率的识别结果。
王亚[7](2020)在《基于3D卷积神经网络的三维模型识别及检索研究》文中认为随着科技信息技术的不断进步,三维模型数量呈指数级增长,在工业生产和日常生活中发挥着重要作用。如何对模型进行分类管理成为学术界、工业界普遍关注及研究的问题。而计算机硬件性能的不断提升,使得因计算性能瓶颈而进步缓慢的卷积神经网络再次获得高速发展,特别是在二维图形图像识别领域已取得优异成果。三维模型结构的特殊性使得其识别分类过程区别于传统图像,为此本文考虑将3D卷积神经网络应用至三维模型的分类识别与检索之中。主要工作如下:提出一种权值优化集成卷积神经网络模型,并将其应用在三维模型的分类识别中。该方法首先获取三维模型正视、俯视和侧视三个视角的深度投影视图,从而最大限度地保留三维模型的空间信息。然后采用改进的VGGNet对各个视角深度投影图像进行训练并输出其对三维模型所属类别的预测概率值,最后采用权值计算算法对深度投影视图的预测概率值赋以权值并加权集成,从而完成三维模型的最终分类。提出一种基于自适应加权集成卷积神经网络模型。该模型以熵为基准,对深度学习模型提取的三维模型正视、侧视和俯视的深度投影视图特征赋以合适权值。然后将特征与对应权值加权集成为新的融合特征,通过权值提升初步分类表现较好的特征在融合特征中的占比。再用逻辑回归对融合特征分类,完成三维模型的分类识别。提出一种基于权值优化集成3D卷积神经网络模型。该方法首先以俯视视角按特定位置依次渲染出三维模型的二维图像,按顺序以视频形式输出。然后尝试将体素化的三维模型用多维二值矩阵的数据结构形式描述。再用改进的3D卷积神经网络模型将这两种形式的数据分别进行训练并输出三维模型所属每种类别的概率。根据算法赋予二者合适权值,加权集成初步分类的预测概率值,从而识别出三维模型的所属分类。实验表明该方法可有效提高分类准确率。
任艳[8](2020)在《神经网络在通信信号调制识别中的应用研究》文中提出目前,通信技术正快速发展,新的调制方式也层出不穷。无论是民用还是军用,接收端在进行解调等信号处理的过程中,都需要调制识别这一技术的有力支持。因此,调制识别技术的研究具有至关重要的意义。传统的调制识别算法中,运算复杂度高,往往需要人工设定阈值。尤其在非合作通信下,先验知识较少以及信道环境较为恶劣,提高了正确识别调制方式的难度。当下深度学习技术迅速发展,在无线通信领域,广大学者逐渐将神经网络算法应用于通信信号调制方式识别技术中,且取得了较好的效果。本文将继续深入研究神经网络算法在通信信号调制识别中的应用以及所能达到性能效果。本文的主要研究内容如下:针对通信信号的传统预处理过程较复杂的问题,对于通信复基带信号,本文构造了一种改进的CLDNN(Convolutional,Long short-term memory,Fully connected Deep Neural Networks)模型,并将该模型应用于通信信号调制识别领域中。使用复数卷积层替代实数卷积层,实现了端到端的调制信号识别。通过使用公开数据集对改进的CLDNN模型进行训练,研究复数卷积层数量、LSTM层数量、卷积核数量对网络识别性能的影响,从而确定网络性能较好时的部分参数。同时通过仿真结果可知,与其他网络结构的识别性能相比,该网络结构的识别准确率更高,且一定程度上比较容易收敛,比基于高阶累积量的调制识别算法的平均识别性能更好,说明了改进的CLDNN网络的优越性。在研究过程中发现,神经网络对噪声敏感,低信噪比时的调制识别性能较差。为了解决这个问题,本文在卷积神经网络中结合使用Finetune迁移学习和中心损失算法,并将该网络模型应用于调制信号识别中。通过仿真结果可知,对于被不同程度噪声干扰的调制信号,在一定范围内,Finetune迁移学习算法和中心损失算法的应用使识别准确率得到提升,并从一定程度上提高了网络训练的稳定性。说明两种算法的结合使用,能有效提高被噪声污染的调制信号的识别性能。
付卫华[9](2019)在《基于深度学习的三维人脸图像识别研究》文中研究指明近年来,随着计算机技术的不断发展,生物识别技术越来越受到广泛的关注,例如指纹识别、虹膜识别、人脸识别等。其中,因人脸识别技术具有直接性,方便性,操作简单等优点,被广泛地应用在网上支付,安全防务以及刑事侦查等领域。人脸识别分为二维人脸识别和三维人脸识别,二维人脸图像的识别技术经过多年的发展已经基本成熟,但很难解决姿态、光照等问题。而三维人脸数据具有丰富的人脸空间信息,成为研究的热点。同时,对于传统识别方法中人工提取特征可能对实验结果会造成影响的情况,本文设计了深度神经网络进行特征的自动提取。本文的主要工作内容包含以下部分:(1)人脸数据的预处理,首先将三维人脸点云数据转换成深度图的形式,对深度图进行人脸检测、分割和归一化处理,同时,对深度图提取LBP特征,以提高数据在实验中的可靠性。(2)设计出分别提取深度人脸图像和其LBP(Local Binary Patterns,局部二值模式)特征图的卷积特征的深度学习网络,在特征提取部分,采用包含人脸深度信息的深度图和可以有效描述深度图纹理特点的LBP特征,使用卷积神经网络对特征自动提取,在选择有效特征的同时使用了神经网络进行特征提取,将两个特征输出层作为识别网络的输入,实现特征融合,将改进的卷积神经网络和soft-max分类器结合,从而完成分类识别。(3)对本文设计的三维人脸识别系统进行测试,分别对人脸深度图像和其LBP特征进行实验,同时对单一特征实验进行对比,结果表明,本论文采用的特征融合方法具有较好的稳定性,与单一特征识别方法相比,本文设计的方法对识别的正确率有了一定的提高。
马超[10](2019)在《基于深度神经网络的三维目标检测与识别技术研究》文中研究说明计算机视觉作为一门研究利用传感器和计算机使机器“看”世界的科学学科,已经成为人工智能时代的重要研究领域。相比于二维图像,三维数据具有能提供三维空间几何信息、不受光照纹理变化影响等优势。随着三维数据获取技术的进步、计算能力的增强、深度学习技术的发展以及应用需求的增加,三维视觉技术的研究和应用受到了越来越多的关注。三维目标检测与识别是三维场景理解的关键技术,是机器理解世界并与世界交互的基础,在自动驾驶、智能机器人、AR&VR、遥感制图、生物医疗、战场感知等领域具有极其广阔的应用前景,近年来成为三维视觉领域的研究热点。本文围绕三维目标检测与识别任务深入展开理论与技术研究,并取得了如下研究成果。在三维目标检测方面,从单源数据和多源数据两个角度分别进行了三维目标检测算法的研究。针对纯点云数据的三维目标检测,首先提出了一种基于方柱体点云特征学习的鸟瞰特征图学习方法,利用基于PointNet++的点云网络通过端到端的方式学习鸟瞰特征图,然后提出了一种基于多尺度特征提取网络的鸟瞰图三维目标检测算法。整个算法具有良好的计算效率和三维检测性能,对小目标的检测表现良好。针对点云与图像融合的三维目标检测,首先提出了一种基于投影插值的点云特征与图像局部特征融合方法,并在此基础上构建了一个融合对应的点云特征与图像局部特征的三维目标检测网络F-FusionNet。同时,利用目标的二维包围框与三维包围箱之间的对应关系,提出了一种2D-3D包围框/箱对应损失函数,有助于提高对三维包围箱的估计精度。在三维目标识别方面,从多视图表示和体素表示两个角度分别进行三维目标识别算法的研究。针对三维数据的多视图表示,提出了一种联合卷积神经网络与双向LSTM的三维模型特征学习算法,并设计了一种CNN和LSTM联合网络的训练方法。该算法挖掘了三维目标多视角之间关联信息,提高了三维模型特征表示的辨别力。针对体素卷积神经网络计算量和内存消耗大的问题,提出了一种体素卷积神经网络二值化的方法。该方法通过在网络训练中二值化卷积层和全连接层的输入与网络权重参数,将体素卷积神经网络前向计算中的乘法运算转换为二值比特运算,从而极大地降低网络的计算量和内存消耗。
二、神经网络在二维零件图特征识别中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、神经网络在二维零件图特征识别中的应用(论文提纲范文)
(1)基于行为特征优化和深度学习的行为识别研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于传统人工特征的行为识别 |
1.2.2 基于深度学习的行为识别 |
1.3 研究内容与创新 |
1.4 本文的组织结构 |
第2章 基于骨架信息的三维连续降池化人体异常行为识别 |
2.1 引言 |
2.2 本章方法概述 |
2.3 人体骨架行为特征建模及优化方法 |
2.3.1 行为骨架模块 |
2.3.2 行为特征聚类模块 |
2.4 三维连续降池化卷积神经网络 |
2.5 实验与分析 |
2.5.1 数据集和实验设置介绍 |
2.5.2 实验评估与比较 |
2.6 本章小结 |
第3章 基于行为序列优化和双流网络的行为识别 |
3.1 引言 |
3.2 本章方法概述 |
3.3 行为序列优化 |
3.3.1 镜头分割 |
3.3.2 动态加权采样 |
3.4 基于三维卷积的双流分类网络 |
3.5 实验与分析 |
3.5.1 数据集和实验设置介绍 |
3.5.2 实验评估与比较 |
3.6 本章小结 |
第4章 基于人体骨架特征优化和自适应图卷积神经网络的行为识别 |
4.1 引言 |
4.2 本章方法概述 |
4.3 图卷积网络概述 |
4.3.1 图的概述 |
4.3.2 图卷积 |
4.3.3 图卷积过平滑问题 |
4.4 人体骨架特征优化方法 |
4.5 自适应图卷积神经网络 |
4.5.1 图结构掩码 |
4.5.2 有向图映射 |
4.5.3 自适应池化 |
4.6 实验与分析 |
4.6.1 数据集和实验设置介绍 |
4.6.2 实验评估与比较 |
4.7 本章小结 |
第5章 总结与展望 |
5.1 工作总结 |
5.2 研究展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(2)基于神经网络的手语运动区域分割与手语识别研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景与研究意义 |
1.2 国内外研究现状 |
1.2.1 数据获取方式 |
1.2.2 运动区域分割方式 |
1.2.3 手语识别方法 |
1.3 本文主要研究内容与结构安排 |
第二章 手语运动区域分割与手语识别常用算法 |
2.1 引言 |
2.2 运动区域分割常用算法 |
2.2.1 目标检测 |
2.2.2 语义分割 |
2.3 手语识别常用算法 |
2.3.1 3D卷积神经网络 |
2.3.2 循环神经网络 |
2.3.3 双流网络 |
2.4 本章小结 |
第三章 基于Deeplab V3+的手语运动区域分割 |
3.1 引言 |
3.2 基于Deeplab V3+的运动区域分割方案 |
3.3 Deeplab V3+框架 |
3.3.1 特征提取网络 |
3.3.2 空洞空间金字塔池化(ASPP) |
3.3.3 解码模块 |
3.4 实验 |
3.4.1 数据集 |
3.4.2 实验平台与参数 |
3.4.3 实验结果 |
3.4.4 实验对比 |
3.5 本章小结 |
第四章 基于运动区域分割图像与残差位移网络的手语识别 |
4.1 引言 |
4.2 基于运动区域分割与残差位移网络的手语识别框架 |
4.3 基于时域位移模块的残差网络 |
4.3.1 时域位移模块(TSM) |
4.3.2 残差网络 |
4.4 手语运动分析 |
4.5 实验 |
4.5.1 实验平台、数据与参数 |
4.5.2 评价指标 |
4.5.3 关键帧数量选取 |
4.5.4 实验结果 |
4.6 本章小结 |
第五章 基于改进双流网络的手语识别 |
5.1 引言 |
5.2 基于全局与运动区域局部图像的手语识别框架 |
5.3 手语识别双流网络 |
5.3.1 全局图像分支 |
5.3.2 运动区域局部分支 |
5.4 数据融合 |
5.5 实验 |
5.5.1 实验平台、数据及参数 |
5.5.2 全局图像分支实验结果 |
5.5.3 整体框架实验结果 |
5.5.4 实验对比及分析 |
5.5.5 自采数据验证 |
5.6 本章小结 |
第六章 结论与展望 |
6.1 结论 |
6.2 展望 |
6.3 主要创新点 |
参考文献 |
致谢 |
攻读学位期间主要科研成果 |
(3)基于深度学习的手绘草图生成、识别及应用研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 主要研究内容与研究成果 |
1.4 论文组织结构 |
2 相关理论基础与方法 |
2.1 草图生成 |
2.1.1 基于手工设计和深度特征的草图生成 |
2.1.2 基于手工设计和深度特征的轮廓提取 |
2.2 草图识别 |
2.2.1 基于卷积神经网络的特征提取 |
2.2.2 基于手工设计特征的草图识别 |
2.2.3 基于深度特征的草图识别 |
2.3 草图检索 |
2.3.1 基于手工设计特征的草图检索 |
2.3.2 基于深度特征的草图检索 |
2.4 本章小结 |
3 基于多尺度策略的自然图像草图化方法 |
3.1 研究动机 |
3.2 基于多尺度策略的自然图像草图化方法 |
3.2.1 基于多尺度和多层次的卷积神经网络 |
3.2.2 基于数学形态学的草图修正算法 |
3.2.3 基于空间插值的草图变形算法 |
3.3 实验与分析 |
3.3.1 实验数据集及参数设置 |
3.3.2 实验结果评价指标 |
3.3.3 实验结果及分析 |
3.3.4 对比实验分析 |
3.4 本章小结 |
4 基于外观信息和形状信息融合的草图识别方法 |
4.1 研究动机 |
4.2 基于外观和形状信息的双分支融合网络方法 |
4.2.1 形状特征提取网络 |
4.2.2 外观特征提取网络 |
4.2.3 双分支融合网络的草图识别 |
4.2.4 双分支融合网络的草图检索 |
4.3 实验与分析 |
4.3.1 实验数据集及参数设置 |
4.3.2 实验结果评价指标 |
4.3.3 双分支融合网络的草图识别实验 |
4.3.4 双分支融合网络的草图检索实验 |
4.3.5 对比实验分析 |
4.4 本章小结 |
5 基于网络互学习的手绘草图识别方法 |
5.1 研究动机 |
5.2 基于网络互学习的手绘草图识别方法 |
5.2.1 基于多层融合的纹理特征提取网络 |
5.2.2 基于图卷积的结构特征提取网络 |
5.2.3 基于互学习策略的网络损失函数 |
5.3 实验与分析 |
5.3.1 实验数据集 |
5.3.2 实验参数设置 |
5.3.3 实验结果评价指标 |
5.3.4 互学习网络的草图识别实验 |
5.3.5 互学习网络的草图检索实验 |
5.3.6 互学习网络的分析与可视化 |
5.4 本章小结 |
6 基于中层语义表示的行为识别方法 |
6.1 研究动机 |
6.2 基于卷积神经网络的判别力草图生成方法 |
6.2.1 基于视频的草图生成网络 |
6.2.2 基于注意力机制的草图修正 |
6.3 基于双分支卷积神经网络的视频草图识别方法 |
6.3.1 基于图像级的行为识别 |
6.3.2 基于点级的行为识别 |
6.4 实验分析 |
6.4.1 实验数据集及网络参数设置 |
6.4.2 网络结构的设计分析 |
6.4.3 网络结构的设计验证 |
6.4.4 行为识别对比实验 |
6.5 本章小结 |
7 总结与展望 |
7.1 本文工作总结 |
7.2 未来工作展望 |
参考文献 |
攻读博士学位期间发表的学术论文 |
学位论文数据集 |
(4)基于深度学习的非模型法步态识别研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 步态识别的研究背景及意义 |
1.1.1 步态识别的研究背景 |
1.1.2 步态识别的研究意义 |
1.2 步态识别的研究现状 |
1.2.1 基于模型的方法 |
1.2.2 基于非模型的方法 |
1.2.3 基于深度学习的步态识别研究现状 |
1.3 论文的选题依据与研究内容 |
1.3.1 选题依据 |
1.3.2 本文研究内容 |
1.3.3 本文特色与创新 |
第2章 步态识别基本原理 |
2.1 步态识别流程 |
2.2 步态识别判别方法 |
2.2.1 判别式方法 |
2.2.2 生成式方法 |
2.3 步态数据库 |
2.4 步态图像预处理 |
2.4.1 行人检测 |
2.4.2 形态学处理 |
2.4.3 步态图像归一化 |
2.5 卷积神经网络 |
2.5.1 卷积层 |
2.5.2 非线性激活函数 |
2.5.3 池化层 |
2.6 本章小结 |
第3章 基于胶囊网络和反馈权重矩阵的步态识别 |
3.1 步态识别的通用模型 |
3.2 基于步态能量图的步态识别模型 |
3.3 基于胶囊网络和反馈权重矩阵的步态识别 |
3.3.1 视角不变的步态识别网络 |
3.3.2 步态特征的提取 |
3.3.3 输入图像的更新 |
3.3.4 胶囊网络 |
3.4 实验 |
3.4.1 数据集和训练细节 |
3.4.2 反馈权重矩阵对识别性能的影响 |
3.4.3 不同胶囊网络层数对识别性能的影响 |
3.4.4 不同行走条件下跨视角的步态识别 |
3.5 本章小结 |
第4章 基于集合池化层的步态识别 |
4.1 基于视频序列特征法步态识别模型 |
4.2 基于集合池化层的步态识别 |
4.2.1 步态轮廓图的无序输入 |
4.2.2 浅层特征和深层特征的汇聚 |
4.2.3 判别空间的建立 |
4.3 实验 |
4.3.1 训练细节 |
4.3.2 任意数量的轮廓图对识别性能的影响 |
4.3.3 不同视角的轮廓图对识别性能的影响 |
4.3.4 不同行走条件的轮廓图对识别性能的影响 |
4.4 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间取得的研究成果与参与的科研项目 |
(5)递归图和卷积神经网络在桥梁损伤识别中的应用(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 结构损伤识别研究现状 |
1.2.2 基于神经网络的桥梁损伤识别研究现状 |
1.2.3 递归分析技术研究现状 |
1.3 本文研究内容 |
1.4 论文组织与框架 |
2 递归图法与递归量化分析 |
2.1 递归图法 |
2.1.1 递归图 |
2.1.2 递归图的组成与含义 |
2.2 递归量化分析 |
2.3 相空间重构 |
2.3.1 基于伪邻域法的嵌入维度选取 |
2.3.2 基于平均互信息法的延迟系数选取 |
2.4 算例分析 |
2.5 本章小结 |
3 卷积神经网络的基本原理 |
3.1 卷积神经网络的概念 |
3.1.1 卷积神经网络的起源 |
3.1.2 卷积神经网络工作原理 |
3.2 卷积神经网络的典型结构 |
3.2.1 LeNet |
3.2.2 AlexNet |
3.2.3 VGGNet |
3.2.4 GoogLeNet |
3.2.5 区域卷积神经网络(region-based CNN) |
3.3 VGG-16 |
3.4 本章小结 |
4 基于递归图和卷积神经网络的斜拉桥损伤模拟研究 |
4.1 有限元模型建立 |
4.1.1 斜拉索单元选取 |
4.1.2 主梁主塔单元的选取 |
4.1.3 模型加载 |
4.2 损伤工况设置 |
4.2.1 损伤位置及损伤工况 |
4.2.2 采集点的选择 |
4.2.3 数据处理 |
4.3 递归处理 |
4.3.1 递归参数计算 |
4.3.2 构造递归图 |
4.4 卷积神经网络测试识别 |
4.5 递归量化分析 |
4.6 本章小结 |
5 递归图和卷积神经网络在简支梁试验中的应用 |
5.1 试验内容概括 |
5.1.1 试验目的 |
5.1.2 试验内容 |
5.1.3 实验步骤 |
5.2 简支梁模型的搭建 |
5.2.1 模型介绍 |
5.2.2 损伤工况 |
5.3 递归分析 |
5.3.1 递归图分析 |
5.3.2 递归量化分析 |
5.4 卷积神经网络处理 |
5.5 本章小结 |
6 总结与展望 |
6.1 主要工作及结论 |
6.2 展望 |
参考文献 |
致谢 |
作者简历及攻读硕士学位期间的科研成果 |
(6)行人步态识别方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 步态表征 |
1.2.2 特征提取 |
1.2.3 度量学习 |
1.3 本文主要工作和章节安排 |
第2章 相关基础理论和知识 |
2.1 卷积神经网络 |
2.2 步态识别 |
2.2.1 步态识别概述 |
2.2.2 评价指标 |
2.2.3 公开数据集 |
2.3 本章小结 |
第3章 监控视频步态提取方法研究 |
3.1 概述 |
3.2 步态提取方法 |
3.2.1 小目标检测模块 |
3.2.2 强特征孪生追踪模块 |
3.3 实验结果与分析 |
3.3.1 小目标检测实验结果 |
3.3.2 追踪模块实验结果 |
3.3.3 实际场景中步态能量图提取效果 |
3.4 校园监控步态数据集 |
3.5 本章小结 |
第4章 基于多尺度网络的步态识别方法研究 |
4.1 概述 |
4.2 多尺度步态识别网络 |
4.2.1 多尺度识别网络结构设计 |
4.2.2 网络损失函数设计 |
4.3 实验结果与分析 |
4.3.1 实验配置 |
4.3.2 损失函数实验 |
4.3.3 多尺度网络实验 |
4.3.4 校园监控数据集实验 |
4.4 本章小结 |
第5章 基于生成对抗网络的步态识别方法研究 |
5.1 概述 |
5.2 跨视角步态生成对抗网络 |
5.2.1 网络设计 |
5.2.2 基于生成图像的匹配算法 |
5.3 实验结果与分析 |
5.3.1 实验配置 |
5.3.2 实验结果 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 本文总结 |
6.2 研究展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
(7)基于3D卷积神经网络的三维模型识别及检索研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文研究的主要内容 |
1.4 论文的组织安排 |
第2章 深度学习及其相关技术介绍 |
2.1 卷积神经网络 |
2.1.1 卷积层 |
2.1.2 池化层 |
2.1.3 全连接层 |
2.1.4 深度卷积神经网络模型的训练方法 |
2.1.5 深度卷积神经网络的过拟合及其控制 |
2.1.6 深度卷积神经网络模型的保存 |
2.2 VGGNet深度学习模型 |
2.3 3D卷积神经网络 |
2.3.1 3D卷积 |
2.3.2 3D池化层 |
2.4 本章小结 |
第3章 权值优化集成卷积神经网络及其在三维模型识别中的应用 |
3.1 三维模型数据表示 |
3.2 三维模型数据集 |
3.3 三维模型投影视图 |
3.4 权值优化集成卷积神经网络 |
3.4.1 网络模型 |
3.4.2 权值优化集成算法 |
3.5 实验结果与分析 |
3.6 本章小结 |
第4章 基于自适应加权集成卷积神经网络的三维模型识别 |
4.1 自适应加权集成卷积神经网络 |
4.1.1 网络模型 |
4.1.2 基于熵的权值优化集成算法 |
4.2 实验结果及分析 |
4.3 本章小结 |
第5章 基于权值优化集成3D卷积神经网络的三维模型识别及检索 |
5.1 三维模型渲染图视频化 |
5.2 三维模型的体素化 |
5.3 基于视频的3D卷积深度学习模型 |
5.4 基于体素化形式的3D卷积深度学习模型 |
5.5 权值优化集成3D卷积神经网络 |
5.6 基于识别结果的三维模型检索 |
5.7 实验结果及分析 |
5.8 本章小结 |
第6章 总结和展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
作者简介 |
攻读硕士学位期间研究成果 |
(8)神经网络在通信信号调制识别中的应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外现状 |
1.2.1 基于似然比理论的方法 |
1.2.2 基于特征提取理论的方法 |
1.2.3 基于神经网络的方法 |
1.3 论文主要工作及安排 |
第二章 传统调制识别理论 |
2.1 高阶累积量 |
2.1.1 高阶累积量理论 |
2.1.2 MPSK和 MQAM信号高阶累计量理论值 |
2.1.3 基于高阶累积量的调制识别流程及仿真 |
2.2 小波变换 |
2.2.1 小波变换原理 |
2.2.2 MPSK信号和MQAM信号Haar小波变换 |
2.2.3 基于小波变换的调制识别流程 |
2.3 循环谱 |
2.3.1 循环谱理论 |
2.3.2 数字调制信号的谱特性 |
2.4 本章小结 |
第三章 基于神经网络的调制识别技术研究 |
3.1 神经网络基础 |
3.1.1 损失函数 |
3.1.2 权重初始化 |
3.1.3 激活函数 |
3.2 四种神经网络模型原理 |
3.2.1 卷积神经网络 |
3.2.2 复数卷积神经网络 |
3.2.3 循环神经网络 |
3.2.4 CLDNN |
3.3 改进的CLDNN模型 |
3.3.1 复数卷积层数对性能的影响 |
3.3.2 LSTM层数对性能的影响 |
3.3.3 卷积核数目对性能的影响 |
3.4 仿真结果及分析 |
3.5 本章小结 |
第四章 基于Finetune与中心损失的调制识别方法 |
4.1 迁移学习算法 |
4.1.1 基本概念 |
4.1.2 Finetune理论 |
4.2 中心损失算法 |
4.3 基于Finetune和中心损失算法的神经网络设计 |
4.3.1 实验数据集 |
4.3.2 网络结构的搭建 |
4.4 仿真结果及分析 |
4.4.1 源域数据仿真结果 |
4.4.2 基于Finetune的调制识别仿真结果 |
4.4.3 基于中心损失算法的调制识别仿真结果 |
4.4.4 基于Finetune和中心损失算法的调制识别仿真结果 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 未来展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得成果 |
(9)基于深度学习的三维人脸图像识别研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 深度学习研究现状 |
1.2.2 卷积神经网络研究现状 |
1.2.3 人脸识别研究现状 |
1.3 人脸识别的应用 |
1.4 论文的主要工作和结构安排 |
第二章 深度学习与人脸识别 |
2.1 深度学习 |
2.1.1 人工神经网络 |
2.1.2 多层感知器 |
2.2 卷积神经网络 |
2.2.1 卷积神经网络概述 |
2.2.2 卷积神经网络重要特性 |
2.2.3 卷积神经网络模型训练过程 |
2.3 人脸识别 |
2.3.1 人脸识别研究内容 |
2.3.2 二维人脸识别 |
2.3.3 三维人脸识别 |
2.4 本章小节 |
第三章 三维人脸识别数据的预处理 |
3.1 三维人脸数据对人脸识别的重要意义 |
3.2 三维人脸数据库 |
3.2.1 国内外常用三维人脸数据库介绍 |
3.2.2 本文使用的三维数据库介绍 |
3.3 三维数据的预处理 |
3.4 人脸深度图像的预处理 |
3.5 本章小结 |
第四章 基于深度学习的三维人脸识别技术研究 |
4.1 本文三维人脸识别系统结构 |
4.2 基于LBP的深度人脸图像特征提取 |
4.2.1 LBP介绍 |
4.2.2 LBP特征提取 |
4.3 基于深度学习的三维人脸识别模型 |
4.3.1 网络的输入层和输出层 |
4.3.2 卷积层 |
4.3.3 激活函数的选择 |
4.3.4 特征融合 |
4.4 实验软件的环境选择 |
4.5 实验结果及分析 |
4.5.1 基于人脸深度图LBP特征识别实验结果 |
4.5.2 基于人脸深度图识别实验结果 |
4.5.3 基于特征融合的识别实验结果 |
4.5.4 对比实验 |
4.5.5 卷积网络可视化 |
4.6 本章小结 |
总结和展望 |
参考文献 |
致谢 |
个人简历、在学期间的研究成果及发表的学术论文 |
(10)基于深度神经网络的三维目标检测与识别技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题背景与研究意义 |
1.2 三维数据获取与表示概述 |
1.2.1 三维数据获取技术 |
1.2.2 三维数据表示形式 |
1.2.3 三维公共数据集 |
1.3 相关技术研究现状 |
1.3.1 三维目标识别技术研究现状 |
1.3.2 三维目标检测技术研究现状 |
1.4 本文主要工作 |
1.5 本文内容安排 |
第二章 点云数据三维目标检测算法 |
2.1 引言 |
2.2 问题描述与分析 |
2.3 PointNet与PointNet++网络 |
2.3.1 PointNet网络 |
2.3.2 PointNet++网络 |
2.4 基于方柱体点云特征学习的鸟瞰特征图学习算法 |
2.5 基于多尺度鸟瞰特征图的三维目标检测算法 |
2.5.1 算法框架概述 |
2.5.2 多尺度特征提取网络 |
2.5.3 目标分类与参数回归 |
2.5.4 损失函数 |
2.6 实验结果与分析 |
2.6.1 数据集与预处理 |
2.6.2 参数设置 |
2.6.3 三维目标检测结果 |
2.6.4 网络模块性能测试 |
2.6.5 可视化分析 |
2.6.6 实验细节讨论 |
2.7 本章小结 |
第三章 点云与图像融合的三维目标检测算法 |
3.1 引言 |
3.2 基于投影插值的点云与图像特征融合方法 |
3.2.1 点云与图像数据融合策略 |
3.2.2 基于投影插值的的特征融合方法 |
3.3 基于点云图像特征融合与2D-3D对应损失的三维目标检测算法 |
3.3.1 F-PointNet网络局限性 |
3.3.2 三维目标检测网络F-Fusion Net |
3.3.3 2D-3D包围框/箱对应损失 |
3.4 实验结果与分析 |
3.4.1 实验设置 |
3.4.2 三维目标检测结果 |
3.4.3 可视化分析 |
3.5 本章小结 |
第四章 基于多视图表示的三维目标识别方法 |
4.1 前言 |
4.2 循环神经网络基础 |
4.3 基于多视图双向LSTM的三维模型特征学习 |
4.3.1 深度网络结构概述 |
4.3.2 基于CNN的视角图像特征学习 |
4.3.3 基于双向LSTM的视角特征集成 |
4.3.4 序列权重层 |
4.3.5 Highway网络 |
4.4 CNN与 LSTM联合网络训练方法 |
4.4.1 数据集与预处理 |
4.4.2 联合网络训练方法 |
4.5 实验结果与分析 |
4.5.1 三维模型识别实验 |
4.5.2 三维模型检索实验 |
4.5.3 三维模型特征表示可视化 |
4.6 本章小结 |
第五章 基于体素表示的三维目标识别方法 |
5.1 引言 |
5.2 体素卷积神经网络与三维目标识别 |
5.3 基于二值化体素卷积神经网络的三维目标识别 |
5.3.1 方法概述 |
5.3.2 输入与网络权重参数二值化 |
5.3.3 二值化卷积/全连接层 |
5.3.4 损失函数 |
5.3.5 二值型体素卷积神经网络 |
5.4 二值型体素卷积网络的计算量与内存分析 |
5.5 实验结果与分析 |
5.5.1 体素卷积神经网络二值化性能评估 |
5.5.2 与已有方法的性能比较 |
5.5.3 不同模块对性能的影响 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
四、神经网络在二维零件图特征识别中的应用(论文参考文献)
- [1]基于行为特征优化和深度学习的行为识别研究[D]. 熊辛. 南昌大学, 2021(02)
- [2]基于神经网络的手语运动区域分割与手语识别研究[D]. 蔡畅. 广西大学, 2021(12)
- [3]基于深度学习的手绘草图生成、识别及应用研究[D]. 张兴园. 北京交通大学, 2020
- [4]基于深度学习的非模型法步态识别研究[D]. 侯健. 湘潭大学, 2020(02)
- [5]递归图和卷积神经网络在桥梁损伤识别中的应用[D]. 王策. 大连海事大学, 2020(01)
- [6]行人步态识别方法研究[D]. 张锐. 中国科学技术大学, 2020(01)
- [7]基于3D卷积神经网络的三维模型识别及检索研究[D]. 王亚. 长春工业大学, 2020(01)
- [8]神经网络在通信信号调制识别中的应用研究[D]. 任艳. 电子科技大学, 2020(07)
- [9]基于深度学习的三维人脸图像识别研究[D]. 付卫华. 福州大学, 2019(12)
- [10]基于深度神经网络的三维目标检测与识别技术研究[D]. 马超. 国防科技大学, 2019(01)