一、使用Word快速转换图片文件格式(论文文献综述)
周璐喆[1](2021)在《面向PDF文件的研招数据辅助整合软件研发》文中研究说明随着大学生“考研热”的居高不下,考生对于考研信息的需求开始日益增加。由于现有的提供考研信息的平台在查询院校信息时存在着数据散乱且第三方网页过多的缺陷,实验室团队计划整合网络上的考研信息并做进一步分析实践,从而为考生提供更好的服务。整合研究生招生名单数据是整个考研信息整合课题的一部分,由于实验室团队成员前期收集的研究生招生名单中半数以上为PDF文件,且人工整合PDF文件中表格数据有着不小的麻烦,因此本文研发了一个面向PDF文件的研招数据辅助整合软件,力求降低团队成员在整合PDF格式的研招数据文件时的困难。围绕该课题,本文进行了如下的工作。(1)对收集到的4663份PDF格式的研究生招生名单进行逐一浏览和分析,归纳待解决的问题,并确定接下来需要着重解决的PDF表格信息整合的主要问题,包括PDF表格抽取时的表格框线的缺失、子表结构、合并单元格结构、复杂表头结构以及跨页段表的问题,在表格信息整合时的额外信息的文本字段挖掘问题,以及在数据入库时的表格数据列匹配问题。针对这些问题的进行了解决方案设想,并以此分析了软件应该具有的功能点和模块。(2)设计了面向PDF文件的研招表格数据整合模型,同时搭建了软件的架构。(3)对面向PDF文件的研招数据整合软件的功能模块进行了详细的内部设计。包括PDF文档操作模块相关类设计、PDF表格识别提取模块相关类的设计、表格与信息预处理模块相关类设计、表格数据集成模块相关类设计,并阐明类设计中各个主要方法的功用。(4)设计了PDF表格识别与提取算法策略、文本信息挖掘算法策略、表格数据列匹配算法策略。详细阐述了每种算法运作的方式。(5)详细介绍了面向PDF文件的研招数据辅助整合软件的实现情况。包括对本软件的整体界面的说明,以及以案例演示的方式对PDF文档操作模块、PDF表格识别提取模块、表格与信息预处理模块、表格数据整合模块的实现流程的阐述。并通过实际整合一组PDF研招名单的实验来突出本软件相对优化前的Python库以及类似软件的优势。论文的创新之处有以下几点。(1)优化了PDF表格数据提取库pdfplumber,可以有效提升有框线表的提取准确率,并且在面对复杂表头、合并单元格、子表和跨页表等复杂情况的表格提取时能够更好的应对。(2)实际应用分布式词向量模型Word2vec并结合余弦相似度的方式让表格之间相同语义的数据列能够自动互相匹配,减少了人工匹配数据的麻烦。(3)设计了一套面向PDF文件的研招表格类型数据的整合模型,并依据该模型开发了面向PDF文件的研招数据辅助整合软件,降低了人工整合数据的困难,有效推进了实验室团队数据整合课题的进度,为后期的数据分析打下了基础。
陈晓茵[2](2021)在《教学云平台中教学资源自动审核的设计与实现》文中研究说明近年来,随着全球疫情局势的蔓延以及信息技术的革新发展,网上教学模式蓬勃兴起,使得在线教学平台得到了大力地推广应用。随之而来的是教学资源的内容安全性越来越受到重视。教学平台需要对用户上传的教学资源进行内容审核,以确保教学资源符合相关国家法律法规。当前,教学云平台主要依赖人工来完成平台上教学资源的内容审核。受制于人工审核的成本较大、效率低下、缺少统一审核标准的问题,教学云平台迫切地需要一个能够针对多种不同形式的教学资源进行精准审核、性能优良效率高的教学资源自动审核系统。因此,本文针对视频、图像、文本类型的教学资源,设计并实现了一个教学资源自动审核系统,以解决教学云平台人工审核教学资源的痛点问题。本文的研究工作主要包括以下两个方面:(1)调研相关技术以及现有的内容审核的实现方案,结合教学云平台的业务需求,梳理并划分自动审核系统的各个模块,设计并实现一个包含有针对文本资源的敏感词汇检测、针对图像资源的色情内容检测技术以及针对视频资源的暴力行为检测三大功能的教学资源自动审核系统,并使用感知哈希算法实现图像指纹库,用于降低人工审核负担。(2)调查研究现有的基于视频的暴力行为检测算法,通过比较传统的特征提取和分类器相结合的识别模型与深度学习模型的优缺点,结合方向梯度直方图(HOG)与运动尺度不变特征变换(MoSIFT)方法、颜色布局描述子(CLD)来提取视频资源的时空关系特征,设计并实现了对视频资源的暴力行为检测模块。最后,本文对教学资源自动审核系统进行了全面的测试,测试结果有效的验证了自动审核系统的有效性、可行性。本文提出的自动审核方法对于教学资源的内容安全监测有一定的参考价值。
盛再超[3](2021)在《基于多算法融合的Logo识别定位系统设计》文中研究指明企业、组织及机构会设计自身的Logo,并有详细的Logo使用规范,为了使Logo符合使用规范,大型企业逐渐开始对文件中Logo的使用正确性进行检查。目前企业采用人工识别定位Logo的模式开展检查工作,这种模式人力成本耗费巨大,并且存在漏检、时效性不高、记录无法存档等问题,效果不佳。本文首先讨论采用YOLO识别模型来完成识别定位任务,通过网络爬虫技术和数据增强技术制作了研究对象的自定义数据集,基于该数据集的测试结果发现,利用YOLO识别模型完成识别任务存在局限性,无法达到识别精度要求。因此,为了达到识别精度要求,设计了一套多算法融合的Logo识别定位算法,该算法基于YOLO目标识别定位算法进行定位,引入光学字符识别算法辅助YOLO定位Logo,经过PDF解析的文本筛选算法筛选文档中出现的文字性Logo,汇总各算法的输出结果,再经过数据处理筛选流程中的重叠区域筛选算法、Logo背景分离算法和Logo形态学检查算法处理,以多种技术手段融合的模式,实现Logo的准确框选。随后,基于该算法设计开发了一套Logo识别定位系统,该系统采用前后端分离架构,用户仅需上传文件,系统会异步处理识别定位任务,待任务完成后,反馈识别定位结果,并持久化数据。最后经测试,系统综合精确率为98.70%,综合召回率为99.11%,三种Logo类别的精确率均超过95%,并具有文件管理、结果显示、任务异步处理、识别记录存档等功能。企业使用本系统能够极大地节约人力成本,加速业务流程,提升工作效率。
崔旭东[4](2020)在《文档共享转换服务器的设计与实现》文中进行了进一步梳理随着通信网络与计算机技术的进步,网络视频会议技术得到了广泛的应用与发展。它通过传输线路及多媒体设备将多个地方的用户互联,从而实现即时互动的沟通。在这类视频会议系统中,要想进行资料的共享,必须增加一个双流模块。有了它之后,双方才能看到本地PC机上PPT、Word等数据文档。但这种数据传输是单向的,只能一端发送,一端观看。对于许多客户群体来说,他们需要双方同时对文档进行讨论和修改。传统的资料共享方式满足不了他们的需求。针对上述问题,本文整合、优化多种文档编辑和转换技术,并实现了一种Web应用服务器:文档共享转换服务器。该系统基于J2EE架构,使用Tomcat作为Web应用服务器,使用Open Office提供文档编辑服务,使用JODConverter对文档(PPT,Word,Excel等Office文档)进行转换,使用ICEPdf对PDF文档进行图片转换处理。该系统可以对多种文档格式进行转换,为数据会议中的电子白板提供文档转换服务。它同时也能为第三方的应用提供服务。论文讨论了文档共享转换服务器的总体分析、详细设计与具体实现,并进行了系统测试。测试结果表明,本文设计的文档共享转换服务器达到了设计的目标。
徐惟康[5](2020)在《基于SAO结构的专利创造性检索系统的设计与实现》文中进行了进一步梳理随着技术的快速发展,企业之间的竞争从市场渐渐转移到了技术上,这种变革对企业对技术的掌控提出了更高的要求。专利是技术在法律框架下的载体,企业对其专利的保护也要通过专利来实现。专利文本的挖掘和研究,是技术保护的有效手段。通过研究专利,可以实现技术路线绘制、技术趋势预测等功能,这种技术上的前瞻性对企业和国家的发展有着重要的指导意义。因此,如何从专利文本中挖掘中有效的信息,是当前一个严峻的挑战。传统的解决方案大多数基于特定规则,如基于IPC分类号的专利分类,而这种规则往往不够全面和准确。近些年的研究发现,使用基于深度学习的文本挖掘技术在专利文本上往往能够取得更好的效果,本文设计并实现了一个专利创造性判断系统,该系统不仅仅可以适用于专利审查员也可以适用于一般用户。当需要判断分析一个专利的创造性的时候,需要把该专利的权利要求输入本系统,并利用本系统提供的检索模块检索相关专利。进一步的,本文提出了一种基于专利权利要求SAO结构的专利相似度判断方法,基于该方法计算待对比专利和对比专利的相似度,并通过一个经验公式最终计算待对比专利的相似度。在计算专利SAO结构相似度的时候,需要借助依存句法分析和word2vec计算词语的相似度,前者本系统采用了一些成熟优秀的开源框架,而对于word2vec词向量的获取,本系统使用专利文本进行训练。因此,在本系统中无论是专利检索和词向量的训练都需要大量的专利文本,为此本系统开发了一个专利文本数据采集模块,该模块抓取专利的文本信息和专利的PDF信息。并且考虑到专利数据会周期性的更新,采集模块也会采取相应的措施保证系统数据的时效性。
赵帛粟[6](2020)在《《微生物组学分析》汉译实践报告》文中认为历经2020年全球爆发的新冠肺炎疫情,微生物学研究的重要性得到了全社会的认可。但是这类书籍却大多为英文版,不便于我国的研究人员阅读和学习。因此此类书籍的翻译工作具有一定的推动我国的微生物技术普及和发展的意义。此篇翻译实践报告的源文本《微生物组学分析》是涉及生物学和计算机科学的指导性书籍,其具有客观、专业、严谨、目的性较强等特点。同时考虑到本次翻译任务是使读者理解并掌握书中所介绍的技术,因此采用了功能派理论的目的论作为本次翻译实践的指导理论。目的论使译者能够以更加灵活的方式翻译出更容易被理解的译文。在翻译前,译者通过反复阅读文献,补充学习专业知识,以做到较为深入地理解源文本;翻译时,在恪守目的论三原则的基础上灵活运用了各类翻译方法和翻译技巧,尽力降低阅读难度;翻译后,在老师们和同学们的帮助下校对译文,使译文质量得到保证。翻译工作完成后,译者从目的原则、连贯原则、忠实原则出发,以翻译方法或翻译技巧作为归类依据,分析并展示了《微生物组学分析》这一科技类文本中部分翻译难点的典型示例,并且结合例句总结了翻译过程中采用的各类翻译方法和翻译技巧,以期望对今后的微生物信息分析类科技文本的翻译起到参考和借鉴的意义。
骆蓉,黄俊,黎茂锋,刘志勤[7](2020)在《基于Word模板的复杂文档快速生成方法》文中研究说明为了降低生成复杂Word文档的开发难度并减少工作量,提出一种基于Word模板的复杂文档快速生成方法。以Word文档为模板,基于OOXML规范实现Word文档的动态生成,并通过Enjoy模板引擎技术生成主文档部件document.xml,提高了文档生成效率;为解决引入模板引擎造成的模板制作问题,设计一组模板指令,并进行指令规范化以及指令解析处理,开发者可直接通过Word文档生成document.xml文件的Enjoy模板。实验表明,该方法模板制作简单,文档生成效率高,所占内存小,后期维护容易,适用于较大数据量的复杂文档生成,具有较高的实用价值。
赵凯月[8](2020)在《基于卡口图像的妨碍驾驶及涉牌违法行为识别研究》文中研究说明随着道路交通的持续发展,机动车保有量也在日益增长,与此同时,机动车辆的违法行为发生频率也呈现出上升趋势,交通违法行为逐渐成为影响公共交通安全的主要因素。违法行为造成了道路交通秩序的混乱,为了解决此类问题,本文结合目标检测相关算法,以大量存在违法行为的卡口图片为基础进行分析,整个违法行为的识别由污损遮挡号牌识别和驾驶过程中妨碍安全驾驶识别两部分组成。首先,针对违法行为中的污损遮挡号牌问题,使用YOLOv3对图像进行三分类,根据遮挡程度不同,图片中的号牌可分为正常号牌、未悬挂、遮挡号牌三种,OCR算法进一步在遮挡号牌种类的基础上,通过匹配号牌的文本格式,达到区分半遮挡号牌和全遮挡号牌的目的,最终实现对污损遮挡号牌的识别。其次,针对驾驶中的违法行为识别,使用图卷积网络解决多标签之间拓扑结构关系的方法。该方法分为多标签模型和词向量模型两部分,其中词向量模型输出标签的向量表示,多标签模型将残差卷积神经网络提取到的图像特征输入图卷积神经网络完成与标签对应词向量的映射关系,实现“开车未系安全带”、“开车拨打接听电话”和“开车吸烟”三种行为的识别。综上所述,本文中算法通过实际测试均达到了比较好的结果,其中污损遮挡号牌识别平均准确率在90.70%~95.24%之间,驾驶车辆中存在的违法行为识别的准确率则在82.10%~94.45%之间,除了在准确率方面,算法的推理速度也能满足系统的实时性要求。通过对妨碍安全驾驶和涉牌违法行为的识别研究,进一步规范道路交通秩序,有序预防道路交通事故,保障交通安全,营造安全、有序的交通安全环境。
金鹏[9](2020)在《PDF论文的重编辑与处理系统的研究与开发》文中研究说明自从PDF文档问世以来,以其诸多的优良特性已经在学术界和工业界被广泛的使用。大量的文档资料以PDF格式被存档,读者只需要借助任意的PDF阅读器就可以方便的浏览其中所包含的信息。随着科技和文化的飞速发展,学术界已经积累了海量以PDF格式存档的论文,这其中绝大多数的论文内容的排版结构都是可以适配于PC端,在PC端可以渲染出良好的效果。目前移动互联网时代已经来临,各式各样的移动设备已经普及,由于移动设备不受时间和空间的约束同时具备良好的交互性等优势,越来越多的人群倾向于通过移动设备浏览和获取信息。然而PDF格式文件一旦被生成,其包含信息的排版格式是固定不变的,对于在PC端渲染良好的PDF学术论文,并不一定适合在屏幕尺寸较小移动设备上,这使得PDF学术论文在移动设备端的阅读体验大打折扣。本文以学术界PDF格式论文作为研究对象,介绍了当前PDF文档格式的转换技术,PDF包含信息的提取技术和渲染技术,同时对系统中涉及到的处理流程进行深入分析,设计了高效的处理模型用于优化系统的处理能力提高系统的处理效率。本文完成了对PDF学术论文多种格式的转化工作,并借助现有技术对PDF论文的内容进行分块处理,设计了基于HTML文档树的文本信息抽取算法和渲染样式信息的抽取算法,将提取出的本文信息按照一定的顺序结构进行重排版,同时对控制文本的渲染信息进行过滤处理,使得渲染信息能够良好的控制文本信息的渲染样式,最后将排版后的内容基于HTML格式作为输出结果。总的来说,本文的工作是提出一种高效的解决方案,使得PDF论文能够在移动设备端被渲染得更优雅。最后对系统进行实际测试,验证了本系统可以自动化的对PDF论文的内容进行提取,而后对提取出的内容进行编辑排版,使得排版后的内容在移动终端能够达到较好的展示效果,本文的研究内容有利于使PDF文档在移动设备端呈现更加友好的渲染方式,同时对PDF文件文包含文本信息和非文信息的提取工作开阔了新的思路。
教育部[10](2020)在《教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知》文中指出教材[2020]3号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:为深入贯彻党的十九届四中全会精神和全国教育大会精神,落实立德树人根本任务,完善中小学课程体系,我部组织对普通高中课程方案和语文等学科课程标准(2017年版)进行了修订。普通高中课程方案以及思想政治、语文、
二、使用Word快速转换图片文件格式(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、使用Word快速转换图片文件格式(论文提纲范文)
(1)面向PDF文件的研招数据辅助整合软件研发(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景 |
1.1.1 大学生“考研热”居高不下 |
1.1.2 考研教育数据信息的需求日益增加 |
1.1.3 现有的提供考研教育信息的平台存在不足 |
1.1.4 整合PDF文件的研究生招生数据存在困难 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 PDF表格数据提取 |
1.3.2 文本信息挖掘 |
1.3.3 异构数据整合与文本相似性 |
1.4 研究内容与技术路线 |
1.4.1 研究内容 |
1.4.2 技术路线 |
1.5 论文组织结构 |
第2章 研究基础与相关技术 |
2.1 研招数据整合基本含义 |
2.2 PDF表格提取相关算法 |
2.2.1 PDF简介 |
2.2.2 pdfplumber库 |
2.3 短文本相似性相关算法 |
2.3.1 Word2vec概述 |
2.3.2 余弦相似度 |
2.4 软件相关技术介绍 |
2.5 本章小结 |
第3章 面向PDF文件的研招数据辅助整合软件需求分析 |
3.1 PDF表格数据整合的整体分析 |
3.1.1 PDF表格抽取分析 |
3.1.2 表格数据整合分析 |
3.2 软件用例分析 |
3.2.1 PDF文档操作模块用例分析 |
3.2.2 PDF表格识别与提取模块用例分析 |
3.2.3 表格与信息预处理模块用例分析 |
3.2.4 表格数据整合模块用例分析 |
3.3 软件活动分析 |
3.3.1 PDF文档操作活动分析 |
3.3.2 PDF表格识别提取活动分析 |
3.3.3 表格与信息预处理模块活动分析 |
3.3.4 表格数据整合活动分析 |
3.4 本章小结 |
第4章 面向PDF文件的研招数据辅助整合软件设计 |
4.1 PDF表格数据整合模型设计 |
4.2 软件架构设计 |
4.3 软件包设计 |
4.4 数据库设计 |
4.4.1 软件数据库E-R图 |
4.4.2 研招数据存储总表字段的设计 |
4.4.3 软件数据库字段设计 |
4.5 类的设计 |
4.5.1 PDF文档操作模块相关类的设计 |
4.5.2 PDF表格识别提取模块相关类的设计 |
4.5.3 表格与信息预处理模块相关类设计 |
4.5.4 表格数据整合模块相关类设计 |
4.5.5 PDF表格识别与提取算法相关类设计 |
4.5.6 文本信息挖掘算法相关类设计 |
4.5.7 表格数据列匹配算法相关类设计 |
4.6 PDF格式研究生招录名单信息整合算法设计 |
4.6.1 PDF表格识别与提取算法 |
4.6.2 文本信息挖掘算法 |
4.6.3 表格数据列匹配算法 |
4.7 本章小结 |
第5章 面向PDF文件的研招数据辅助整合软件的实现 |
5.1 实验和开发环境 |
5.2 软件整体界面的介绍 |
5.3 软件整体功能模块的操作与实现 |
5.3.1 PDF文档操作模块 |
5.3.2 PDF表格识别提取模块的实现 |
5.3.3 表格与信息预处理模块的实现 |
5.3.4 表格数据整合模块的实现 |
5.4 软件测试与分析 |
5.4.1 软件对于PDF表格提取效果分析 |
5.4.2 软件对于PDF文件的研招数据整合效率对比分析 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(2)教学云平台中教学资源自动审核的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究内容 |
1.3 论文组织结构 |
第二章 相关技术综述 |
2.1 基于视频的暴力行为检测 |
2.1.1 特征提取 |
2.1.2 特征聚合 |
2.1.3 分类器 |
2.2 基于图像的色情内容检测 |
2.3 本章小结 |
第三章 系统需求分析与概要设计 |
3.1 系统概述 |
3.2 用户管理模块功能需求分析 |
3.2.1 管理员 |
3.2.2 高级用户 |
3.2.3 普通用户 |
3.3 资源管理模块功能需求分析 |
3.4 自动审核模块功能需求分析 |
3.4.1 基础模块功能需求分析 |
3.4.2 业务模块功能需求分析 |
3.5 数据库设计 |
3.5.1 用户管理模块 |
3.5.2 资源管理模块 |
3.6 本章小结 |
第四章 系统详细设计与实现 |
4.1 教学资源自动审核的流程设计 |
4.2 教学资源自动审核的接口设计与实现 |
4.3 用户管理模块的设计与实现 |
4.4 资源管理模块的设计与实现 |
4.5 自动审核模块的设计与实现 |
4.5.1 暴力行为检测算法的设计与实现 |
4.5.2 色情检测算法的设计与实现 |
4.5.3 敏感词检测算法的设计与实现 |
4.5.4 文本审核模块的设计与实现 |
4.5.5 图片指纹库的设计与实现 |
4.6 本章小结 |
第五章 系统测试 |
5.1 测试背景 |
5.1.1 测试目标 |
5.1.2 测试环境 |
5.2 暴力行为检测模块的测试 |
5.2.1 暴力行为检测模块的功能测试 |
5.2.2 暴力行为检测模块的性能测试 |
5.3 色情内容检测模块的测试 |
5.3.1 色情内容检测模块的功能测试 |
5.3.2 色情内容检测模块的性能测试 |
5.4 敏感词检测模块的测试 |
5.4.1 敏感词检测模块的功能测试 |
5.4.2 敏感词检测模块的性能测试 |
5.5 图片指纹库的测试 |
5.5.1 图像指纹库的功能测试 |
5.5.2 图像指纹库的性能测试 |
5.6 系统整体测试 |
5.6.1 用户管理模块测试 |
5.6.2 资源管理模块测试 |
5.6.3 自动审核接口测试 |
5.7 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(3)基于多算法融合的Logo识别定位系统设计(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题背景 |
1.2 国内外研究现状 |
1.3 论文研究目的与意义 |
1.4 主要研究内容 |
1.5 论文的组织结构 |
2 基于YOLO目标检测的Logo识别定位算法 |
2.1 YOLO模型 |
2.1.1 YOLO v3 模型 |
2.1.2 YOLO v4 模型 |
2.2 自定义数据集制作方案设计与实现 |
2.2.1 研究对象说明 |
2.2.2 数据集收集与制作 |
2.2.3 数据集标注及数据增强 |
2.3 模型训练与评价指标 |
2.3.1 模型训练环境 |
2.3.2 评价指标 |
2.4 实验结果及错误分析 |
2.4.1 识别定位实验结果 |
2.4.2 错误识别定位原因分析 |
2.4.3 错误识别定位原因总结 |
2.5 本章小结 |
3 多算法融合的Logo识别定位算法设计与实现 |
3.1 多算法融合的Logo识别定位算法 |
3.1.1 多算法融合的Logo识别定位算法结构 |
3.1.2 多算法融合的Logo识别定位算法处理流程 |
3.1.3 识别定位数据返回格式定义 |
3.2 YOLO目标检测算法的改进设计与实现 |
3.2.1 基于YOLO识别定位算法自身的改进策略 |
3.2.2 改进识别模型的神经网络结构 |
3.2.3 模型先验框尺寸改进 |
3.2.4 模型训练及权重数据固化 |
3.3 基于Logo结构组成的OCR识别算法 |
3.3.1 OCR算法识别策略 |
3.3.2 OCR识别模块改进与实现 |
3.4 基于PDF解析的文本筛选算法 |
3.4.1 文本筛选策略 |
3.4.2 PDF布局分析技术 |
3.4.3 PDF解析模块实现 |
3.5 Logo背景分离算法 |
3.5.1 背景分离策略 |
3.5.2 背景分离算法效果展示 |
3.6 数据处理筛选流程 |
3.6.1 识别结果重叠区域筛选 |
3.6.2 基于Logo背景分离算法的形态学检查 |
3.7 本章小结 |
4 识别定位系统的设计与实现 |
4.1 系统需求分析及技术框架确定 |
4.1.1 功能需求分析 |
4.1.2 非功能需求分析 |
4.1.3 系统开发技术框架确定 |
4.2 识别定位系统体系结构设计 |
4.2.1 系统总体设计 |
4.2.2 系统运行环境说明 |
4.3 识别定位系统模块设计 |
4.3.1 人机交互模块设计 |
4.3.2 文件上传及格式转换模块设计 |
4.3.3 多算法融合的Logo识别定位模块设计 |
4.3.4 数据筛选模块设计 |
4.3.5 系统后台服务模块设计 |
4.3.6 识别结果数据持久化 |
4.4 本章小结 |
5 基于多算法融合的Logo识别定位系统测试 |
5.1 多算法融合的Logo识别定位算法测试 |
5.1.1 改进的YOLO识别定位算法测试 |
5.1.2 改进的OCR识别定位算法测试 |
5.1.3 Logo背景分离算法测试 |
5.1.4 多算法融合的Logo识别定位算法测试 |
5.2 Logo识别定位系统功能测试 |
5.2.1 文件格式转换功能测试 |
5.2.2 系统页面及附属功能测试 |
5.3 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
个人简历 |
攻读学位期间发表的学术论文与取得的其它研究成果 |
(4)文档共享转换服务器的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究内容 |
1.3 论文结构 |
第二章 网络视频会议相关背景知识介绍 |
2.1 网络视频会议 |
2.2 MVC与Struts2 |
2.3 OpenOffice |
2.4 JODConverter |
2.5 ICEpdf |
2.6 本章小结 |
第三章 文档共享转换服务器总体设计 |
3.1 系统设计目标 |
3.2 系统架构设计 |
3.2.1 表现层 |
3.2.2 业务逻辑层 |
3.2.3 数据访问层 |
3.2.4 数据存储层 |
3.3 本章小结 |
第四章 转换服务器设计与实现 |
4.1 文档管理子系统 |
4.1.1 数据表设计 |
4.1.2 类设计 |
4.1.3 用户鉴权 |
4.1.4 文档上传 |
4.1.5 文档下载 |
4.2 文档转换子系统 |
4.2.1 数据表设计 |
4.2.2 类设计 |
4.2.3 服务器启动和初始化操作 |
4.2.4 文档检查 |
4.2.5 文档进度查询 |
4.2.6 OpenOffice服务 |
4.2.7 ICEpdf转换 |
4.2.8 共享文档查询 |
4.2.9 图片的分页查询 |
4.3 文档共享子系统 |
4.3.1 数据表设计 |
4.3.2 类设计 |
4.3.3 分页阅读 |
4.3.4 后台管理 |
4.4 http接口说明 |
4.4.1 用户登录鉴权接口 |
4.4.2 文档检查接口 |
4.4.3 文档上传接口 |
4.4.4 文档转换接口 |
4.4.5 文档下载接口 |
4.4.6 图形通用接口 |
4.4.7 文字通用接口 |
4.5 本章小结 |
第五章 系统测试 |
5.1 测试环境说明 |
5.2 基本功能测试 |
5.3 系统性能测试 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(5)基于SAO结构的专利创造性检索系统的设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1.研究的背景及存在的挑战 |
1.1.1 研究背景 |
1.1.2 存在的挑战 |
1.2.研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3.论文结构安排 |
第二章 相关工作及系统概述 |
2.1.搜索引擎 |
2.1.1 全文搜索引擎Lucene |
2.1.2 倒排索引 |
2.1.3 TF-IDF相关度 |
2.2.词语相似度 |
2.2.1 词向量简介 |
2.2.2 词向量相似度的计算 |
2.3.系统概述 |
2.4.本章小结 |
第三章 基于权利要求的专利创造性判断方法 |
3.1.权利要求SAO结构提取 |
3.1.1 SAO概述 |
3.1.2 专利权利要求SAO结构提取 |
3.2.基于SAO结构的权利要求相似度计算 |
3.2.1 专利词向量的增量训练 |
3.2.2 SAO结构相似度的计算与专利相似度的计算 |
3.3.实验 |
3.3.1 实验数据 |
3.3.2 实验评价标准 |
3.3.3 实验设计与结果分析 |
3.4.本章小节 |
第四章 快速迭代的专利数据抓取模块的设计与实现 |
4.1.专利抓取模块整体架构 |
4.2.更新检测模块 |
4.2.1 检测专利更新和获取数目 |
4.2.2 在My SQL中创建目录任务表 |
4.2.3 写入Redis中目录任务消息队列 |
4.3.目录抓取模块 |
4.3.1 目录数据的抓取 |
4.3.2 解析并创建专利详情表 |
4.4.账号注册与登录模块 |
4.4.1 验证码识别 |
4.4.2 账号注册模块 |
4.5.正文抓取模块 |
4.5.1 专利详情页URL拼接 |
4.5.2 账号登陆 |
4.5.3 专利详情页数据抓取 |
4.6.PDF抓取模块 |
4.6.1 PDF下载 |
4.7.快速迭代的实现 |
4.8.本章小结 |
第五章 基于Lucene的相关专利检索模块的设计与实现 |
5.1.专利文本索引的建立 |
5.1.1 建立文档 |
5.1.2 分析 |
5.1.3 向索引中添加文档 |
5.2.搜索功能的设计与实现 |
5.2.1 命名实体识别与缓存 |
5.2.2 构建Query对象 |
5.2.3 组合多个搜索条件 |
5.2.4 打开索引并搜索 |
5.3.系统展示 |
5.4.本章小节 |
第六章 总结与展望 |
参考文献 |
附录1 攻读硕士学位期间申请的专利 |
附录2 攻读硕士学位期间参加的科研项目 |
致谢 |
(6)《微生物组学分析》汉译实践报告(论文提纲范文)
摘要 |
Abstract |
Chapter Ⅰ Introduction |
1.1 Background |
1.2 Purpose |
1.3 Significance |
Chapter Ⅱ The Guiding Theory and Application |
2.1 Skopos Theory |
2.2 Application of Skopos Theory |
Chapter Ⅲ Process |
3.1 Preparation Before Translation |
3.2 Translation Process |
3.3 Post-translation |
Chapter Ⅳ Case Analysis |
4.1 Application of Skopos Rule |
4.1.1 Amplification |
4.1.2 Embedding |
4.1.3 Sentence Division and Combination |
4.2 Application of Coherence Rule |
4.2.1 Part of Speech Conversion |
4.2.2 Amplification and Omission |
4.2.3 Affirmative and Negative |
4.2.4 Embedding |
4.2.5 Reversion |
4.2.6 Sentence Division and Combination |
4.3 Application of Fidelity Rule |
4.3.1 Free Translation |
4.3.2 Zero Translation |
Conclusion |
Appendix I Source Text |
Appendix II Target Text |
Appendix III Glossary |
References |
攻读硕士学位期间所发表的论文 |
Acknowledgements |
(7)基于Word模板的复杂文档快速生成方法(论文提纲范文)
0 引 言 |
1 相关技术 |
1.1 OOXML |
1.2 Enjoy模板引擎 |
1.3 DOM4J |
2 方法设计 |
2.1 总体设计 |
2.2 Enjoy模板的自动生成 |
2.2.1 模板指令设计 |
2.2.2 指令规范化 |
2.2.3 指令解析 |
2.3 Word文档生成 |
3 应用实例 |
4 实 验 |
4.1 实验环境 |
4.2 性能对比与分析 |
4.2.1 文档生成效率分析 |
4.2.2 文档大小分析 |
5 结 语 |
(8)基于卡口图像的妨碍驾驶及涉牌违法行为识别研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景和意义 |
1.1.1 课题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 污损遮挡号牌识别的研究现状 |
1.2.2 多标签违法行为研究现状 |
1.3 研究的主要内容及总体结构 |
第2章 违法行为监控系统方案设计 |
2.1 违法监控系统设计指标 |
2.1.1 功能需求 |
2.1.2 性能指标 |
2.1.3 需求分析 |
2.2 系统实施方案设计 |
2.2.1 总体方案 |
2.2.2 系统组成 |
2.2.3 详细设计 |
2.3 本章小结 |
第3章 污损遮挡号牌违法行为识别 |
3.1 引言 |
3.2 基于YOLOv3的污损遮挡号牌识别 |
3.2.1 YOLOv3算法原理分析 |
3.2.2 污损遮挡号牌数据集的制作 |
3.2.3 模型参数配置 |
3.2.4 评价指标 |
3.2.5 实验结果及分析 |
3.3 基于OCR的正常号牌和半遮挡号牌识别 |
3.3.1 OCR原理分析 |
3.3.2 车辆号牌数据集制作 |
3.3.3 修改预权重文件 |
3.3.4 模型参数配置及训练过程 |
3.3.5 阈值分析 |
3.3.6 实验结果 |
3.4 污损遮挡号牌的多模型融合 |
3.5 本章小节 |
第4章 多标签违法行为识别 |
4.1 引言 |
4.2 词向量模型相关算法选取 |
4.2.1 词向量算法选取方案 |
4.2.2 词向量框架选取 |
4.3 原始数据处理 |
4.4 词向量模型方案设计与测试 |
4.4.1 词向量原理 |
4.4.2 词料库制作 |
4.4.3 Skip-gram模型的参数配置及训练 |
4.4.4 词向量实验结果 |
4.5 基于词向量的多标签模型方案设计与测试 |
4.5.1 方案选择 |
4.5.2 相关性矩阵的构造 |
4.5.3 数据集的制作 |
4.5.4 修改模型结构 |
4.5.5 训练参数配置 |
4.5.6 模型参数微调 |
4.5.7 编写测试接口 |
4.6 实验结果 |
4.6.1 实验评价指标 |
4.6.2 实验结果分析 |
4.7 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间承担的科研任务与主要成果 |
致谢 |
(9)PDF论文的重编辑与处理系统的研究与开发(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文主要工作 |
1.4 本文组织结构 |
第2章 相关文档格式的介绍 |
2.1 PDF文档的介绍 |
2.1.1 PDF的简介 |
2.1.2 PDF文档对象的分析 |
2.1.3 PDF的逻辑结构 |
2.1.4 PDF的物理结构 |
2.2 HTML文档的介绍 |
2.2.1 HTML文档的简介 |
2.2.2 HTML文档的示例 |
2.3 JSON格式文档的介绍 |
2.3.1 JSON的数据类型 |
2.4 本章小结 |
第3章 基于HTML文档树的内容抽取算法 |
3.1 文档格式的转换技术 |
3.1.1 转化成WORD格式 |
3.1.2 转化成HTML格式 |
3.2 PDF文档的划分 |
3.2.1 文档划分的依据 |
3.2.2 文档划分结果的存储 |
3.3 PDF文档信息的抽取 |
3.3.1 抽取PDF中的非文本信息 |
3.3.2 抽取出渲染样式 |
3.3.3 常见的网页抽取算法 |
3.3.4 抽取文本内容 |
3.4 本章小结 |
第4章 基于网页技术的自适应渲染方法 |
4.1 传统布局结构的分析 |
4.2 移动端网页技术的介绍 |
4.3 重构布局 |
4.4 PDF论文的抽象 |
4.5 排版算法的分析 |
4.6 渲染效果展示 |
4.7 本章小结 |
第5章 并行化任务的分析与处理 |
5.1 系统后端处理流程设计 |
5.2 文件类型数据存储结构的设计 |
5.3 数据库中存储的层次关系 |
5.4 处理过程中并行化分析 |
5.5 统一任务调度方案 |
5.6 实验评估 |
5.7 本章小结 |
结论 |
参考文献 |
致谢 |
附录 A 攻读硕士学位期间的学术成果 |
四、使用Word快速转换图片文件格式(论文参考文献)
- [1]面向PDF文件的研招数据辅助整合软件研发[D]. 周璐喆. 江西财经大学, 2021(10)
- [2]教学云平台中教学资源自动审核的设计与实现[D]. 陈晓茵. 北京邮电大学, 2021(01)
- [3]基于多算法融合的Logo识别定位系统设计[D]. 盛再超. 浙江大学, 2021(01)
- [4]文档共享转换服务器的设计与实现[D]. 崔旭东. 南京邮电大学, 2020(02)
- [5]基于SAO结构的专利创造性检索系统的设计与实现[D]. 徐惟康. 南京邮电大学, 2020(03)
- [6]《微生物组学分析》汉译实践报告[D]. 赵帛粟. 河北科技大学, 2020(06)
- [7]基于Word模板的复杂文档快速生成方法[J]. 骆蓉,黄俊,黎茂锋,刘志勤. 计算机应用与软件, 2020(10)
- [8]基于卡口图像的妨碍驾驶及涉牌违法行为识别研究[D]. 赵凯月. 燕山大学, 2020(01)
- [9]PDF论文的重编辑与处理系统的研究与开发[D]. 金鹏. 湖南大学, 2020(07)
- [10]教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知[J]. 教育部. 中华人民共和国教育部公报, 2020(06)