一、智能化搜索引擎原理及实现(论文文献综述)
薛晓慧,芮光辉,李炜东,袁培森[1](2021)在《基于排序式SVM的搜索自适应排序系统实现》文中研究表明随着社会信息化的程度不断提高,搜索引擎作为广泛使用的信息检索工具,用户对于搜索引擎智能化和个性化的需求不断提高,其中元搜索引擎由于能够整合多个独立型搜索引擎的结果而被广泛研究。为了解决当前元搜索引擎信息覆盖率不足和查准率不高的问题,并为用户提供个性化和智能化的搜索结果,设计并实现了一个网页个性化搜索自适应排序系统。该系统基于元搜索引擎,针对中文语境,利用ICTCLAS中文分词方法和TF-IDF算法,选取若干常用独立型搜索引擎计算相似度并合并搜索结果,再基于Ranking SVM排序学习方法,对合并后的结果进行重排序得到个性化的搜索结果。利用Java和JSP实现上述系统并测试,实验结果表明该系统在中文语境下能对多个独立型搜索引擎的结果进行整合,能对整合结果进行个性化的重排序。
吴进发[2](2021)在《电子病历搜索引擎中的新词发现和排序技术研究》文中认为电子病历(Electronic Medical Record,EMR)贯穿患者的整个医疗活动,包含患者的诊疗信息,对医生的诊断和决策起着关键作用。然而早期积累的大量非结构化中文电子病历文档(Xml格式)却给医生的病历检索和科研带来阻碍,如何快速准确地从电子病历中检索有用信息已经变得越来越迫切。因此本文研究了使用Elasticsearch(实时搜索引擎,ES)搜索引擎工具来构建电子病历全文检索系统,从而提高电子病历的检索效率。本文的研究主要包括以下三个方面:(1)本文提出了一种基于互信息与左右信息熵的中文新词发现改进算法用于电子病历搜索引擎。本文基于中文电子病历的文本特征和医学术语的词法,主要对预处理和算法结构两点进行改进。预处理上,本文基于中文医学主题词表和ICD-10疾病编码构建了医学词典,还参照电子病历文本中的医学词汇特点选取了部分停用词用于更新前置分词器的停用词表,用于提高中文新词发现算法中的前置分词效果,从而发现更多的新词。结构上,将算法中点互信息计算的改为点互信息均值,将左右信息熵的计算进行拆分,最终将两个分支的结果合并取交集。实验结果表明,本文提出的改进算法的新词发现效果优于改进前的新词发现效果。(2)本文提出了一种基于Ada Rank的电子病历搜索引擎搜索结果排序算法。传统的检索模型需要依靠人工设置排序公式,并在迭代过程中不断优化排序参数,手动调试参数工作量较大。近年来使用机器学习排序模型的排序学习算法开始在各领域大规模应用。在电子病历领域,使用排序学习的研究非常少,因此,本文将排序学习中的Ada Rank算法应用于电子病历,来对搜索引擎排序结果进行优化。本文通过人工标注心血管疾病电子病历文档,选取关键词对每个文档进行文档-查询词对标注,最后使用传统检索模型BM25,学习排序Rank Net、Lambda Rank、List Net、Lambda MART来进行对比实验,实验表明,本文提出的电子病历搜索算法对比传统的BM25算法和其他四种排序学习算法对电子病历的搜索结果排序优化效果更佳。(3)电子病历搜索引擎系统的设计与实现。基于(1)和(2)的研究,本文构建的病历搜索系统除了具有电子病历全文检索功能,还提供了用户管理功能,新词发现功能,电子病历查看功能。电子病历全文检索功能的应用使得电子病历的全文检索变得更加简便快速。
刘培[3](2020)在《基于大数据的网络空间主流意识形态传播研究》文中提出信息技术、互联网与计算机等技术建构的网络空间成为与现实社会空间并存的第二空间。但网络空间不是一成不变的,而是在技术发展中不断演进的。随着大数据技术在互联网领域应用的广泛推进,借助于大数据可以量化一切的强大计算能力,网络空间确已进入到一个高度依赖数据和算法的阶段,形成了新型的“大数据-网络空间”。“大数据-网络空间”是在大数据技术深度介入下形成、以数据生态为核心、以算法为主导的、虚实深度交融的网络空间。它不仅是世界的数据化再现,而且是大数据算法与人的意向性协同敞开的网络空间。作为大数据技术形塑的空间,“大数据-网络空间”不是固态的、稳定的、不可更改的,而是可以被技术发展与各类媒体、政党、国家等主体意愿建造、编制和构筑,即“大数据-网络空间”具有可塑造性。“大数据-网络空间”作为各种意识形态和社会思潮的传播载体和场域,同样也为主流意识形态传播带来了机遇与挑战。一方面,“大数据-网络空间”为主流意识形态的传播带来了受众、传播内容、传播方式与传播效果的可量化与可计算,实现了精准化和个性化传播。另一方面,“大数据-网络空间”亦为主流意识形态传播带来挑战,主要包括:大数据技术理性张扬下传播者经验的下降与自身的隐匿、数据化传播受众画像的失真、假新闻深度转向与传播生态的后真相化、资本逻辑与算法逻辑对主流意识形态传播逻辑的干扰。面对这些挑战,已有相关研究往往集中在大数据技术薄弱、西方的数据霸权和意识形态渗透方式的多样化等方面进行探讨,而忽视了“大数据-网络空间”自身的可塑造性。“大数据-网络空间”与主流意识形态传播的关系不仅仅是大数据以工具性载体助推网络空间主流意识形态的传播,更重要的是“大数据-网络空间”是被技术和各种意识形态共同塑造与建构的。由此,主流意识形态的传播必然要求塑造“大数据-网络空间”,以提升主流意识形态的传播能力。如何塑造“大数据-网络空间”以提升主流意识形态传播能力成为一个重要问题。首先,要规避算法主导的传播方式,建构基于传播者与受众能动性的个性化传播,从而积极地影响、修正甚至改变算法推荐主导的传播内容,以塑造主流意识形态在“大数据-网络空间”的核心地位。其次,以主流价值导向驾驭算法从而建构“主流价值算法”。主流价值算法通过纠正流量至上的价值导向以消解各种社会思潮和意识形态对主流意识形态传播空间的挤压,从根本上塑造一个正能量的“大数据-网络空间”。再次,展开数据素养和政治素养的双维教育。通过数据素养教育提升传播者和传播受众的数据素养,同时强化大数据技术人员的意识形态教育。最后,推动大数据检测技术与平台监管齐头并进。积极研发大数据检测技术,以检测、识别和过滤虚假信息。且按照精细化、区别化的原则进行分类分级地监管各类传播媒体与平台,健全法律与行业规范的双重规制,从而有力推进“大数据-网络空间”主流意识形态的传播。
李春婕[4](2020)在《网络媒体舆情检测与分析系统设计与实现》文中指出网络舆情是互联网与社会发展相结合后而生成的特殊现象,公众针对公共问题及社会管理者形成的信念及价值观、社会的政治态度等都属于网络舆情的范畴。文章中主要研究的是针对网络媒体进行舆情的检测以及分析研究的系统,针对当前的舆论发展以及规范处理的问题所推出的。在这个系统中,能够明确的了解到不同的网站门户出现的网络新闻舆情消息,其中门户网站包括凤凰、腾讯、新华以及新浪等等,将针对一个问题的报道进行汇总,而且能够对此类的舆情信息进行进一步的跟踪报道,以此对此话题进行分析,对其发展的趋向进行研究,最终研究各种事件针对网络舆情中的发展以及变化的机制,最后给予决策人员准确的数据,以此能够掌握网络舆论的主动权,可以对网上的舆论进行明确的引导。在本次研究中对网络爬虫进行了有效整合,首先对舆情监测的实际情况做了介绍,阐述了研究现状,并介绍了目前市场上的相关商品。在网络爬虫技术的基础上,将信息过滤和抓取功能相结合,利用搜索引擎实现网页数据的采集;通过网页去噪技术、网页排重技术和特征选取技术完成对网页和信息的预处理,以信息检索算法为基础,结合话题追踪和情感挖掘两种方法对网络舆情进行分析,了解其需求以及发展的趋向,对当前商业产品的不足之处进行把握,以此推出事件情感追踪、话题追踪的舆情监测系统;对于网页中的舆情以及热点的分布和来源进行深层次挖掘,和用户做出进一步的交互,按照客户的反馈形成对应的用户舆情模型库。然后针对舆情监测的系统原型进行进一步的分解,确定技术重点;以上述理论和技术重点为基础框架,设计了一款网络舆情监测系统,该系统包括舆情采集、网页预处理、话题追踪、舆情分析几个模块,针对网页爬虫的性能和舆情文本的数据做了分析以及测定,最终结果表明,本文所设计的网络媒体舆情检测与分析系统精准性和实用性良好。
李超[5](2020)在《基于UCL国家标准的智能化搜索引擎研究》文中进行了进一步梳理随着互联网的迅速普及和数字信息的爆炸式增长,各种海量化、碎片化的内容不断涌现,如何从这些异构驳杂的数据中检索有效信息对于搜索引擎挑战巨大。以网页链接为中心的传统搜索引擎通过关键字匹配的方式从互联网中检索信息,然后返回给用户相关链接。这种方式不能准确理解用户搜索意图,且返回的结果过于单一,包含的语义信息不够丰富,需要用户做多次检索。为了改善这种搜索模式的弊端,基于知识的搜索引擎已引起了业界的广泛关注。基于知识的搜索引擎技术核心是构建知识图谱,目前知识图谱相关研究已取得一定进展。但其对知识表示的方式主要是以较为简单的三元组形式将结构化数据组织,富含的语义信息不够丰富。而统一内容标签(Uniform Content Label,UCL)可以将互联网上杂乱无序的异构内容进行有效聚合,能够对互联网内容中的丰富语义信息进行统一格式编码。因此如何充分利用UCL对互联网信息进行富语义矢量编码的优势,构建以知识为中心的智能化搜索引擎极具研究价值。为此,本文结合UCL的优势,构建UCL知识图谱(UCL Knowlegde Graph,UCLKG),并对智能化搜索相关技术进行研究。提出了基于语义环境相似度的实体消歧算法与基于表示学习和UCL语义感知的关系推理算法,实现UCL知识图谱(UCL Knowlegde Graph,UCLKG)的构建和更新。提出了针对搜索环境的动态主题挖掘算法DLDASE(Dynamic Latent Dirichlet Allocation for Search Environment)和基于SDP(Semantic Depency Parsing)依赖分析的查询式生成算法,提高搜索引擎对用户搜索意图识别和对知识语义解析的能力。本文的主要研究工作如下:(1)结合智能化搜索引擎的需求,针对如何将互联网中异构驳杂的数据进行语义关联的问题,提出了一种基于语义融合的UCL知识图谱构建方法。该方法首先解析Wikidata和百度百科离线语料库,并结合信息抽取工具抽取实体信息,完成基础知识库的构建;然后计算UCL中内容实体的语义权重,并借助实体消歧算法将UCL与基础实体库融合;最后提出基于表示学习和UCL语义感知的关系推理算法,实现UCL知识图谱的自动化更新。(2)针对传统搜索引擎不能有效识别用户意图且缺乏对内容的语义解析能力的问题,实现基于UCL的智能化搜索引擎,对其中涉及的关键技术进行研究。基于UCL的智能化搜索引擎主要从两方面对用户搜索信息进行处理。一是以用户兴趣为中心提供个性化搜索,提出了针对搜索环境的动态主题挖掘算法DLDASE,识别用户搜索意图,并结合用户意图和UCL文档的主题关联对搜索结果进行排序。二是以知识为中心提供内容语义解析服务,提出了基于SDP依赖分析的查询式生成算法将用户搜索的自然语言问句翻译为数据库查询语句,直接获取知识。(3)实现了智能化搜索引擎原型系统,并通过实验对其中涉及的相关算法进行验证。实验结果表明,相比于传统实体消歧算法,基于语义环境相似度的实体消歧算法消歧效果更好;相比于传统关系推理算法,基于表示学习和UCL语义感知的关系推理算法对“一对多”和“多对多”类型关系有更好的区分能力;相比于传统LDA算法,DLDASE算法更适合对在线语料进行动态主题挖掘;基于SDP分析的查询式生成算法对本文定义的四类基本问题的转换能力较好。
刘奕[6](2020)在《5G网络技术对提升4G网络性能的研究》文中提出随着互联网的快速发展,越来越多的设备接入到移动网络,新的服务与应用层出不穷,对移动网络的容量、传输速率、延时等提出了更高的要求。5G技术的出现,使得满足这些要求成为了可能。而在5G全面实施之前,提高现有网络的性能及用户感知成为亟需解决的问题。本文从5G应用场景及目标入手,介绍了现网改善网络性能的处理办法,并针对当前5G关键技术 Massive MIMO 技术、MEC 技术、超密集组网、极简载波技术等作用开展探讨,为5G技术对4G 网络质量提升给以了有效参考。
孟庆国,王友奎,田红红[7](2020)在《政务服务中的智能化搜索:特征、应用场景和运行机理》文中认为搜索引擎是公众快速找到所需信息的重要方式。与商业领域中搜索引擎日益呈现出智能化特征并得到广泛应用相比,政府网站中的政务搜索普遍存在"搜不到、搜不全、搜不准、体验差"等问题。通过分析政务服务中政府信息供给侧与公众需求侧面临的困境,以前台输入、结果返回和后台处理等关键环节为切入点,层层剖解智能化搜索的主要特征和典型应用场景。在此基础上,从基于资源画像建立知识图谱、基于用户画像构建需求模型、基于需求理解实现最佳匹配等方面阐释了智能化功能的实现机理。
李洁[8](2019)在《数据驱动下数字图书馆知识发现服务创新模式与策略研究》文中认为我们已经从信息时代走进了数据驱动的“智能时代”,数据成为人们认识和解决问题的新的逻辑起点。“数据驱动”打破了基于知识解决问题的思维桎梏,形成了从问题到数据又回归问题的新方法论认识——基于数据解决问题。这一研究范式将数字图书馆知识发现服务从对问题本源的探索推向知识服务的本真,可以说,从数据直面用户、管理和服务为大数据环境下的数字图书馆知识发现服务供给侧的改革提供了一种新思路:知识发现服务要改变的不只是管理技术、管理规则或服务形式,而要涉及整个管理理念和服务体系。而大数据环境中,数字图书馆信息发生源越来越多,数据产出量越来越大,数字资源增长速率越来越快,数据异构性越来越明显,数据老化节奏越来越快,低价值密度隐患的知识饥渴和数据海啸的矛盾越来越突出,用户对发现服务的需求越来越多元,数字图书馆数据资源正面临着重新被发现的挑战。迎面变化和挑战,数字图书馆的知识发现服务不单要完成从文献数字化到内容数据化的知识组织转型,更应实现数字资源从内容数据化到数据智能化的价值开发和智慧洞见。数据驱动的科研范式开辟了知识发现的新路径,开启了数字图书馆知识服务的时代新转型。探索数据驱动理念下的数字图书馆知识发现服务模式的新形态,需要学习、内化数据科学相关理论,需要剖析知识发现的驱动要素和作用机制,需要打破传统的资源发现固化模式,创建知识发现服务的创新生态功能圈。融合数据驱动和知识发现的双重技术优势,数字图书馆知识发现服务创新模式应趋从数据化、数据向知识转化的语义关联、可视化和智能化驱动维度寻求用户数据、内容资源数据、专家数据、业务数据的新协同,开发用户画像、研究设计指纹、精准文献推荐等的新应用,强化数据的集群整合、提升平台的绿色联通、实现用户界面的友好交互,使数字图书馆成为支持用户知识探索与发现创造的智能服务系统,使数据资源最大化的进行价值开发与知识转化,使用户随时随地都能受益于数字图书馆高效、便捷、友好与智能的知识发现服务体验。基于此,本文通过对数据驱动、知识发现研究成果的追本溯源,界定数据驱动下的数字图书馆知识发现服务的核心理念;通过文献分析、调查访谈、仿真实验、模型训练等方法的综合运用,分析数字图书馆知识发现服务创新的数据环境、驱动机制、创新模式、模式应用以及创新策略制定。围绕主要研究内容,本文第三章从数据环境特征、数据环境变化和数据环境开发分析数据驱动下的数字图书馆知识发现服务的机遇与挑战;第四章结合数据要素、数据驱动过程、数据驱动维度探讨数字图书馆知识发现服务的数据驱动动力机制、流机制、协同驱动机制和数据驱动控制机制;第五章通过对数字图书馆知识发现服务模式创新衍变的内在使命分析,指出数字图书馆知识发现服务创新模式的构建依据、构建基础和构建过程;第六章对数字图书馆知识发现服务创新模式进行具体的用户画像、研究设计指纹、文本推荐和多粒度检索决策应用;第七章针对数字图书馆知识发现服务创新模式的具体瓶颈给出各驱动维度的应对策略。具体内容阐述如下:第3章数据驱动下数字图书馆知识发现服务的数据环境分析本章是对大数据驱动环境下的数字图书馆知识发现服务场域的情境解构。首先,基于大数据的4V特征,面向全数据,分析数字图书馆知识发现服务在数据形态、存在方式、存储模式、存储内容、数据价值等方面的特性。其次,探讨数据化、新一代信息技术、数据分析思维、数据密集型科学发现范式影响下的数字图书馆知识发现服务革新的优劣利弊。最后,基于环境特性和环境变化的双向作用状态定位数字图书馆知识发现服务发展的开发方向。明确本文研究目的的同时,引出4、5、6、7章节的主要研究任务。第4章数字图书馆知识发现服务创新的数据驱动机制分析本章作为第5章的铺垫,详细解析数字图书馆知识发现服务平台的数据要素和驱动作用形式。通过用户数据、资源内容数据、专家数据的分类界定,为第6章科研用户画像、研究设计指纹、精准文献推荐等的服务模式应用提供数据基础;通过数据化、语义关联、可视化、智能化的数据驱动维面的层级解构,为第7章的创新策略制定奠定优化主线;基于数据要素、驱动过程和驱动维面,从内外力作用的动力机制、输入-输出的流机制、数据融合的协同驱动机制以及数据驱动控制机制具体呈现数据驱动与知识发现服务交互融合的催化反应。第5章数据驱动下数字图书馆知识发现服务创新模式研究在前文研究的基础上,本章首先对数据驱动下数字图书馆知识发现服务创新模式的构建进行内在逻辑分析;其次,从资源发现既有模式、知识产品和技术支持方面阐述实现数字图书馆知识发现服务创新的外在基础;最后,综合内在逻辑和外在基础,进行创新模式的基础框架和平台架构的初步解构,并在此基础上进行数据驱动下的数字图书馆知识发现服务创新功能圈构建。第6章数据驱动下数字图书馆知识发现服务创新模式应用研究本章在第5章提出的创新模式的基础上,分别利用科研用户数据进行数字图书馆百度发现的科研用户画像构建,利用文献数据进行以研究对象、研究问题与研究方法为核心要素的研究设计指纹构造,结合用户画像和研究设计指纹实现精准文献推荐,并通过用户检索实验验证多粒度检索决策的优势。第7章数据驱动下数字图书馆知识发现服务创新策略研究基于第4章对数据驱动维度和驱动机制的分析,本章旨在明确数据化、语义化、关联化、可视化和智能化驱动的创新方向并进行相应的优化路径设计,针对数字图书馆知识发现服务创新的制约因素,给出切实可行的解决方案与对策建议。大数据环境下,重新界定数据驱动下的数字图书馆知识发现服务的内涵、探讨数字图书馆知识发现服务的数据驱动机制、创新数字图书馆既有的资源发现服务模式,有利于从方法论认识层面为数字图书馆知识发现服务的供给侧改革提供理论支持。数字图书馆知识发现服务的意义不仅在于它的统一检索及其延伸功能,更在于此基础上辅助科学发现的循证决策、智能管理和知识再造的服务价值。在人类不断探索未知与努力认识未知的道路上,数据驱动+知识发现的催化反应为科学发现的方法探索提供了一个可行参考,推动着数字图书馆知识发现服务在不断革新的历程中惠及更多的求知受众。
丛杨[9](2019)在《基于用户历史查询反馈的兴趣点智能搜索方法优化研究》文中研究说明大数据时代的来临使得数据量呈爆炸式增长,数据量的庞大以及数据形式的多样性为数据的管理增添了难题。在网上各种信息呈现爆炸式增长的背景下,传统方法往往难以顾及用户兴趣,而导致查询无法体现个性化。截止到现在,以地理信息领域中的搜索为观察点,其内部的兴趣点搜索主要依赖搜索关键词匹配来实现具体的搜索,可是其回馈的结果却没有经过任何过滤处理,这样一来就极大地阻碍了用户的查找任务,从而使得搜索质量不断降低。用户的需求持续增长的,如何提高搜索质量满足用户需求成为了研究的方向和趋势。针对这一问题本文提出一种基于用户历史查询反馈记录的兴趣点智能搜索方法。基于PageRank算法和用户历史查询反馈数据建立智能搜索模型对兴趣点搜索方法进行优化研究。本文对建立智能搜索模型所用到的技术进行分析,建立了智能搜索模型的最初框架,并对用户历史查询反馈记录进行分析,将用户历史查询反馈记录分为两部分:兴趣点查询记录和地图瓦片调用记录,根据用户行为对PageRank算法进行优化推导出基于兴趣点查询记录的调节算法和基于地图瓦片调用记录的调节算法,然后将二者相结合建立了适用于本文的兴趣点智能搜索模型,最后针对模型设计实验验证,对实验结果进行分析验证本文提出的智能搜索模型的正确性。
邢智[10](2019)在《内蒙古农资服务平台Web搜索智能优化研究》文中研究指明农资服务平台是现代化农业服务的重要载体,伴随着平台上服务供应商数量的急剧增多,服务供应商提供的服务数量呈现出指数增长的态势,一般以渠道为优势的农资服务平台现存Web搜索引擎存在无法处理信息格式的异构性、语义信息的多重性等问题,导致搜索引擎的自动化、智能化交互程度低,表现为平台用户在平台上快速、准确地获取所需服务的难度越来越大。因此,提升农资服务平台Web搜索的智能化是一个亟待解决的问题。以内蒙古农资服务平台为研究对象,研究其Web搜索引擎智能优化算法。首先梳理了国内外关于搜索引擎智能优化的研究现状,对比了传统的Web搜索算法和现存智能优化算法的优缺点。其次,对内蒙古农资服务平台现状进行分析,发现其采用传统的基于关键词的搜索算法,不支持用自然化语言进行查询,并且现存的智能优化算法对内蒙古农资服务平台智能化适应性较差。因此,构建基于用户行为的智能优化算法,在搜索引擎预处理流程中加入自然语言处理模型,解决了无法处理信息格式异构性的问题,同时在搜索服务流程中,通过对用户行为进行建模,构建了动态的用户群体分类体系,并改进了遗传算法,从而改变传统关键字匹配所不能表达的语义信息,提高了搜索引擎的智能化程度,以改进搜索的效果。再次,为对搜索引擎效果改进进行有效评价,构建了基于用户反馈的搜索效果评价回归模型,通过仿真优化实验验证了智能优化算法有效性。最后,通过实验结论,给内蒙古农资服务平台提出对策建议。研究结果表明,基于用户行为的智能优化搜索算法可将农资服务平台Web搜索的搜索效果提升15.05%,提高了搜索引擎的智能化,对农资服务平台Web搜索有一定的应用价值,对农资服务平台行业Web搜索优化的理论研究具有一定的适用性和参考价值。
二、智能化搜索引擎原理及实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、智能化搜索引擎原理及实现(论文提纲范文)
(1)基于排序式SVM的搜索自适应排序系统实现(论文提纲范文)
0 引 言 |
1 技术原理 |
1.1 排序学习 |
1.2 中文分词方法 |
1.3 网页内容与搜索关键词相似度的计算 |
2 系统结构和流程 |
2.1 系统结构 |
2.2 系统运行流程 |
3 实验和结果分析 |
3.1 实验环境 |
3.2 系统性能测试 |
3.3 系统流程测试 |
4 结束语 |
(2)电子病历搜索引擎中的新词发现和排序技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究的背景及意义 |
1.2 国内外研究历史与现状 |
1.2.1 搜索引擎技术在电子病历中的应用 |
1.2.2 现有研究工作的不足之处 |
1.3 论文的主要研究内容 |
1.4 论文的结构安排 |
第二章 基于词语互信息和左右熵的新词发现改进算法研究 |
2.1 引言 |
2.2 背景技术及解决问题分析 |
2.2.1 相关技术介绍 |
2.2.2 传统中文新词发现算法的缺点 |
2.2.3 基于词语互信息和左右熵的新词发现算法原理介绍 |
2.3 基于词语互信息和左右熵的新词发现改进算法研究 |
2.3.1 预处理改进 |
2.3.2 算法结构改进 |
2.4 实验设计及结果分析 |
2.4.1 实验环境 |
2.4.2 数据集以及预处理 |
2.4.3 实验设计及实验过程 |
2.4.4 实验结果及分析 |
2.5 本章小结 |
第三章 基于AdaRank的电子病历搜索引擎排序算法研究 |
3.1 引言 |
3.2 排序算法问题分析 |
3.2.1 TF-IDF算法 |
3.2.2 BM25 算法 |
3.3 本文用于电子病历搜索的AdaRank算法及实现 |
3.3.1 AdaRank算法原理及优势 |
3.3.2 AdaRank算法在Elasticsearch中的实现 |
3.4 实验设计与结果分析 |
3.4.1 数据集 |
3.4.2 数据标注 |
3.4.3 评估指标 |
3.4.4 对比实验 |
3.4.5 实验结果分析 |
3.5 本章小节 |
第四章 电子病历搜索引擎系统设计与实现 |
4.1 系统需求分析 |
4.2 系统逻辑架构设计 |
4.3 系统设计 |
4.3.1 系统架构设计 |
4.3.2 系统数据库设计 |
4.3.3 Web接口设计 |
4.3.4 算法服务器设计 |
4.4 系统实现 |
4.4.1 硬件环境 |
4.4.2 软件环境 |
4.4.3 Elasticsearch环境的搭建 |
4.4.4 Elasticsearch中插件的安装 |
4.4.5 电子病历部分字段的结构化 |
4.5 系统测试 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
(3)基于大数据的网络空间主流意识形态传播研究(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 问题的缘由与研究价值 |
1.2 国内外研究动态与文献评析 |
1.3 研究思路与研究方法 |
1.4 研究创新点与难点 |
2 主流意识形态传播与网络空间的内在关联 |
2.1 意识形态概念的演变 |
2.2 主流意识形态传播方式的变迁 |
2.3 网络空间及其可塑性 |
2.4 网络空间与主流意识形态传播的内在关联维度 |
3 大数据技术对网络空间的形塑 |
3.1 大数据技术:网络空间变革的技术基础 |
3.2 大数据技术的生产力属性与功能 |
3.3 “大数据-网络空间”的界定 |
3.4 “大数据-网络空间”的本质 |
3.5 “大数据-网络空间”的主要特征 |
4 “大数据-网络空间”主流意识形态传播的机遇与挑战 |
4.1 “大数据-网络空间”主流意识形态传播的机遇 |
4.2 技术理性的张扬与传播者的遮蔽 |
4.3 数据化受众画像的失真 |
4.4 假新闻扰乱主流意识形态传播环境 |
4.5 政治逻辑、算法逻辑与资本逻辑的博弈 |
5 掌握主流意识形态传播的主动权:提升塑造“大数据-网络空间”的能力 |
5.1 建构基于传播者与受众能动性的个性化传播 |
5.2 设计主流价值算法 |
5.3 展开数据素养与政治素养双维度教育 |
5.4 大数据检测技术与监管齐头并进 |
6 结论 |
参考文献 |
作者简介 |
学位论文数据集 |
(4)网络媒体舆情检测与分析系统设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 研究内容 |
1.4 论文组织结构 |
第二章 网页数据采集及信息预处理 |
2.1 搜索引擎 |
2.1.1 搜索引擎的发展及原理分析 |
2.1.2 垂直搜索引擎 |
2.2 通用网络爬虫技术 |
2.2.1 网络爬虫工作原理 |
2.2.2 爬虫爬行策略 |
2.3 垂直元搜索采集技术 |
2.3.1 元搜索引擎 |
2.3.2 元搜索工作流程 |
2.4 网页去噪技术 |
2.4.1 编写网页的常用语言 |
2.4.2 HTML/XML文件树型逻辑结构 |
2.4.3 数据路径描述方法 |
2.5 网页排重技术 |
2.5.1 网页重复特点分析 |
2.5.2 网页文本特征的提取方式 |
2.5.3 网页去重的方法研究 |
2.6 文本形式化表示与特征选取技术 |
2.6.1 特征降维方法 |
2.6.2 权重计算方法 |
2.7 本章小结 |
第三章 舆情分析 |
3.1 信息检索模型 |
3.2 信息检索算法 |
3.2.1 基于内容的检索算法 |
3.2.2 基于超链分析的检索算法 |
3.2.3 k-means聚类算法的改进 |
3.3 话题追踪方法 |
3.3.1 Rocchio方法 |
3.3.2 朴素贝叶斯 |
3.3.3 最近邻算法 |
3.3.4 支持向量机(SVM) |
3.4 情感挖掘方法 |
3.4.1 情感倾向性计算 |
3.4.2 情感挖掘流程 |
3.5 本章小结 |
第四章 网络舆情信息系统应用 |
4.1 系统整体设计 |
4.1.1 系统体系结构设计 |
4.1.2 系统功能设计 |
4.1.3 系统功能用例分析 |
4.1.4 子系统功能用例分析 |
4.1.5 系统数据库设计 |
4.1.6 系统模块划分 |
4.1.7 系统部署图 |
4.2 舆情采集模块 |
4.3 网页预处理模块 |
4.3.1 网页去噪模块 |
4.3.2 网页排重模块 |
4.3.3 特征抽取模块 |
4.4 话题追踪模块 |
4.5 舆情分析模块 |
4.6 本章小结 |
第五章 系统测试结果分析 |
5.1 系统测试结果 |
5.2 本章小结 |
第六章 总结和展望 |
参考文献 |
(5)基于UCL国家标准的智能化搜索引擎研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目标和研究内容 |
1.3 论文组织结构 |
第二章 研究现状 |
2.1 知识图谱相关研究 |
2.1.1 知识图谱发展现状 |
2.1.2 实体相关研究 |
2.1.3 关系推理相关研究 |
2.2 搜索引擎相关研究 |
2.2.1 搜索引擎技术架构 |
2.2.2 传统搜索引擎的原理和发展现状 |
2.3 个性化搜索相关研究 |
2.4 本章小结 |
第三章 基于语义融合的UCL知识图谱构建 |
3.1 主要问题与研究思路 |
3.1.1 主要问题分析 |
3.1.2 研究思路和解决方案 |
3.2 整体技术框架 |
3.3 基础知识库构建 |
3.4 UCL语义融合方法 |
3.4.1 UCL信息预处理 |
3.4.2 UCL中实体语义权重计算 |
3.4.3 实体链接 |
3.5 UCLKG的更新 |
3.5.1 基于表示学习和UCL语义感知的关系推理算法 |
3.5.2 UCLKG中UCL和实体的更新 |
3.6 本章小结 |
第四章 智能化搜索引擎关键技术研究 |
4.1 主要问题与研究思路 |
4.1.1 主要问题分析 |
4.1.2 研究思路与解决方案 |
4.2 整体技术框架 |
4.3 基于LDA主题模型的用户兴趣模型构建 |
4.3.1 传统LDA模型分析 |
4.3.2 DLDA_SE用户兴趣模型构建算法 |
4.4 基于用户意图主题挖掘的个性化搜索 |
4.4.1 用户意图识别 |
4.4.2 基于用户意图的搜索排序算法 |
4.5 用户搜索请求的语义理解 |
4.6 本章小结 |
第五章 智能化搜索引擎原型系统与实验 |
5.1 原型系统设计与实现 |
5.1.1 系统设计 |
5.1.2 系统实现 |
5.2 实验与分析 |
5.2.1 UCL知识图谱构建相关算法实验与分析 |
5.2.2 智能化搜索相关算法实验与分析 |
5.3 本章小结 |
第六章 论文总结与未来工作 |
6.1 论文总结 |
6.2 未来工作 |
致谢 |
参考文献 |
作者简介 |
(6)5G网络技术对提升4G网络性能的研究(论文提纲范文)
引言 |
1 4G网络现处理办法 |
2 4G网络可应用的5G关键技术 |
2.1 Msssive MIMO技术 |
2.2 极简载波技术 |
2.3 超密集组网 |
2.4 MEC技术 |
3 总结 |
(7)政务服务中的智能化搜索:特征、应用场景和运行机理(论文提纲范文)
一、问题的提出 |
(一)政府供给的角度 |
(二)公众使用的角度 |
(三)趋势和政策要求 |
二、文献综述 |
(一)政府网站在公共搜索中的可见性优化 |
(二)搜索引擎在政府网站中的应用与优化 |
(三)利用人工智能提高搜索的智能化程度 |
三、智能化特征与典型场景 |
(一)“前台输入”中的智能化 |
⒈推荐引导 |
⒉拼音转化 |
⒊自动纠错 |
⒋灵活设置 |
(二)“结果返回”中的智能化 |
⒈政策内容可视化 |
⒉政务数据可视化 |
⒊政务服务逻辑化 |
⒋系统数据实时化 |
⒌关联信息聚合化 |
(三)“后台处理”中的智能化 |
四、智能化功能的实现机理 |
(一)资源画像,建立知识图谱 |
(二)用户画像,构建需求模型 |
(三)需求理解,实现最佳匹配 |
五、结语与展望 |
(8)数据驱动下数字图书馆知识发现服务创新模式与策略研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 数据驱动研究现状 |
1.2.2 知识发现研究现状 |
1.2.3 研究现状评析 |
1.3 研究内容、方法与技术路线 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 研究技术路线 |
1.4 创新点 |
第2章 相关概念与理论基础 |
2.1 相关概念 |
2.1.1 数据驱动 |
2.1.2 知识发现 |
2.1.3 Web级资源发现 |
2.1.4 数字图书馆知识发现服务 |
2.2 理论基础 |
2.2.1 数据密集型科学发现理论 |
2.2.2 数据驱动控制理论 |
2.2.3 数据挖掘与知识发现理论 |
2.3 本章小结 |
第3章 数据驱动下数字图书馆知识发现服务的数据环境分析 |
3.1 数字图书馆知识发现服务的数据环境特征 |
3.1.1 馆藏数据来源的广泛性及数据形态和存在方式的多样性 |
3.1.2 数据存储模式多样化及存储内容的非结构化和碎片化 |
3.1.3 数据资源价值的低密度和高变现潜能 |
3.2 数字图书馆知识发现服务的数据环境变化 |
3.2.1 从“数字化”到“数据化”的演化 |
3.2.2 新一代信息技术的涌现 |
3.2.3 数据分析思维模式的形成 |
3.2.4 数据密集型科学发现应用趋势 |
3.3 数字图书馆知识发现服务的数据环境开发与应用 |
3.3.1 数字图书馆知识发现服务在大数据环境中的新定位 |
3.3.2 开发数字图书馆知识发现服务数据驱动的新机制 |
3.3.3 创新数据驱动下数字图书馆知识发现服务的新模式 |
3.3.4 开发数据驱动下数字图书馆知识发现服务的新业态 |
3.4 本章小结 |
第4章 数字图书馆知识发现服务创新的数据驱动机制分析 |
4.1 数字图书馆知识发现服务创新数据驱动机制的数据要素 |
4.1.1 用户数据要素 |
4.1.2 内容资源要素 |
4.1.3 专家数据要素 |
4.2 数字图书馆知识发现服务创新的数据驱动过程与维度 |
4.2.1 数字图书馆知识发现服务创新的数据驱动过程 |
4.2.2 数字图书馆知识发现服务创新的数据驱动维度 |
4.3 数字图书馆知识发现服务创新的数据驱动动力机制 |
4.3.1 数字图书馆知识发现服务创新的数据驱动动力类型 |
4.3.2 数字图书馆知识发现服务创新的数据驱动动力关系分析 |
4.3.3 数字图书馆知识发现服务创新的数据驱动动力仿真模型 |
4.4 数字图书馆知识发现服务创新的流驱动机制 |
4.4.1 数字图书馆知识发现服务创新的流驱动特征 |
4.4.2 数字图书馆知识发现服务创新的流驱动过程 |
4.4.3 数字图书馆知识发现服务创新的流驱动机制模型 |
4.5 数字图书馆知识发现服务创新的数据协同驱动机制 |
4.5.1 数字图书馆知识发现服务创新的数据协同驱动内涵 |
4.5.2 数字图书馆知识发现服务创新的数据协同驱动目标 |
4.5.3 数字图书馆知识发现服务创新的数据协同驱动机制模型 |
4.6 数字图书馆知识发现服务创新的数据驱动控制机制 |
4.6.1 数字图书馆知识发现服务创新的数据驱动控制内涵 |
4.6.2 数字图书馆知识发现服务创新的数据驱动控制方法 |
4.6.3 数字图书馆知识发现服务创新的数据驱动控制模型 |
4.7 本章小结 |
第5章 数据驱动下数字图书馆知识发现服务创新模式研究 |
5.1 数字图书馆知识发现服务创新模式问题的提出 |
5.2 数字图书馆知识发现服务创新模式构建基础 |
5.2.1 数字图书馆知识发现服务创新的模式基础 |
5.2.2 数字图书馆知识发现服务创新的产品基础 |
5.2.3 数字图书馆知识发现服务创新的技术基础 |
5.3 数字图书馆知识发现服务创新功能圈构建 |
5.3.1 数字图书馆知识发现服务创新功能圈的框架设计 |
5.3.2 数字图书馆知识发现服务创新功能圈的架构分析 |
5.3.3 数字图书馆知识发现服务创新功能圈的建立 |
5.4 本章小结 |
第6章 数据驱动下数字图书馆知识发现服务创新模式应用研究 |
6.1 数字图书馆知识发现服务科研用户画像应用 |
6.1.1 用户画像数据收集 |
6.1.2 用户画像模型构建 |
6.1.3 用户画像实验分析 |
6.2 数字图书馆文献资源研究设计指纹识别应用 |
6.2.1 研究设计指纹识别基础 |
6.2.2 数据标注 |
6.2.3 研究设计指纹生成模型训练 |
6.2.4 结果与讨论 |
6.3 融合用户画像和研究设计指纹的文献推荐应用 |
6.3.1 文献推荐模型构建 |
6.3.2 文献推荐仿真实验 |
6.3.3 结果与讨论 |
6.4 数字图书馆知识发现服务多粒度检索决策应用 |
6.4.1 实验准备 |
6.4.2 实验描述 |
6.4.3 实验结果及讨论 |
6.5 本章小结 |
第7章 数据驱动下数字图书馆知识发现服务创新策略研究 |
7.1 数字图书馆知识发现服务创新的优化方向与路径 |
7.1.1 数字图书馆知识发现服务创新的优化方向 |
7.1.2 数字图书馆知识发现服务创新的优化路径 |
7.2 数字图书馆知识发现服务创新的数据化优化 |
7.2.1 数据化优化阻碍 |
7.2.2 数据化优化策略 |
7.3 数字图书馆知识发现服务创新的语义关联优化 |
7.3.1 语义关联优化阻碍 |
7.3.2 语义关联优化策略 |
7.4 数字图书馆知识发现服务创新的可视化优化 |
7.4.1 可视化优化阻碍 |
7.4.2 可视化优化策略 |
7.5 数字图书馆知识发现服务创新的智能化优化 |
7.5.1 智能化优化阻碍 |
7.5.2 智能化优化策略 |
7.6 本章小结 |
第8章 研究结论与展望 |
8.1 研究结论 |
8.2 研究局限 |
8.3 研究展望 |
参考文献 |
作者简介与研究成果 |
致谢 |
(9)基于用户历史查询反馈的兴趣点智能搜索方法优化研究(论文提纲范文)
摘要 |
Abstract |
变量注释表 |
1 绪论 |
1.1 课题研究背景和意义 |
1.2 国内外研究现状 |
1.3 论文研究内容和结构安排 |
2 相关理论与技术研究 |
2.1 PageRank排名算法介绍 |
2.2 几种用户兴趣模型分析 |
2.3 用户兴趣模型框架的建立 |
2.4 本章小结 |
3 基于历史查询反馈的兴趣点智能搜索方法 |
3.1 历史信息获取与处理 |
3.2 历史查询反馈调节算法 |
3.3 智能搜索模型 |
3.4 本章小结 |
4 实验与分析 |
4.1 实验数据与环境 |
4.2 实验设计 |
4.3 实验结果与模型验证 |
4.4 结果分析和不足分析 |
4.5 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 研究展望 |
参考文献 |
作者简历 |
致谢 |
学位论文数据集 |
(10)内蒙古农资服务平台Web搜索智能优化研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 农资服务平台研究 |
1.3.2 Web搜索及智能优化研究 |
1.3.3 搜索引擎评价方法研究 |
1.3.4 文献述评 |
1.4 研究内容与论文的组织架构 |
1.5 研究创新点 |
第二章 相关概念与理论概述 |
2.1 相关概念 |
2.1.1 农资服务平台 |
2.1.2 搜索效果 |
2.2 相关理论 |
2.2.1 Web搜索引擎 |
2.2.2 Web搜索算法 |
2.2.3 搜索效果评价方法 |
第三章 内蒙古农资服务平台Web搜索现状及存在问题 |
3.1 农资服务平台发展模式分类 |
3.1.1 以渠道为优势的农资服务平台 |
3.1.2 以技术为优势的农资服务平台 |
3.2 农资服务平台不同发展模式差异 |
3.3 内蒙古农资服务平台Web搜索现状 |
3.4 内蒙古农资服务平台Web搜索存在问题 |
3.4.1 Web搜索引擎在搜索预处理流程存在问题 |
3.4.2 Web搜索引擎在搜索服务流程存在问题 |
3.5 本章小节 |
第四章 基于用户行为的智能优化算法模型设计与实现 |
4.1 农资服务平台Web搜索智能优化算法适应性分析 |
4.2 基于用户行为的智能优化搜索算法模型构建 |
4.2.1 Web搜索请求的自然语言处理模型设计 |
4.2.2 用户行为数据模型设计 |
4.2.3 Web搜索网页搜索方式 |
4.3 基于用户行为的智能优化搜索模型实现 |
4.3.1 基于用户行为的智能优化算法工作流程 |
4.3.2 基于用户行为的智能优化模型实现 |
4.4 本章小节 |
第五章 基于用户反馈的搜索效果评价 |
5.1 搜索引擎搜索效果评价方法选取 |
5.2 基于用户反馈的Web搜索引擎搜索效果评价模型构建 |
5.2.1 指标选取 |
5.2.2 搜索效果线性回归模型 |
5.3 基于用户反馈的Web搜索引擎搜索效果评价模型实现 |
5.4 内蒙古农资服务平台Web搜索引擎仿真实验 |
5.4.1 数据选取 |
5.4.2 优化结果分析 |
5.5 对策建议 |
5.6 本章小结 |
结论 |
参考文献 |
致谢 |
附录 |
攻读学位期间发表的学术论文及取得的科研成果 |
四、智能化搜索引擎原理及实现(论文参考文献)
- [1]基于排序式SVM的搜索自适应排序系统实现[J]. 薛晓慧,芮光辉,李炜东,袁培森. 计算机技术与发展, 2021(10)
- [2]电子病历搜索引擎中的新词发现和排序技术研究[D]. 吴进发. 电子科技大学, 2021(01)
- [3]基于大数据的网络空间主流意识形态传播研究[D]. 刘培. 中国矿业大学, 2020(07)
- [4]网络媒体舆情检测与分析系统设计与实现[D]. 李春婕. 内蒙古大学, 2020(04)
- [5]基于UCL国家标准的智能化搜索引擎研究[D]. 李超. 东南大学, 2020(01)
- [6]5G网络技术对提升4G网络性能的研究[J]. 刘奕. 数码世界, 2020(04)
- [7]政务服务中的智能化搜索:特征、应用场景和运行机理[J]. 孟庆国,王友奎,田红红. 电子政务, 2020(02)
- [8]数据驱动下数字图书馆知识发现服务创新模式与策略研究[D]. 李洁. 吉林大学, 2019(02)
- [9]基于用户历史查询反馈的兴趣点智能搜索方法优化研究[D]. 丛杨. 山东科技大学, 2019(05)
- [10]内蒙古农资服务平台Web搜索智能优化研究[D]. 邢智. 内蒙古工业大学, 2019(01)