一、基于MPEG-7的多媒体数据描述扩展(论文文献综述)
王小霞[1](2011)在《一种多媒体信息系统的设计与研究》文中研究指明本文介绍一种基于MPEG-7多媒体信息系统,系统应用MPEG-7标准、动态模板技术、XML及XML数据库技术,实现对文本和视频等多种媒体的统一描述和集成管理,可对音像资源进行分段描述,并根据单实例的网状关系进行可视化的语义联想导航检索。
曾中魁[2](2011)在《基于MPEG-7低层特征的视频检索系统》文中研究表明随着数字技术与计算机网络的发展,视频数据量快速增长,如何组织和检索这巨大的视频信息成为一个难题。传统的基于文本来对视频信息进行检索的方法工作量巨大,而且文字标注缺乏统一的标准。因此,CBVR(基于内容的视频检索)技术被提出了,它的主要思想是根据视频图像所包含的颜色、纹理、形状以及对象的空间关系等底层特征和语义等高层特征来分析视频信息。但是,由于视频信息的信息量比一般图像/文本信息更为复杂更为庞大,其内容的描述缺乏统一标准,这就导致CBVR系统的通用性得不到保证从而限制了它的使用范围。而且视频图像的低级特征都是高维向量,对其进行检索非常困难,因此新的高维索引方式的提出是提高视频检索速率的关键。MPEG-7是运动图像专家组提出的基于内容的多媒体描述标准,它支持对视频内容的元数据和文本描述,提供了对视频内容的描述和检索规范。MPEG-7标准的逐步制定和完善,更加推动了高效的基于内容的多媒体信息检索系统的研究与开发。本文主要围绕MPEG-7颜色,纹理等底层特征来分析视频信息。首先从视频片段中抽取出关键帧,然后分析MPEG-7中的描述子提取算法,研究图像特征的提取方法,从视频关键帧中提取出图像的颜色、纹理、形状等描述子特征矢量,并将得到的特征值矢量保存在数据库中,将该特征矢量作为视频图像关键帧的签名,也就是以特征矢量来代表关键帧,这样我们在检索时可以计算两特征矢量的相似度来获得图像之间的相似度。由于关键帧的特征矢量都是高维矢量,如果在检索的时候采用顺序扫描的方式进行,检索速度将会令人难以接受。因此,我们研究了高维数据的索引算法,采用了BitMatrix算法对高维特征矢量数据库建立索引,该算法通过对高维矢量进行量化分区,当进行查询时,仅查询落在相同分区内的矢量数据,大大减少了相似度计算次数,有效地提高了检索效率。实验结果证明,本文所设计的视频检索系统检索速度远远超过顺序扫描算法,同时其检索精度也能满足查询要求,能够进行视频片段的检索。
周志伟[3](2011)在《支持语义的视频检索技术研究》文中指出面对互联网上海量的视频资源,如何快速高效地查询和检索出满足用户需求的视频是信息检索领域的研究热点。传统的视频检索技术有以下两类:一类是基于视频元信息的检索方法,这种检索方法是根据视频的描述信息,采用文本检索技术中的关键词匹配来进行检索,主流的搜索引擎谷歌和百度都采用这种技术,但是这种技术没有充分利用视频本身的内容信息,导致检索的精确度不高;另一类是基于视频内容的检索方法,这种检索方法主要是根据视频的低级特征来进行检索,这种技术的效率不高,无法提供支持高并发的海量视频检索的服务。支持语义的视频检索技术可以解决基于元信息检索的低精确度和基于视频内容的低效率的问题,这种技术主要是对视频进行语义处理,根据视频的语义信息建立索引,使用成熟的关键词匹配技术来进行检索,可以满足不同用户的查询需求。支持语义的视频检索技术,主要是研究怎样获得视频的高层语义信息,采用何种检索方式对上述的语义信息进行检索,达到检索的高效率和高精度。由于视频的高层语义信息理解具有主观性,不同背景的人可能对于相同视频的语义理解不一样,需要标准化的方法对视频的语义进行描述。技术方案上采用MPEG-7的多媒体描述方案,对视频进行语义化标注,建立分布式的全文索引,利用搜索引擎技术进行检索,构建了支持语义的视频检索系统-语寻(Xunet),该系统支持关键词查询、语义图查询和自然语句查询,当用户提交包含语义信息的语句或语义图,语寻系统可以迅速检索到满足用户需求的视频和视频片段,并且提供在线点播的服务。该系统综合了自然语言处理技术、搜索引擎技术和分布式系统技术。完成了支持语义的视频检索系统-语寻(Xunet)的开发和测试,并上线提供服务,该系统可以提供支持语义的查询,该系统的实现提供了一种新的支持语义的搜索方式。
周强[4](2011)在《多媒体个性化建模与检索》文中认为随着计算机网络和多媒体信息的迅猛发展,用户的检索需求在不断变化,用户不再满足于文本检索,多媒体信息的检索备受关注。当前已有的多媒体个性化模型大多是基于用户检索词建模的,没有考虑到多媒体语义信息和类别,不能满足不同用户对多媒体信息的个性化需求。因此,设计一种支持多媒体语义信息并考虑到用户个性化需求的检索方式,具有重要意义。在G3M对MPEG-7描述信息通用存储的基础上,将领域知识引入到G3M模型中,实现用户个性化喜好的描述,建立多媒体个性化模型G3M-UP。该模型从MPEG-7描述文件中提取语义并引入领域知识,实现用户个性化喜好的描述,充分利用提取的语义信息和用户个性化喜好的描述实现用户个性化查询结果的排序,利用扩展的G3M存储策略保存用户个性化喜好和查询历史记录,使用用户查询历史记录和用户个性化喜好描述形成用户混合反馈信息,实现用户个性化喜好信息的更新。综合分析G3M存储的优点,在G3M存储基础上扩展了SQL+XML混合存储方案:充分利用了领域知识的特性、G3M-UP模型中用户个性化喜好的描述以及用户反馈信息的组成。结合多媒体查询的多样性和G3M-UP模型的特点,提出了多种查询方案,包括:语义查询,全文检索查询,领域知识查询,多媒体创建信息查询。实验结果表明,查询方案具有较高的查询效率,满足了用户多媒体个性化查询的需求。
马玲[5](2010)在《基于本体的监控视频描述与检索研究及流媒体发布平台开发》文中研究说明随着社会的发展和多媒体技术的突飞猛进,监控技术的应用越来越广泛,监控设施也越来越多的出现在各种公共场所,像超市、银行、交通路口等。与此同时监控视频数据也急剧增长,产生了海量监控的视频数据,这给事后的视频检索等应用带来巨大的压力。有效地提取监控视频中的底层特征、中层乃至高层语义,并进行结构化的分层描述,在视频数据流之外产生一路视频数据的描述流,从而可以基于描述流进行高效检索和关联调阅,这将为海量视频的快速检索提供可行的解决方案。本文通过分析监控视频的特点及其应用需求,参照MPEG-7等国际标准,提出了一种基于本体的监控视频描述与检索方案。将监控视频分为视频元数据和视频内容数据分别进行描述,其中视频内容的描述包括视频视觉信息层描述、视频对象语义层描述、视频高级语义层描述(包括动作、事件等语义信息)三个层次。并结合本体论(Ontology),构建了一个监控视频描述本体,使该描述方案具有更好的通用性。基于该视频描述方案,设计并实现了一个基于语义的视频检索系统,并初步实现了监控视频的语义检索。在实现上,本文选用目前应用最广泛的Protégé本体编辑器,并选用OWL本体语言,对所提出的监控视频领域本体进行描述。选用功能强大的Jena开发工具包,以提供本体推理和OWL查询接口,最后在Java平台上实现基于本体语义的监控视频检索系统。在该检索系统中,设置了查询预处理和输出结果转换,实现了用户输入语言到本体语言的映射,并最终以用户可读的视频片段作为结果输出,以得到更高的查全率和更好的用户体验。最后,文章还介绍了本作者在硕士研究期间所作的流媒体发布平台开发工作。
栾悉道,谢毓湘,谭义红,陈治平,赵碧海,胡赛[6](2010)在《多媒体语义模型研究进展》文中认为多媒体语义研究是多媒体数据处理与多媒体信息服务领域的核心和关键问题。多媒体数据的语义问题源于多媒体的数据获取方式,在多媒体数据的应用阶段,这一问题成为制约多媒体数据使用和创作的重要瓶颈。语义模型研究是多媒体语义研究的重点,是多媒体数据处理过程的总结和抽象,其实质就是研究多媒体数据整个生命周期的语义问题。介绍了近几年多媒体语义模型在内容描述、语义表示、数据检索三个方面的研究进展情况。
叶传虎[7](2009)在《多媒体语义信息提取和查询工具的研究》文中研究指明基于内容的多媒体检索技术已得到了广泛的应用,但目前出现的基于内容的检索系统,一般只具有基于低层内容特征的检索能力,而提供基于高层语义检索的力度不够。多媒体内容描述标准MPEG-7提供了对多媒体数据进行语义等多方面描述的接口。因此,在MPEG-7描述文档的基础上,设计和开发通用的基于语义的多媒体检索系统具有重要意义。设计的多媒体检索系统由三部分组成:语义信息提取、一般语义查询、个性化查询。语义信息提取根据通用多媒体数据库模型G3M和MPEG-7的语义内容描述,确立要提取出的语义信息,建立语义数据库;然后利用DOM接口技术解析多媒体描述文档,将文档里面的语义信息映射到语义库中。一般语义查询根据用户的查询条件,将其解析,与语义库进行映射,输出符合条件的多媒体数据和相应的描述文档。在个性化查询中,对个性化查询中的用户建模技术、语义过滤技术等核心技术做了研究。在用户兴趣模型的建立上,分析了MPEG-7上个性化查询的局限性,设计了一个基于MPEG-7语义描述方案、布尔操作符AND和OR、用户偏爱权重的用户兴趣模型,并给出了用户兴趣模型在系统中的具体表示。在语义过滤方面,利用用户偏爱信息自动生成查询条件进行检索、过滤,按权重度返回多媒体数据和相应的MPEG-7文档。系统实现了MPEG-7描述文档、视频播放等输出功能。
栾悉道[8](2008)在《多媒体数据语义建模及应用研究》文中研究表明多媒体数据以其丰富的视听内容,越来越多地参与到当今以用户为中心的信息服务体系中。但是,其数据的多样性、语义提取和表示的复杂性、难以逾越的语义鸿沟及多媒体数据的可重用性等问题,已经越来越成为多媒体数据研究与应用的严重阻碍。本文从认知学的角度,探讨研究了多媒体数据服务过程中所遇到的各种难题,特别是多媒体数据的语义表示、建模及检索问题。通过认知心理学方面的研究,对信息用户的信息需求、语义鸿沟等问题进行了深入分析,并开展了多媒体数据语义内容模型、语义概念模型及语义建模等理论和应用研究。论文的主要贡献体现在以下几个方面:1、基于信息用户的认知心理学特点和需求,提出了信息用户的检索行为模型,并对语义鸿沟问题进行分析与扩展。该模型以用户为中心,描述了用户在外界刺激下,根据用户的信息心理和认知结构,对信息需求进行分析、认识、选择信息系统并对检索结果进行交互、过滤和修正检索的过程。将语义鸿沟问题进一步扩展为:思维与自然语言的鸿沟、人机交互鸿沟、特征提取鸿沟、实体语义鸿沟和抽象语义鸿沟等鸿沟。这种扩展与细化,有助于发现多媒体数据分析处理与使用过程中的症结所在。还通过具体分析与说明各个鸿沟的性质,对如何解决语义鸿沟问题、解决问题需要的条件等进行了深入的探讨。2、通过对多媒体数据获取过程的研究和总结,指出目前多媒体数据语义问题的根源在于多媒体数据的获取方式。在这种方式中,数据创作者与使用者分离。前期便利地“获取”数据,是以牺牲后期用户便利地“使用”多媒体数据为代价的。提出根据脚本的描述,结合对象模型、规则模型等数据,生成或者再现脚本所体现的视听觉场景,即基于脚本来生成、获取多媒体数据。提出多媒体数据的内容空间与表示模型。该模型能够对摘要、对象探测等多媒体数据处理进行形式化表示,并从时间、空间和表示粒度三个维度表示出现在多媒体数据中的对象、场景及事件的变化关系。该模型既具有对故事进行整体抽象和概括的能力,又可以体现具体对象的细节,事件和场景的变化过程一目了然,还可以根据需要,在不同的粒度层次上了解场景的含义和内容。3、提出了多媒体数据的语义层次模型。该模型由R轴(规则)、原数据层、低层语义层、高层语义层所组成。提出了基于概念的多媒体数据语义表示模型——概念层次网。研究了概念层次网的扩展,使用概念层次网来表示概念间的空间关系,用以支持基于概念及概念分布的检索(甚至包括某些抽象语义的检索),以及概念层次网的存储、生成、表示以及一致性判断等问题。4、利用描述逻辑所具有的有效推理功能,开展基于描述逻辑表示多媒体数据领域的概念及其语义关系的研究,在理论模型与实际应用之间架起桥梁。研究包括:基于描述逻辑的多媒体数据语义建模相关定义,基于描述逻辑SHOQ(D)实现语义分层——概念层次网的构造、调整等一系列算法,以及基于描述逻辑的多媒体数据语义匹配和检索问题。5、结合国家863项目“数字媒体语义特征分析平台”,重点开展以下三个方面的应用研究:①数字视频的分析、标注与检索;②图像语义标注与检索研究;③基于脚本的动画场景生成。在这个平台里,验证了本文提出的多媒体数据的语义层次模型、基于概念的多媒体数据语义表示和检索模型,以及基于描述逻辑的多媒体数据语义建模等内容。综上所述,本文针对多媒体数据的语义问题,探讨研究了该问题存在的各种症结,如语义鸿沟问题、语义提取和表示问题、语义扩展及检索问题,提出了多媒体的语义内容模型、语义概念模型等相关模型,并进行基于描述逻辑的多媒体数据语义的建模,在国家863项目“数字媒体语义特征分析平台”平台研究中对这些模型进行了验证。
黄剑玲,程若锋[9](2008)在《基于MPEG-7的现代化教育研究》文中研究说明MPEG-7标准主要用于对各种不同类型的多媒体信息进行标准化描述,并将该描述与所描述的内容相联系,以实现对多媒体信息快速有效的搜索。本文在论述MPEG-7核心内容的基础上,对MPEG-7在现代化教育中的应用作了深入的研究。
张男[10](2008)在《基于内容的光学遥感图像检索关键技术研究》文中认为遥感图像数据作为数字地球等各项重大计划建设中的基础数据,其快速浏览和高效检索是遥感图像信息提取和共享的重要手段;基于内容的图像检索技术作为从试图理解图像内容的角度有效管理和利用图像数据库中信息的手段,己经成为图像数据库、计算机视觉等领域的研究热点和未来信息高速公路、数字图书馆等重大项目中的关键技术,为解决大型遥感图像数据库的信息提取难题提供了新的契机。然而,遥感图像数据的多样性、复杂性和海量性无疑对基于内容的遥感图像库检索提出了巨大的挑战。基于内容的遥感图像库检索技术是遥感图像处理、图像数据库技术、计算机视觉、模式识别等领域相结合的国际前沿课题,对于促进遥感图像信息的提取和共享,具有十分重要的理论意义和实用价值。本文旨在针对基于内容的光学遥感图像库检索的关键技术,提出一些创新性思路和方法,并分别从理论和技术的角度对其价值和实用性予以分析和验证。主要贡献及创新点可概括如下:1、提出一个基于MPEG-7标准的遥感图像模型,并在此模型框架下,针对遥感图像的检索流程,定义了一系列的运算,完整地实现了对遥感图像检索的描述。2、提出了遥感图像检索领域纹理特征适应性的评估方法,针对不同分辨程度、不同地貌特征的遥感图像,利用检索的查全、查准率性能分析方法研究了5种常用纹理特征提取方法的适应程度,并对其计算复杂性进行了比较。3、提出了一种针对遥感图像检索的交互式遗传检索方法,根据遥感图像特点设计了染色体编码方法和遗传操作过程;充分地实现了人机交互和计算机遗传算法的有效结合。4、提出了一种支持遥感图像检索的基于多带小波的迭代分形压缩算法,通过实验对其可行性和有效性进行了验证。5、根据论文的研究成果,设计并实现了一个基于内容的遥感图像检索实验系统。该系统能够实现常规的基于内容的光学遥感图像检索的功能,同时还能利用交互式遗传算法实现一般意义上的人机交互。
二、基于MPEG-7的多媒体数据描述扩展(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于MPEG-7的多媒体数据描述扩展(论文提纲范文)
(1)一种多媒体信息系统的设计与研究(论文提纲范文)
1、引言 (概述) |
2、多媒体信息系统的相关技术研究 |
2.1 图像检索技术 |
2.2 多媒体内容描述标准MPEG-7 |
2.3 多媒体数据库设计 |
2.4 在多媒体信息系统设计方面应该注意下述几点 |
3、基于MPEG-7的多媒体信息系统的设计与实现 |
3.1 系统设计 |
3.2 系统实现的功能模块 |
3.3 系统媒体内容 |
4、系统的主要技术特点 |
5、多媒体信息系统的应用研究 |
6、结论及未来展望 |
(2)基于MPEG-7低层特征的视频检索系统(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 问题的提出 |
1.2 当前国内外研究现状 |
1.3 论文主要工作 |
1.4 论文组织结构 |
第2章 MPEG-7 标准简介 |
2.1 MPEG-7 的范围 |
2.2 MPEG-7 背景和应用 |
2.2.1 MPEG 背景 |
2.2.2 MPEG-7 应用 |
2.3 MPEG-7 结构 |
2.3.1 MPEG-7 组成部分 |
2.3.2 MPEG-7 基本结构 |
2.3.3 MPEG-7 可扩展性 |
2.4 MPEG-7 概念模型 |
2.5 MPEG-7 多媒体描述方案 |
2.5.1 基本元素 |
2.5.2 内容描述工具 |
2.5.3 内容组织、浏览访问和用户交互 |
2.5.4 分类方案 |
2.6 小结 |
第3章 MPEG-7 视觉特征描述子 |
3.1 颜色描述子 |
3.1.1 颜色空间 |
3.1.2 主颜色描述符 |
3.1.3 可伸缩颜色描述符 |
3.1.4 颜色结构描述子 |
3.1.5 颜色量化 |
3.1.6 颜色分布描述子 |
3.1.7 帧组/图组描述子 |
3.2 纹理描述子 |
3.2.1 同构型纹理描述子 |
3.2.2 纹理图像浏览描述子 |
3.2.3 边缘直方图描述子 |
3.3 形状描述子 |
3.3.1 区域形状 |
3.3.2 轮廓形状 |
3.3.3 三维形状 |
3.4 小结 |
第4章 BitMatrix 索引算法及其改进 |
4.1 视频信息检索简介 |
4.1.1 视频的表示方法 |
4.1.2 视频片段相似度 |
4.1.3 视频片段的检索方法 |
4.2 高维索引技术介绍 |
4.2.1 高维索引发展过程 |
4.2.2 高维索引分类 |
4.2.3 几种代表性的高维索引结构 |
4.3 BitMatrix 视频索引算法 |
4.3.1 BitMatrix 算法中的范围查询 |
4.3.2 BitMatrix 算法中的相似度计算 |
4.3.3 Bitmap 简介 |
4.3.4 BitMatrix 算法具体步骤 |
4.4 BitMatrix 算法的改进 |
4.4.1 改进算法1 |
4.4.2 改进算法2 |
4.4.3 改进算法3 |
4.5 小结 |
第5章 视频检索系统设计与实现 |
5.1 系统总体模块 |
5.2 MPEG-7 特征值抽取 |
5.2.1 颜色分布描述子 |
5.2.2 颜色结构 |
5.2.3 边缘直方图 |
5.2.4 区域形状描述子 |
5.3 索引模块 |
5.3.1 相似度度量 |
5.3.2 索引 |
5.4 查询模块 |
5.4.1 样例特征值量化 |
5.4.2 关键帧查询 |
5.4.3 视频查询 |
5.5 实验结果比较 |
5.5.1 查询时间比较 |
5.5.2 查询效果比较 |
5.6 小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的其它研究 |
(3)支持语义的视频检索技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 论文研究背景 |
1.2 国内外研究现状 |
1.3 论文研究思路 |
1.4 论文主要工作 |
1.5 论文的组织结构 |
第2章 相关技术背景 |
2.1 MPEG-7 |
2.1.1 MPEG-7 标准概述 |
2.1.2 基于MPEG-7 的图像语义描述方案 |
2.2 自然语言处理 |
2.2.1 自然语言处理概述 |
2.2.2 汉语词语处理的问题 |
2.2.2.1 词义消歧的问题 |
2.2.2.2 自动分词 |
2.2.2.3 词语的兼类 |
2.2.3 自然语言理解技术的主要应用 |
2.3 基于哈工大语言技术平台(LTP)的语义分析 |
2.3.1 LTP 简介 |
2.3.2 基于LTP 的语义分析 |
2.4 lucene 检索 |
2.4.1 索引和倒排索引 |
2.4.2 Lucene 的索引建立 |
2.4.3 索引的添加,删除和更新 |
2.4.4 搜索 |
2.4.5 Lucene 的分析器 |
2.4.6 Lucene 的评分机制 |
第3章 视频预处理和语义标注 |
3.1 视频的预处理 |
3.1.1 视频预处理流程 |
3.1.2 格式转换 |
3.1.3 视频切割 |
3.1.4 特征抽取 |
3.1.5 语义标注 |
3.2 视频的语义标注 |
3.2.1 视频的描述信息 |
3.2.2 视频的语义标注 |
3.3 描述和提取视频的语义 |
3.3.1 提取视频的语义 |
3.3.2 描述视频语义的主要方法 |
3.3.3 将MPEG-7 标准应用于提取多媒体的语义 |
3.4 语义图语义标注 |
3.5 融合多元信息的语句相似度技术 |
3.5.1 语句相似度 |
3.5.2 融合多元信息的语句相似度技术综述 |
3.5.3 语义分析 |
第4章 支持语义的索引和检索 |
4.1 基于语句相似度融合的检索 |
4.1.1 融合语句多元信息 |
4.1.2 基于Lucene 的语句相似度融合 |
4.2 基于语义图形化的检索 |
4.2.1 语义的图形化检索 |
4.2.2 语义图形化的检索过程 |
4.2.3 语义图索引的建立 |
4.2.4 提交用户的查询语义图 |
4.2.5 检索过程 |
第5章 支持语义的视频检索系统 |
5.1 支持语义的视频检索系统的设计和实现 |
5.1.1 系统架构 |
5.1.2 系统用户界面 |
5.1.3 语寻中各子系统设计与实现 |
5.1.3.1 视频预处理子系统 |
5.1.3.2 信息管理子系统 |
5.1.3.3 检索子系统 |
5.1.3.4 语义处理子系统 |
5.1.3.5 MDN 子系统 |
5.2 系统的测试 |
5.2.1 测试系统的结构 |
5.2.2 测试系统的相关配置 |
5.2.3 系统的性能分析 |
5.2.4 语义文本测试 |
第6章 总结及展望 |
6.1 总结 |
6.2 进一步的研究工作 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(4)多媒体个性化建模与检索(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 课题背景 |
1.2 国内外概况 |
1.3 课题主要研究工作 |
2 多媒体个性化模型的建立 |
2.1 多媒体个性化模型的建立 |
2.2 多媒体个性化模型的定性分析 |
2.3 小结 |
3 多媒体个性化模型存储策略 |
3.1 多媒体个性化查询存储需求 |
3.2 G3M 存储策略简介 |
3.3 G3M-UP 模型存储策略 |
3.4 本章小结 |
4 多媒体个性化查询系统设计与实现 |
4.1 系统总体架构图 |
4.2 多媒体个性化维护 |
4.3 个性化查询 |
4.4 实验及结果分析 |
4.5 本章小结 |
5 总结与展望 |
5.1 全文总结 |
5.2 展望 |
致谢 |
参考文献 |
(5)基于本体的监控视频描述与检索研究及流媒体发布平台开发(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.1.1 传统视频监控系统 |
1.1.2 智能视频监控系统 |
1.1.3 监控领域存在的问题 |
1.2 视频描述与检索的现状及其意义 |
1.2.1 监控领域研究现状 |
1.2.2 视频层次化分析 |
1.2.3 视频数据模型 |
1.2.4 视频内容的描述 |
1.2.5 视频检索技术 |
1.3 论文的主要工作 |
1.4 论文内容安排 |
第二章 相关技术概述 |
2.1 MPEG-7 标准介绍及其描述模型 |
2.1.1 MPEG-7 概述 |
2.1.2 MPEG-7 的主要内容 |
2.1.3 MPEG-7 的应用 |
2.2 本体论概述 |
2.2.1 本体的建模元语 |
2.2.2 本体分类方法 |
2.2.3 本体构造的基本思想 |
2.2.4 本体构建方法 |
2.2.5 本体编辑工具 |
2.2.6 本体描述语言 |
2.3 视频语义检索 |
2.3.1 语义检索的关键技术 |
2.3.2 基于本体的语义检索 |
2.3.3 视频检索算法 |
2.4 本章小结 |
第三章 基于ONTOLOGY 的监控视频描述 |
3.1 监控视频应用场景分析 |
3.2 基于本体的监控视频描述 |
3.2.1 现有的视频语义描述方法 |
3.2.2 监控视频描述方案 |
3.3 构建监控视频描述本体 |
3.3.1 监控视频类的定义 |
3.3.2 监控视频属性定义 |
3.3.3 监控视频中的关系定义 |
3.4 分析本体实例描述 |
3.4.1 视频元数据描述 |
3.4.2 视频对象描述 |
3.4.3 视频事件描述 |
3.5 本章小结 |
第四章 监控视频语义检索 |
4.1 JENA 简介 |
4.2 监控视频检索系统设计 |
4.2.1 试验系统开发平台 |
4.2.2 检索系统整体架构 |
4.3 系统各功能模块的实现 |
4.3.1 用户交互模块 |
4.3.2 查询转换模块 |
4.3.3 推理模块 |
4.3.4 输出转换模块 |
4.4 实验结果与分析 |
4.4.1 实验方法 |
4.4.2 实验结果分析 |
4.5 本章小结 |
第五章 流媒体发布平台 |
5.1 流媒体平台概述 |
5.1.1 流媒体技术概要 |
5.1.2 流媒体服务器介绍 |
5.2 流媒体发布平台模块功能介绍 |
5.2.1 平台的搭建环境 |
5.2.2 平台的整体架构 |
5.2.3 平台架构模块介绍 |
5.3 本章小结 |
第六章 结束语 |
6.1 研究工作总结 |
6.2 下一步工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间发表的学术论文目录 |
(6)多媒体语义模型研究进展(论文提纲范文)
1 引言 |
2 多媒体语义问题研究的困境 |
3 多媒体语义模型研究进展 |
3.1 多媒体内容描述模型 |
1) 多媒体内容描述项目和框架 |
2) 图像的语义标注与检索 |
3) 视频建模与处理 |
4) 结合本体理论的MPEG-7研究 |
3.2 多媒体数据语义表示模型 |
3.3 多媒体数据检索模型 |
(7)多媒体语义信息提取和查询工具的研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 课题背景 |
1.2 国内外概况 |
1.3 课题主要研究工作 |
2 多媒体语义信息提取和查询工具的总体设计 |
2.1 多媒体语义信息提取和查询工具的需求分析 |
2.2 多媒体数据库模型的选择 |
2.3 多媒体语义信息提取和查询工具的总体设计 |
2.4 小结 |
3 语义信息提取的研究 |
3.1 MPEG-7 语义描述方案分析 |
3.2 语义信息提取的设计 |
3.3 语义信息提取的实现 |
3.4 实验结果与分析 |
3.5 小结 |
4 语义查询的研究和实现 |
4.1 查询系统分析 |
4.2 查询器的方案描述与实现 |
4.3 查询结果和分析 |
4.4 小结 |
5 个性化查询的研究 |
5.1 基于MPEG-7 的用户兴趣模型的建立 |
5.2 个性化查询中语义过滤的研究 |
5.3 小结 |
6 总结与展望 |
6.1 全文总结 |
6.2 展望 |
致谢 |
参考文献 |
(8)多媒体数据语义建模及应用研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.1.1 信息服务模式的变迁 |
1.1.2 多媒体数据处理与应用的困境 |
1.2 国内外研究现状 |
1.2.1 多媒体数据内容描述模型 |
1.2.2 多媒体数据语义表示模型 |
1.2.3 多媒体数据检索模型 |
1.3 论文的主要工作 |
1.4 论文的组织 |
第二章 多媒体数据语义模型相关基础及分析 |
2.1 多媒体数据模型基础 |
2.2 信息需求与检索的认知心理学基础 |
2.2.1 认知心理学与认知科学 |
2.2.2 信息需求的认知过程模型 |
2.2.3 检索的过程与行为模型 |
2.3 信息需求与行为建模 |
2.3.1 信息用户需求 |
2.3.2 信息检索行为模型 |
2.4 语义鸿沟问题分析 |
2.4.1 语义鸿沟问题的来源 |
2.4.2 语义鸿沟问题的分析与扩展 |
2.5 本章小结 |
第三章 多媒体数据语义内容模型 |
3.1 多媒体数据及其语义内容的获取模型 |
3.1.1 多媒体数据的获取 |
3.1.2 多媒体数据语义的获取方式 |
3.1.3 多媒体数据获取模型 |
3.2 多媒体数据内容分层模型 |
3.3 多媒体数据内容表示模型 |
3.3.1 多媒体数据内容空间 |
3.3.2 基于对象-关系的多媒体数据内容空间表示 |
3.4 本章小结 |
第四章 多媒体数据语义概念模型 |
4.1 多媒体数据语义层次模型 |
4.2 多媒体数据语义表示模型 |
4.2.1 知识的表示及获取 |
4.2.2 概念层次网 |
4.3 多媒体数据语义检索模型 |
4.3.1 基于概念的检索 |
4.3.2 概念的语义扩展 |
4.3.3 基于概念的多媒体数据语义检索模型 |
4.4 本章小结 |
第五章 基于描述逻辑的多媒体数据语义建模 |
5.1 描述逻辑与SHOQ(D) |
5.1.1 描述逻辑概述 |
5.1.2 SHOQ(D)概述 |
5.2 基于描述逻辑的多媒体数据语义建模相关定义 |
5.3 基于描述逻辑的多媒体数据语义分层 |
5.4 多媒体数据语义相关度分析及匹配 |
5.5 本章小结 |
第六章 多媒体数据语义模型应用研究 |
6.1 数字媒体语义特征分析平台概述 |
6.2 数字视频分析、标注与检索 |
6.2.1 需求分析 |
6.2.2 研究结构 |
6.2.3 研究实现与结论 |
6.3 图像语义标注与检索 |
6.3.1 需求分析与研究结构 |
6.3.2 图像对象标注与人机接口设计 |
6.3.3 基于概念分布的图像语义检索 |
6.3.4 研究实现与结论 |
6.4 基于脚本的动画场景生成 |
6.4.1 需求分析与研究结构 |
6.4.2 研究实现 |
6.4.3 研究结论 |
6.5 本章小结 |
第七章 结束语 |
7.1 论文的主要贡献 |
7.2 进一步的工作 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
附录A 文中常用术语英汉对照表 |
(9)基于MPEG-7的现代化教育研究(论文提纲范文)
1 引言 |
2 MPEG-7的核心内容 |
3 MPEG-7在现代化教育中的应用 |
3.1 基于MPEG-7的学习系统 |
3.2基于MPEG-7的教学软件 |
3.3基于MPEG-7的教学视频 |
4 结束语 |
(10)基于内容的光学遥感图像检索关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 基于内容的遥感图像检索的提出与发展 |
1.1.1 基于内容的图像检索 |
1.1.2 基于内容的遥感图像检索 |
1.2 国内外研究现状 |
1.2.1 基于内容的遥感图像检索技术研究内容及现状 |
1.2.2 基于内容的遥感图像检索系统现状 |
1.3 论文的主要研究工作及成果 |
1.4 论文的内容安排 |
第二章 基于MPEG-7 的遥感图像特征描述与建模 |
2.1 概述 |
2.2 遥感图像数据的特点 |
2.2.1 遥感图像数据内容上的特点 |
2.2.2 遥感图像数据结构上的特点 |
2.2.3 遥感图像数据管理上的难点 |
2.3 MPEG-7 标准用于遥感图像描述的可行性分析 |
2.3.1 MPEG-7 标准简介 |
2.3.2 MPEG-7 规范对遥感图像描述的支持 |
2.4 遥感图像特征的描述 |
2.4.1 颜色特征数学描述 |
2.4.2 纹理特征数学描述 |
2.4.3 形状特征数学描述 |
2.5 基于MPEG-7 标准的遥感图像模型 |
2.5.1 MPEG-7 标准中模型的描述方式 |
2.5.2 基于MPEG-7 标准的遥感图像建模 |
2.5.3 遥感图像检索流程中的运算符定义 |
2.6 基于MPEG-7 的遥感图像模型的具体实现 |
2.6.1 遥感图像分层模型的实现 |
2.6.2 遥感图像分块模型的实现 |
2.6.3 基于MPEG-7 标准的遥感图像特征描述 |
2.7 小结 |
第三章 遥感图像检索纹理特征适应性研究 |
3.1 概述 |
3.2 纹理特征的检索适应性评估方法的提出 |
3.3 几组常规的纹理特征提取方法 |
3.3.1 改进的纹理谱特征 |
3.3.2 灰度共生矩阵特征 |
3.3.3 局部傅立叶特征 |
3.3.4 Gabor滤波器特征 |
3.3.5 分形特征 |
3.4 纹理特征的相似性度量 |
3.5 检索性能评价方法 |
3.5.1 基于排序的评价方法 |
3.5.2 基于查全率和查准率的评价方法 |
3.5.3 基于检索效率的评价方法 |
3.6 实验及结果分析 |
3.6.1 针对不同地貌特征的纹理特征适应性比较 |
3.6.2 针对遥感图像不同金字塔层的纹理特征适应性比较 |
3.6.3 计算复杂度的比较 |
3.6.4 结论 |
3.7 小结 |
第四章 遥感图像检索算法 |
4.1 概述 |
4.2 交互式遗传算法在基于内容的遥感图像检索中的应用 |
4.2.1 标准遗传算法 |
4.2.2 交互式遗传算法 |
4.2.3 用于信息检索的交互式遗传算法一般框架 |
4.2.4 交互式遗传算法的用户接口 |
4.2.5 应用于遥感图像检索的交互式遗传算法 |
4.2.6 实验及结果分析 |
4.2.7 结论 |
4.3 小结 |
第五章 基于多带小波变换的迭代分形编码压缩域检索算法 |
5.1 概述 |
5.2 图像分形压缩编码及压缩域检索的基本原理 |
5.2.1 迭代函数系统和拼接原理 |
5.2.2 经典Jacquin分形压缩编码算法 |
5.2.3 迭代分形压缩编码用于图像检索的分析 |
5.3 基于多带小波变换的遥感图像迭代分形编码压缩方法 |
5.3.1 图像数据的多带小波变换 |
5.3.2 方向性细节图像块的选取 |
5.3.3 迭代函数系统的构造 |
5.3.4 低频子图像的量化和熵编码 |
5.3.5 遥感图像压缩实验 |
5.4 基于多带小波变换的迭代分形压缩域遥感图像检索 |
5.4.1 特征量计算 |
5.4.2 特征量匹配 |
5.4.3 遥感图像检索实验 |
5.5 小结 |
第六章 遥感图像检索实验系统的设计与实现 |
6.1 概述 |
6.2 遥感图像数据库影像数据管理 |
6.2.1 遥感图像元数据 |
6.2.2 遥感图像在Oracle数据库中的存储组织 |
6.3 基于内容的遥感图像库检索原型系统体系结构设计 |
6.3.1 主要功能模块 |
6.3.2 遥感图像查询模块 |
6.3.3 遥感图像浏览模块 |
6.3.4 遥感图像数据库模块 |
6.3.5 特征提取与建模模块 |
6.3.6 相似性匹配应用模块 |
6.4 小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 进一步深入研究的方向 |
7.3 结束语 |
致谢 |
参考文献 |
攻读博士期间撰写的论文 |
四、基于MPEG-7的多媒体数据描述扩展(论文参考文献)
- [1]一种多媒体信息系统的设计与研究[J]. 王小霞. 数字技术与应用, 2011(06)
- [2]基于MPEG-7低层特征的视频检索系统[D]. 曾中魁. 中国科学技术大学, 2011(09)
- [3]支持语义的视频检索技术研究[D]. 周志伟. 中国科学技术大学, 2011(10)
- [4]多媒体个性化建模与检索[D]. 周强. 华中科技大学, 2011(07)
- [5]基于本体的监控视频描述与检索研究及流媒体发布平台开发[D]. 马玲. 上海交通大学, 2010(02)
- [6]多媒体语义模型研究进展[J]. 栾悉道,谢毓湘,谭义红,陈治平,赵碧海,胡赛. 计算机科学, 2010(11)
- [7]多媒体语义信息提取和查询工具的研究[D]. 叶传虎. 华中科技大学, 2009(S2)
- [8]多媒体数据语义建模及应用研究[D]. 栾悉道. 国防科学技术大学, 2008(04)
- [9]基于MPEG-7的现代化教育研究[J]. 黄剑玲,程若锋. 上饶师范学院学报, 2008(03)
- [10]基于内容的光学遥感图像检索关键技术研究[D]. 张男. 国防科学技术大学, 2008(04)