一、视频网络与视频网络中涉及的相关技术(论文文献综述)
杨铮,贺骁武,吴家行,王需,赵毅[1](2022)在《面向实时视频流分析的边缘计算技术》文中认为实时视频流分析在智能监控、智慧城市、自动驾驶等场景中具有重要价值.然而计算负载高、带宽需求大、延迟要求严等特点使得实时视频流分析难以通过传统的云计算范式进行部署.近年来兴起的边缘计算范式,将计算任务从云端下沉到位于网络边缘的终端设备和边缘服务器上,能够有效解决上述问题.因此,许多针对实时视频流分析的边缘计算研究逐渐涌现.本文首先介绍了智能视频流分析和边缘计算的背景知识,以及二者结合的典型应用场景;接着提出了现有系统所关注的衡量指标和面临的挑战;然后从终端设备层次、协作层次、边缘/云层次对本领域的关键技术分别进行了详细的介绍,重点涉及了模型压缩和选择、本地缓存、视频帧过滤、任务卸载、网络协议、隐私保护、查询优化、推理加速和边缘缓存技术.基于对上述各项核心技术的有机整合,本文提出了基于边缘计算的视频大数据智能分析平台Argus,从数据采集、推理分析,到数据挖掘、日志管理,对实时视频流分析全生命周期提供支持,并成功应用到智慧油田中.最后,本文讨论了本领域尚待解决的问题和未来研究方向,希望为今后的研究工作提供有益参考.
赵才荣,齐鼎,窦曙光,涂远鹏,孙添力,柏松,蒋忻洋,白翔,苗夺谦[2](2021)在《智能视频监控关键技术:行人再识别研究综述》文中提出行人再识别(person re-identification, ReID)旨在解决跨摄像头跨场景下目标行人的关联与匹配,作为智能视频监控系统的关键环节,对维护社会公共秩序具有重大作用.为了深入了解行人再识别研究现状和加速推进国内行人再识别相关研究及技术落地,本文对该领域国家自然科学基金申报数量、资助力度以及地理分布情况进行统计,并针对近年来发表在国际顶级会议和期刊上的行人再识别研究进行全面梳理.具体地,首先阐述一个标准行人再识别算法流程,并总结其中3个关键技术:表征学习、度量学习和重排序优化.随后,列举了实际开放场景中面临的主要难点与挑战,并据此概括了7种开放行人再识别任务:遮挡、无监督、半监督、跨模态、场景行人搜索、对抗鲁棒和快速检索.此外,本文整理了标准行人再识别和开放行人再识别的代表性数据集,并且对一些代表性行人再识别算法进行比较.最后本文对行人再识别的未来发展趋势进行展望.
唐宁[3](2021)在《边缘计算的物联网任务处理策略研究》文中指出5G网络对任务提出了更低时延的要求,使得原有网络架构不能胜任。移动边缘计算(MEC)被提出并认为是解决网络时延要求的一种可行架构,该架构将计算资源布置在基站侧,相比于云计算,该架构实现更近服务,满足终端对计算资源的需求。热门资源的缓存是降低通信数据冗余的一类思想,在MEC中引入缓存可以将用户需要上传的资源提前预置,从而降低任务上传成本,进一步提高网络性能。终端将自身计算任务卸载至MEC服务器中,在自身资源受限的情况下可以降低任务时延,节约终端能耗。在现实的网络中,计算通信等资源往往会被多个任务同时请求,如何选择卸载策略和资源分配策略对于整个网络性能有着关键影响。MEC中引入的缓存大小受限,不同的缓存方案带来的系统成本下降有着显着差异。因此论文主要研究如下。针对单一无缓存MEC服务器覆盖范围下多用户同时请求任务所带来的资源分配问题提出一种卸载策略和资源分配方案。该场景下MEC服务器不仅被新的任务所请求,同时自身旧的任务还在计算。任务的系统成本由时延和能耗加权求和,每个任务的时延能耗权重各不相同。考虑将服务器中已运行任务占用的资源纳入优化范围,降低整个系统的成本。卸载策略包含新任务的上传与否及分配的资源,以及已运行的任务是否暂停以空置出部分资源。该问题的目标函数为NP问题,为解决该问题,论文中运用改进的鲸鱼算法将其优化,仿真结果显示,所提出的策略可明显降低系统的成本。针对缓存增强的MEC场景,为发挥缓存增强的MEC服务器的优势,需要合理地将用户资源提前预置在基站侧。每个任务本身都有流行度和空间大小以及所需计算量三个基本属性,缓存的优化目标是提升命中率和命中本身带来的收益。网络中缓存方案的确定和计算任务的发起可以分为两个动作,在求解该场景下成本优化函数时也将其分拆为缓存方案设计和计算任务优化两个步骤。首先将缓存方案转化为背包问题,利用动态规划进行递归获得存储方案,之后在该存储方案的基础上利用鲸鱼算法优化计算任务,使其成本最低。仿真结果显示,在通信计算资源使用相同优化方案条件下,合理的缓存放置策略能将缓存带来的效益最大化。无缓存下使用优化方案和有缓存下随机分配资源所带来的算法收益和硬件收益比较,在不同参数下优势会发生变化。在前两部分研究的基础上,将问题拓展到多MEC协作缓存与计算的场景,该场景中每个基站均有一定的计算和存储资源,不同小区内的用户密度不同。多个MEC协作缓存和计算资源,共同服务所有用户。本章中将问题分解为缓存放置、卸载策略和资源分配,设计了综合考虑文件流行度和丰富度的贪婪算法来解决存储问题,运用粒子群算法优化卸载决策与资源分配。仿真证明了算法的有效性和协作带来的增益。
张柳[4](2021)在《社交网络舆情用户主题图谱构建及舆情引导策略研究》文中研究说明习近平总书记在党的十九大上向全党全国人民发出了“坚定文化自信,推动社会主义文化繁荣兴盛”的伟大号召。“总体国家安全观”也被列为新时代背景下建设有中国特色社会主义的基本方略。对社交网络舆情的有效监管,是在新形势下应对国家安全环境新变化、新发展的必然要求。但是,网络的虚拟性,给社交网络舆情的监管带来了极大的难度。社交网络以及舆情用户的特性对社交网络舆情信息生态平衡有着较大的影响,如若不加以正确的引导与管理,会导致社交网络舆情生态系统恶化,甚至威胁社会和谐和国家稳定。如何有效地利用知识图谱构建社交网络舆情用户主题图谱系统模型,挖掘用户的潜在社群,确定用户的身份特征,并分析出用户的情感倾向,是舆情监管工作的有效切入点。本文结合文献分析法、实证研究法、知识图谱和机器学习等方法,构建社交网络舆情用户主题图谱并提出舆情引导策略。具体来说,本研究主要包括六个部分。首先,第三章提出社交网络舆情用户主题图谱系统模型,是全文的理论核心框架,指出社交网络舆情用户主题图谱系统模型的四个关键要素为信息环境、信息人、信息和信息技术,并通过用户社群图谱、用户身份图谱和用户情感图谱构成多维度的主题图谱;之后,第四章至第六章分别基于信息环境、信息人和信息,以“埃航空难”作为典型话题案例,运用实证分析方法,通过构建用户社群图谱、用户身份图谱以及用户情感图谱,研究社交网络舆情用户社群发现、用户身份识别以及情感演化规律,为第七章和第八章提供理论支撑;随后,第七章提出社交网络舆情生态性评价,并基于第四、五、六章的分析内容提出社交网络舆情生态性评价指标,为第八章提出的舆情引导策略提供理论支撑;最后,第八章提出社交网络舆情引导策略,为本文实践层面的落脚点。下面予以详细阐述。第三章社交网络舆情用户主题图谱系统构建。首先,提出社交网络舆情用户主题图谱的信息生态要素为环境要素、主体要素、客体要素以及技术要素;其次,结合知识图谱的相关理论,提出社交网络舆情用户主题图谱的实体识别、关系抽取、属性抽取以及模型构建;然后,指出社交网络舆情用户主题图谱分别由用户社群图谱、用户身份图谱和用户情感图谱三个维度构成,并从信息环境角度对社群发现、信息人角度对身份识别以及信息角度对情感演化进行深度分析,并在此基础上对整个社交网络舆情进行生态性评价;最后,提出社交网络舆情用户主题图谱系统模型。第四章社交网络舆情用户社群图谱构建及关系发现。本章基于信息环境理论,结合JS散度的LDA主题模型构建社交网络舆情用户社群图谱,并进行社群关系发现。采用实证研究法,对“埃航空难”话题下的舆情文本进行主题建模,利用困惑度指标确定舆情用户最优主题数,通过JS散度进行相似度度量,并将计算结果作为边权重,使用VOSviewer软件构建用户社群图谱,进一步划分多个网络社群,对网络社群的主题偏好以及用户特征进行分析讨论,并准确定位网络社群中的意见领袖。本章主要研究社交网络舆情中的信息环境,与第五、六章相呼应,为第七章社交网络舆情生态性评价指标(B1、B2)和第八章社交网络舆情社群的引导策略提供理论支撑。第五章社交网络舆情用户身份图谱构建及身份识别。本章基于信息人理论,结合LDA主题模型和朴素贝叶斯分类器模型构建社交网络舆情用户身份图谱,并对用户身份进行识别。首先,采用实证研究法,以突发事件“埃航空难”话题作为信息环境构建舆情空间,挖掘舆情用户转发评论文本的深层语义特征,剖析舆情用户的身份特征和传播特征;然后利用朴素贝叶斯分类器划分舆情用户类型,结合舆情生命周期,使用Neo4j绘制用户身份图谱,从而有效掌握社交网络舆情用户身份类型,并系统剖析社交网络舆情用户主题关注点及演化过程。本章主要研究社交网络舆情中的信息人,与第四、六章相呼应,为第七章社交网络舆情生态性评价指标(B3、B4、B5)和第八章社交网络舆情用户的引导策略提供理论支撑。第六章社交网络舆情用户情感图谱构建及情感演化。本章基于信息理论,基于字词向量的多尺度卷积神经网络构建社交网络舆情用户情感图谱,有效划分舆情用户情感倾向。首先,采用实证研究法,以突发事件“埃航空难”话题为例对舆情用户的转发评论信息进行情感分类,并对构建的舆情文本情感分类模型的准确性进行验证分析,并验证模型的优越性;然后,结合舆情文本的情感倾向与突发事件舆情发展周期,使用Gephi绘制用户情感图谱,动态展示社交网络舆情用户情感演化过程,全面分析网络舆情的发展与舆情用户的情感变化规律。本章主要研究社交网络舆情中的信息,与第四、五章相呼应,为第七章社交网络舆情生态性评价指标(B6)和第八章社交网络舆情情感的引导策略提供理论支撑。第七章社交网络舆情生态性评价。本章基于信息生态系统理论提出社交网络舆情生态性评价体系。采用综合模糊评价法,对突发事件“埃航空难”话题的爆发期阶段进行生态性评价,并对评价结果进行了分析,有效地解决了生态评价指标难以量化的问题,为生态性评价提供了可操作性的解决方案。本章与第四、五、六章相呼应,为第八章社交网络舆情情感的引导策略提供理论支撑。第八章社交网络舆情引导策略。本章基于第四、五、六章的研究结论,在第七章社交网络舆情生态性评价指标的基础上,提出社交网络舆情引导策略。首先从互联网及社交网络舆情生态性的角度指出目前存在的问题;然后分别从信息环境、信息人以及信息三个维度提出了引导策略。具体而言,本章从信息环境维度,提出加强衍生话题的监测、完善社交网络舆情话题推送和重视社群服务的社群引导策略;从信息人维度,提出完善用户类型化管理、发挥主流媒体的作用和完善意见领袖沟通机制的用户引导策略;从信息维度,提出社交网络内容精细化管理、重视舆情情感引导、完善健全舆情情感预警机制的情感引导策略。本文在理论层面,提出了社交网络舆情用户主题图谱的系统构建方式,为社交网络舆情主题图谱的构建提供理论基础及实践指导。从用户社群、用户身份、用户情感三个不同维度构建了社交网络舆情用户主题图谱系统模型,从而使得管控主体能够深入挖掘用户的潜在社群、有效地识别用户身份、准确地分析用户的情感倾向;同时,提出的生态性评价指标为社交网络舆情生态评价提供了可量化的评价标准,为社交网络舆情的科学管理提供了有效的理论支撑。在舆情的具体实践中,能够指导管控主体从社群、用户、情感三个层面入手,制定相应的管控策略,指引社交网络平台的系统开发方向,保障社交网络舆情生态朝着健康的方向发展。
张家森[5](2021)在《支持远程驾驶的视频控制决策算法研究》文中进行了进一步梳理随着汽车制造业的不断发展,国内私家车拥有量快速增长,因此而导致的交通拥堵和出行安全问题日益严重,对智能交通系统的建立有着迫切的需求。近些年来,随着车联网技术不断发展,在汽车行业内引起了广泛关注,远程驾驶技术作为其中重要组成部分,它可以实时追踪车辆的行驶状态,并在情况紧急时,在远端控制中心及时对车辆进行接管,实现远程驾驶,防止危险出现,提高车辆安全行驶。由于汽车在道路上进行远程驾驶时,车辆终端通过网络实时回传的视频信息是远端控制中心进行远程驾驶的重要依据,车辆终端通常在众多不同制式的无线网络覆盖范围内行驶,这就要求汽车终端需要通过有效的网络间的切换和自适应调整视频传输的速率来保持视频图像的稳定回传。本文主要对车辆在车联网环境下进行远程驾驶时的无线网络切换问题和视频实时传输自适应调整码率问题进行研究,并提出相应的解决方案。针对车辆终端在车联网场景下进行网络切换时存在响应不及时和切换次数过多导致乒乓效应的问题,提出一种改进算法。本算法首先对待接入网络进行筛选处理,选取符合条件的网络,然后通过模糊层次分析法确定网络属性的权重,TOPSIS算法进行优先级排序,最后根据排序结果进行切换。仿真结果表明,本文算法具有较好的切换性能,且能够降低切换的频率,减少乒乓效应,提升车端网络系统的切换性能和稳定性。针对车端视频实时传输过程中,由于网络环境的变换,不能自适应的调整视频传输速率,出现延迟、拥塞的问题,改进了一种基于探测法的自适应码率调整方法。该算法将视频接收端反馈的网络评估参数作为对实时网络环境进行预测的依据,在原有的网络状态评估参数丢包率的基础上引入时延抖动作为新的评估参数,然后根据本文所改进的视频传输速率调整机制对网络状态的变化做出及时反应,使视频数据传输速率与网络信道实时匹配,测试结果表明,改进后的算法能够准确地调整视频传输速率,更好的满足车端视频数据传输要求。
周旭颖[6](2021)在《无线网络内容分发中基于经济学的资源协作及定价》文中认为随着无线通信技术的蓬勃发展和智能终端设备的大规模普及,无线网络的用户数量在近年急剧增加,导致网络流量呈爆炸式增长。与此同时,用户对无线网络提供的内容分发服务提出了越来越高的要求,如更低的服务时延和更新鲜的内容。以通信资源和缓存资源为例,无线通信系统中支持上述内容分发服务的网络资源是极为稀缺的。用户日益增长的内容需求导致的爆发式流量与受限的网络资源,己经成为阻碍当前无线通信发展的首要矛盾。一味采取硬件升级实现网络资源的扩容不仅给运营商带来巨大的开销并且难以追赶迅猛增长的无线服务需求。另一方面,内容分发业务已成为无线网络中主流业务,决定其用户体验的关键因素是服务质量。如何合理有效地利用当前网络中有限的资源为用户提供优质的内容服务,同时确保资源提供者的收益,是目前无线网络中最重要的研究方向之一。在网络运营侧,多元化的内容业务迅猛发展,促使新的运营模式产生。不断涌现的网络运营新角色会参与或影响网络资源的分配,从而影响用户的服务体验。首先,由于网络中个体往往属于不同的利益方,带有自私性并形成竞争关系;其次,资源分配过程中可能无法获取完整的网络状态或参与者信息,都会造成资源分配的不合理及低利用率。鉴于经济理论中拥有成熟理论研究背景的博弈论、拍卖理论和合同理论是解决具有竞争性现象的数学理论和方法,可以有效解决复杂的资源分配问题。本文基于相关经济学理论和方法,考虑用户请求驱动的内容分发,对无线网络中不同场景的资源协作和定价问题进行了研究。具体研究工作包括:1、通过设备到设备通信(Device-to-Device,D2D)技术支持节点间的资源协作完成内容分发。首先,设计适度的激励机制促进节点D2D中继完成内容分发,通过动态调节提供给中继节点的激励,实现系统效用最大化。基于委托-代理框架对中继节点激励问题进行建模,提出一种基于贪婪思想的激励设计算法,系统仅根据已知信息做出激励决策,并证明了该算法的最优性。仿真结果表明提出的动态激励机制可以实现更好的系统效用。其次,本文考虑节点间的内容合作缓存问题,合作节点通过D2D通信实现内容分发。采用博弈论中的联盟博弈进行建模,根据是否允许节点间的效用转让,是否可以忽略节点形成联盟的成本。分类讨论四种场景下节点形成联盟的结构及其稳定性,通过分析得出形成稳定大联盟的条件,并提出不存在稳定大联盟情况下的一种融合-分裂算法得到稳定的小联盟结构。仿真结果给出了不同场景下,节点参与联盟后的效用并分析不同场景对节点效用的影响。2、通过异质资源联合分配支持视频内容在用户端的平滑播放。针对视频流网络建立部分边缘缓存下的两跳视频传输模型,网络服务提供商(Network Service Provider,NSP)向视频流服务供应商(Video Streaming Service Provider,VSSP)提供包括缓存空间和传输带宽两种异质资源,提升视频播放的用户体验质量(Quality of Experience,QoE)。视频流队列具有随机的数据包到达和离开,均被建模成G/G/1队列,采用近似扩散的方法获得用户QoE的数值解。本文将异质资源联合优化问题建模为升价拍卖以获得异质资源的最优分配,基于VSSP估值的结构特征,提出的升价拍卖针对活跃用户做有限步升价最大化有限异质资源的社会效益,并确保VSSP在拍卖过程中反映出真实需求。仿真结果分析了资源总量和资源单位大小等系统参数对拍卖算法性能的影响,并表明本文提出的异质升价拍卖优于传统的同质拍卖。3、通过周期性更新边缘缓存内容支持用户对内容新鲜度的需求。考虑一种新的内容分发商业模式,NSP向内容供应商(Content Provider,CP)购买定期更新的内容并存于边缘缓存服务器,再将内容转售给用户。用户订阅费用由内容的新鲜度决定,即信息年龄(Age of Information,AoI)。NSP为了最大化有限缓存空间实现的效用并且保障用户对内容新鲜度的需求,根据CP提供的AoI和报价来确定合适的CP作为内容源。本文将NSP效用最大化问题分解为价格订阅子问题和内容购买子问题,使用斯坦伯格(Stackelberg)博弈和拍卖模型分别对两个子问题进行建模。在价格订阅子问题中,通过反向归纳推导出斯坦伯格博弈的均衡策略。在内容购买子问题中,本文根据两对关系之间(CP-NSP和CP-CP)是否存在信息不对称,提出四种场景下的内容购买问题并建模成相应的拍卖模型。为了确保拍卖的执行,根据AoI的特性设计了披露部分NSP信息的机制,并证明其不会带来NSP效用的损失。最后,通过仿真对比分析四种场景下NSP的效用,并研究参数对NSP及赢家CP效用的影响,结果表明CP间的自由竞争在一定条件下会提升NSP的效用。4、通过面向内容的边缘缓存更新支持用户对内容新鲜度和服务时延的需求。针对运营商拥有的内容分发平台,定期更新边缘缓存以满足用户对内容新鲜度的需求,同时考虑内容更新带来的服务时延对用户QoE的影响。本文设计一种基于合同理论的内容订阅定价机制,针对不同类型内容设计最优更新周期和订阅价格,实现内容平台效用最大化。本文首先推导出确保合同可行性的必要和充分条件,并给出包括更新周期和订阅费用在内的最佳合同结构。理论分析表明,重视内容AoI的用户可以获得更新鲜的内容,但需要承担大部分的更新成本。从运营商的角度,提供更新鲜的内容可以实现更大的效用,体现了考虑AoI进行定价的必要性。
曹方洲[7](2021)在《基于深度学习的动态手势识别方法研究》文中进行了进一步梳理人机交互一直被认为是一个活跃的研究领域,同时动态手势是人与人之间交流的一种自然形式,因此最适合应用于人机交互。动态手势存在着较高的自由度、外观差异性和时间维度差异性等问题,因此对动态手势进行识别具有一定的挑战性。传统的识别方法存在识别效果差、设备要求高的问题,所以课题研究基于深度学习的动态手势识别方法。通过对现有基于深度学习的动态手势识别方法的研究与分析,发现了该课题方向存在一些问题。首先,在深度学习方面,相对于二维卷积神经网络而言,三维卷积神经网络更适合于时空特征学习,进而提升动态手势的识别效果,但三维卷积神经网络存在着训练参数多、模型较大等问题,因此在动态手势识别方面,基于三维卷积神经网络的优化工作还有待进一步探究;其次,卷积神经网络框架搭建完成后,训练所得到的网络模型参数数量及模型大小通常是固定的,不能够根据实际需要对其进行动态的调整;最后,为了提高准确率,在网络训练过程中,对于各项参数的优化调整、网络中数据输入的形式与内容等实验探究还不够充分。针对以上问题,本文进行了相关研究与实验,主要内容如下:(1)三维卷积相对于二维卷积存在着计算量大、模型参数多的问题,为了在保持模型精度相当的情况下,在三维卷积过程中将标准卷积分解为深度卷积和逐点卷积,设计了基于3D深度可分离卷积网络用以手势识别;(2)为了优化网络模型,加快训练和识别速度,在基于3D深度可分离卷积网络的基础上,借鉴二维卷积神经网络中残差连接、组卷积及通道混洗的设计思想,结合3D手势识别网络搭建中提升模型识别效果、减小模型参数的具体要求,分别设计了基于3D深度可分离卷积残差连接网络和基于3D深度可分离组卷积及通道混洗网络用以手势识别;(3)为了对网络模型参数数量及模型大小实现动态化调整,引入网络宽度调整系数,通过在不同调整系数下,可视化分析网络模型训练过程中训练损失、训练精度及模型验证精度的变化情况,对平衡识别结果与计算复杂性进行了探索性工作。同时,通过实验探究了不同输入形式、输入内容对网络模型识别结果的影响;(4)使用Qt可视化界面设计库,开发了手势识别系统的人机交互界面,并介绍了交互界面的使用方法。
夏中[8](2021)在《基于对等网络的视频调度策略研究与实现》文中认为
潘晓容[9](2021)在《基于视频内容的动态摘要生成算法研究》文中进行了进一步梳理随着互联网上各种视频数据的爆发式增长,如何快速了解视频的主要内容,缩短浏览时长成为了一个亟待解决的问题。视频摘要通过提取视频中的重要帧或者片段,生成能代表原视频主要内容的短视频,可以给人们提供一种快速了解视频内容的方式,因此成为了目前的研究热点之一。本文基于对视频内容的分析来研究动态视频摘要生成算法,得到能够描述视频整体内容的摘要视频。将视频分为多个片段,估计所有视频帧的重要性从而衡量每个视频片段的重要程度,选出重要程度高的视频片段生成摘要是目前视频摘要算法的主流研究方向之一。在该方法的整个流程中,对视频帧重要性的定量评估是解决问题的关键。针对目前视频摘要算法特征提取过程中存在的仅提取视频帧图像特征,忽略了视频中运动信息的问题,本文通过计算视频相邻帧间光流信息得到光流图,采用三维卷积神经网络提取光流图特征引入运动信息,并构建双流特征融合模块有效融合光流特征和图像特征以更好的表征视频内容。进一步地,为了获取时序信息的同时考虑视频当前帧和其他帧之间的不同相关性,本文结合Bi-LSTM和自注意力机制进行视频帧重要性的估计,使视频模型能更准确地衡量视频内容的重要程度。视频摘要算法中对视频帧重要性估计时得到的帧间重要性得分差异较低,容易导致生成摘要时不能选到真正重要的视频内容。针对此问题,本文引入方差对帧间得分差异大小进行度量,在损失函数中加入包含帧间得分方差值的约束项,使摘要模型在对视频内容的重要程度进行估计时能够考虑到得分之间的区分性,增大得分差异,将重要的视频内容选到摘要中。最后在SumMe和TvSum两个标准数据集上进行了实验和分析,充分验证了本文算法的有效性。
周以舟[10](2021)在《基于卷积神经网络的视频表征学习》文中指出视频是对客观事物形象、生动的记录与描述,是直观而具体的信息传递与表达方式,同时,随着互联网时代的全面到来,视频信号也成为了人类最重要的信息载体之一。视频表征学习(Video Representation Learning)旨在通过数据驱动的机器学习算法,对原始视频进行表征提取,为相关下游任务提供至关重要的语义特征。近年来,随着深度学习概念的提出,基于深度卷积神经网络(Deep Convolutional Neural Network)的相关算法极大地提升了视觉数据的利用效率和模型性能,为许多拥有大量数据的应用场景的落地奠定了坚实的基础。然而,现有的深度模型设计以及学习算法在处理复杂的、具有时空(spatiotemporal)特性的视频信号时,仍然面临着效率低下、成本高昂、性能不足等严重问题。为了克服这些局限性,一方面,本文通过观察到自然视频信号的时空不对称性,即空域上包含的信息量要显着大于时域,创新性地提出了将这种时空不对称特性充分考虑在深度时空网络模型设计过程中,并基于规则或自适应地将深度卷积网络中的计算模块按需地、不均等地分配到视频信号的空域和时域部分,在降低计算量和优化难度的同时极大地提升了模型性能。进一步地,本文利用贝叶斯深度网络相关知识,理论上保证了基于数据分布的时空异构深度网络的有效性和泛化性,为领域内后续工作提供了坚实的理论保障以及全面的实验观测。另一方面,由于视频信号本身承载的信息量远大于图像,对其进行人工标注需要耗费更加高昂的成本。于是,本文从自监督学习角度出发,通过考虑视频信号内在的随机属性和时空可解耦特性,结合并拓展了变分推断相关理论,创新性地提出了高阶变分自编码器自监督训练框架和影子卷积操作,成功帮助深度时空模型在无人工标注环境下更高效地学习到通用的、有代表性的视频表征,并促使模型在多个下游任务上达到领域内最先进的水平。为了全面验证上述方案的有效性,本文使用了百万量级的视频数据,并在人类动作识别、视频多标签标注、视频检索和视频预测等多个任务上进行了性能比较与验证。在人类动作识别和视频检索任务上,本文提出的时空异构方案能够在若干数据集上取得最佳分类效果,时空解耦的自监督方案能够进一步提高性能,甚至可媲美监督学习得到的效果;在视频多标签标注任务上,本文的可学习融合方案可以显着提高标签的召回率和精度;在视频预测任务上,本文基于高阶变分自编码器成功地预测出自然视频的多重未来,表明其可以有效地捕捉到自然视频中的随机属性,帮助构建更为完备的视频表征。通过全面的实验验证和理论分析,本文所提出的时空不对称设计理念已经成为领域内关于深度时空卷积网络结构设计的共识之一、所提出的高阶变分自编码器和时空解耦自监督框架也成为视频自监督训练新范式,成功拓展了领域性能的边界,并为领域的发展提供了新的视角与思路。
二、视频网络与视频网络中涉及的相关技术(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、视频网络与视频网络中涉及的相关技术(论文提纲范文)
(1)面向实时视频流分析的边缘计算技术(论文提纲范文)
1 引言 |
1.1 相关调研和综述 |
1.2 本文贡献 |
2 背景介绍 |
2.1 视频分析流程 |
2.2 边缘计算架构 |
2.3 应用场景 |
2.3.1 安防监控 |
2.3.2 交通分析 |
2.3.3 增强现实 |
2.3.4 无人机搜救 |
2.3.5 可穿戴认知辅助 |
3 目标与挑战 |
3.1 关键指标 |
3.2 主要挑战 |
4 关键技术 |
4.1 终端设备层次 |
4.1.1 模型压缩 |
4.1.2 模型选择 |
4.1.3 本地缓存 |
4.1.4 视频帧过滤 |
4.1.5 小结 |
4.2 协作层次 |
4.2.1 任务卸载 |
4.2.2 网络协议 |
4.2.3 隐私保护 |
4.2.4 小结 |
4.3 边缘/云层次 |
4.3.1 查询优化 |
4.3.2 推理加速 |
4.3.3 边缘缓存 |
4.3.4 小结 |
5 Argus视频大数据智能分析平台 |
6 未来研究方向 |
6.1 终端设备层次:模型性能预测 |
6.2 协作层次:网络特性支持 |
6.3 边缘/云层次:模型持续学习 |
6.4 系统应用:通用测试平台 |
7 总结 |
(2)智能视频监控关键技术:行人再识别研究综述(论文提纲范文)
1 引言 |
2 研究背景 |
3 标准行人再识别 |
3.1 表征学习 |
3.1.1 图像特征学习 |
3.1.2 视频特征学习 |
3.2 度量学习 |
3.3 重排序优化 |
4 开放行人再识别 |
4.1 遮挡行人再识别 |
4.2 无监督行人再识别 |
4.3 半监督行人再识别 |
4.4 跨模态行人再识别 |
4.4.1 图像–视频行人再识别 |
4.4.2 文本–图像行人再识别 |
4.4.3 可见光–红外行人再识别 |
4.5 场景行人搜索 |
4.6 对抗鲁棒行人再识别 |
4.7 快速检索——哈希行人再识别 |
5 行人再识别常用数据集 |
6 行人再识别代表性方法比较 |
6.1 图像行人再识别代表性方法比较 |
6.2 视频行人再识别代表性方法比较 |
7 总结与展望 |
(3)边缘计算的物联网任务处理策略研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.3.1 联合优化新旧任务最优化系统收益 |
1.3.2 缓存增强的边缘计算资源分配研究 |
1.3.3 多MEC协作的边缘计算研究 |
1.4 文章结构 |
第二章 边缘计算与缓存相关技术 |
2.1 边缘计算技术 |
2.1.1 边缘计算发展与架构 |
2.1.2 边缘技术关键技术 |
2.1.3 边缘计算应用实例 |
2.2 边缘缓存技术 |
2.2.1 边缘缓存关键技术 |
2.2.2 边缘缓存性能评价指标 |
2.3 边缘计算成本分析 |
2.3.1 边缘计算时延成本分析 |
2.3.2 边缘计算能耗成本分析 |
2.3.3 基于权重的综合成本分析 |
2.4 本章小结 |
第三章 系统成本最小化的边缘计算任务优化 |
3.1 引言 |
3.2 系统模型 |
3.2.1 通信子模型描述 |
3.2.2 任务属性描述 |
3.2.3 系统成本建模 |
3.3 最小化成本的搜索优化算法 |
3.3.1 传统的鲸鱼优化算法(WOA) |
3.3.2 种群划分的鲸鱼优化算法(GDWOA) |
3.4 仿真分析与结论 |
3.4.1 仿真参数设置 |
3.4.2 基于鲸鱼算法搜索优化结果分析 |
3.5 本章小结 |
第四章 缓存增强的边缘计算任务优化 |
4.1 引言 |
4.2 系统模型 |
4.2.1 缓存增强MEC场景下的任务属性 |
4.2.2 缓存增强MEC的系统成本分析 |
4.3 收益最大化的缓存算法 |
4.3.1 基于贪婪思想的存储算法 |
4.3.2 基于背包问题的存储算法 |
4.4 缓存增强场景下的计算成本优化 |
4.5 仿真分析与结论 |
4.6 本章小结 |
第五章 多MEC协作的边缘计算卸载研究 |
5.1 引言 |
5.2 系统模型 |
5.2.1 多基站下的协作模型 |
5.2.2 协作场景下的系统成本分析 |
5.3 多基站文件缓存设计 |
5.3.1 多基站场景下协作缓存收益 |
5.3.2 文件丰富度改进的贪婪缓存方案设计 |
5.4 最小化成本的MEC协作优化算法 |
5.4.1 粒子群优化算法 |
5.4.2 多群粒子群算法设计 |
5.5 仿真与分析 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 工作内容总结 |
6.2 未来研究展望 |
参考文献 |
致谢 |
(4)社交网络舆情用户主题图谱构建及舆情引导策略研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与选题意义 |
1.1.1 研究背景 |
1.1.2 选题意义 |
1.2 国内外研究现状 |
1.2.1 国内外社交网络舆情研究现状 |
1.2.2 国内外网络舆情知识图谱研究现状 |
1.2.3 研究现状评述 |
1.3 研究内容与方法 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 研究对象 |
1.4 研究技术路线图 |
第2章 相关概念及理论基础 |
2.1 社交网络舆情的相关概念 |
2.1.1 社交网络舆情的内涵 |
2.1.2 社交网络舆情用户 |
2.1.3 社交网络舆情的特征 |
2.1.4 社交网络舆情演化过程 |
2.2 主题图谱的相关概念 |
2.2.1 知识图谱的内涵 |
2.2.2 主题图谱的内涵 |
2.2.3 主题模型的内涵 |
2.3 突发事件的相关概念 |
2.3.1 突发事件的内涵 |
2.3.2 突发事件的类型 |
2.3.3 突发事件的特征 |
2.4 信息生态的相关理论 |
2.4.1 信息生态的内涵 |
2.4.2 信息生态系统 |
2.4.3 信息生态因子 |
2.4.4 信息生态链 |
2.5 本章小结 |
第3章 社交网络舆情用户主题图谱系统模型 |
3.1 社交网络舆情用户主题图谱的信息生态要素 |
3.1.1 社交网络舆情用户主题图谱的环境要素 |
3.1.2 社交网络舆情用户主题图谱的主体要素 |
3.1.3 社交网络舆情用户主题图谱的客体要素 |
3.1.4 社交网络舆情用户主题图谱的技术要素 |
3.1.5 社交网络舆情用户主题图谱信息生态要素模型 |
3.2 社交网络舆情用户主题图谱构建 |
3.2.1 社交网络舆情用户主题图谱的实体识别 |
3.2.2 社交网络舆情用户主题图谱的属性抽取 |
3.2.3 社交网络舆情用户主题图谱的关系抽取 |
3.2.4 社交网络舆情用户主题图谱的模型 |
3.3 社交网络舆情用户主题图谱构成 |
3.3.1 社交网络舆情用户社群图谱 |
3.3.2 社交网络舆情用户身份图谱 |
3.3.3 社交网络舆情用户情感图谱 |
3.3.4 社交网络舆情生态性及评价 |
3.4 主题图谱系统模型构建 |
3.5 本章小结 |
第4章 社交网络舆情用户社群图谱构建及社群发现 |
4.1 社交网络舆情用户社群图谱问题的提出 |
4.2 社交网络舆情用户社群发现模型 |
4.2.1 LDA主题模型 |
4.2.2 相似度度量 |
4.3 社交网络舆情用户社群图谱模型构建 |
4.3.1 社交网络舆情用户社群图谱建模思想 |
4.3.2 基于LDA主题模型的社交网络舆情用户社群图谱模型 |
4.4 研究设计 |
4.4.1 数据来源 |
4.4.2 数据采集 |
4.4.3 数据处理 |
4.5 数据结果 |
4.5.1 确定最优主题数 |
4.5.2 计算JS散度 |
4.5.3 构建用户社群图谱 |
4.6 讨论分析 |
4.6.1 社交网络社群主题偏好分析 |
4.6.2 社交网络社群用户特征分析 |
4.6.3 社交网络社群意见领袖识别 |
4.7 本章小结 |
第5章 社交网络舆情用户身份图谱构建及身份识别 |
5.1 社交网络舆情用户身份图谱问题的提出 |
5.2 社交网络舆情用户身份识别模型 |
5.2.1 LDA语义特征挖掘 |
5.2.2 身份特征和传播特征构建 |
5.2.3 朴素贝叶斯分类器 |
5.3 社交网络舆情用户身份图谱模型构建 |
5.3.1 社交网络舆情用户身份图谱建模思想 |
5.3.2 基于LDA和朴素贝叶斯的用户身份图谱模型 |
5.4 研究设计 |
5.4.1 数据来源 |
5.4.2 数据采集 |
5.4.3 数据处理 |
5.4.4 舆情事件概况及周期划分 |
5.5 数据结果 |
5.5.1 用户关注主题划分 |
5.5.2 用户身份识别 |
5.5.3 构建用户身份图谱 |
5.6 讨论分析 |
5.6.1 社交网络舆情用户身份分类 |
5.6.2 社交网络舆情用户主题关注点比较 |
5.6.3 社交网络舆情用户关注点演化分析 |
5.7 本章小结 |
第6章 社交网络舆情用户情感图谱构建及情感演化 |
6.1 社交网络舆情用户情感图谱问题的提出 |
6.2 社交网络舆情用户情感分类模型 |
6.2.1 中文分词与词向量训练 |
6.2.2 卷积神经网络 |
6.3 社交网络舆情用户情感图谱构建模型 |
6.3.1 社交网络舆情用户情感图谱建模思想 |
6.3.2 基于字词向量的多尺度卷积神经网络的社交网络舆情用户情感图谱模型 |
6.4 研究设计 |
6.4.1 数据来源 |
6.4.2 数据处理 |
6.4.3 模型设置 |
6.4.4 文本向量训练与选择 |
6.4.5 整体架构与算法流程 |
6.5 基于卷积神经网络超参数确定及实验对比 |
6.5.1 卷积核尺寸 |
6.5.2 激活函数 |
6.5.3 Dropout随机失活率与迭代次数 |
6.5.4 实验结果对比 |
6.6 数据结果 |
6.6.1 情感分类结果 |
6.6.2 构建用户情感图谱 |
6.7 讨论分析 |
6.7.1 社交网络舆情用户内容特征分析 |
6.7.2 社交网络舆情用户情感分布分析 |
6.7.3 舆情用户的情感演化分析 |
6.8 本章小结 |
第7章 社交网络舆情生态性评价 |
7.1 社交网络舆情生态性评价问题的提出 |
7.2 评价指标体系构建 |
7.2.1 信息环境维度 |
7.2.2 信息人维度 |
7.2.3 信息维度 |
7.2.4 信息技术维度 |
7.3 评价方法及过程 |
7.4 实证分析 |
7.4.1 样本选择 |
7.4.2 评价过程 |
7.5 社交网络舆情生态性评价结果分析 |
7.5.1 一级指标得分情况分析 |
7.5.2 二级指标得分情况分析 |
7.6 本章小结 |
第8章 社交网络舆情引导策略 |
8.1 社交网络舆情引导问题的提出 |
8.1.1 社交网络舆情引导的重要性 |
8.1.2 社交网络舆情引导生态性挑战 |
8.1.3 社交网络舆情引导体系 |
8.2 社交网络舆情社群的引导策略 |
8.2.1 加强衍生话题的监测 |
8.2.2 完善社交网络舆情话题推送 |
8.2.3 重视网络社群服务的提升 |
8.3 社交网络舆情用户的引导策略 |
8.3.1 完善用户类型化管理 |
8.3.2 发挥主流媒体的作用 |
8.3.3 建立意见领袖的沟通机制 |
8.4 社交网络舆情情感的引导策略 |
8.4.1 社交网络内容精细化管理 |
8.4.2 重视舆情情感引导 |
8.4.3 完善舆情情感预警机制 |
8.5 本章小结 |
第9章 研究结论与展望 |
9.1 研究结论 |
9.2 研究创新点 |
9.3 研究局限及展望 |
参考文献 |
作者简介与研究成果 |
致谢 |
(5)支持远程驾驶的视频控制决策算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 车联网的国内外研究现状 |
1.3 远程驾驶技术及其关键技术研究现状 |
1.3.1 远程驾驶技术研究现状 |
1.3.2 网络切换技术的研究现状 |
1.3.3 视频码率自适应算法研究现状 |
1.4 主要研究内容及章节安排 |
1.4.1 主要研究内容 |
1.4.2 章节安排 |
第二章 远程驾驶中的视频控制决策相关技术 |
2.1 无线网络接入技术 |
2.1.1 WI-FI技术 |
2.1.2 LTE技术 |
2.2 垂直切换技术 |
2.2.1 垂直切换分类 |
2.2.2 垂直切换过程 |
2.2.3 垂直切换算法分析 |
2.2.4 模糊层次分析法和TOPSIS算法 |
2.3 视频实时传输的关键技术 |
2.3.1 压缩编解码技术 |
2.3.2 视频传输协议 |
2.3.3 网络拥塞 |
2.3.4 基于网络的拥塞调控策略 |
2.3.5 基于终端的速率调控策略 |
2.4 本章小结 |
第三章 基于车联网的多属性垂直切换算法研究 |
3.1 应用场景分析和传统算法分析 |
3.1.1 应用场景分析 |
3.1.2 传统算法分析 |
3.2 基于车联网的多属性垂直切换算法 |
3.2.1 预筛选 |
3.2.2 网络判决 |
3.3 实验仿真结果与算法性能分析 |
3.3.1 仿真模型搭建 |
3.3.2 算法性能指标 |
3.3.3 仿真实验结果与分析 |
3.4 本章小结 |
第四章 自适应视频码率控制算法研究 |
4.1 应用场景分析和传统算法分析 |
4.1.1 应用场景分析 |
4.1.2 传统算法分析 |
4.2 视频传输自适应码率算法的改进 |
4.2.1 基于探测的视频码率自适应调整方法 |
4.2.2 改进的视频传输自适应码率调整方法 |
4.3 实验环境和实验方案 |
4.3.1 实验环境 |
4.3.2 实验设备介绍 |
4.3.3 实验方案介绍 |
4.4 自适应传输性能测试及其对比分析 |
4.4.1 网络可用带宽突变状况下的性能测试 |
4.4.2 车辆移动状态下的性能测试 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 研究展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(6)无线网络内容分发中基于经济学的资源协作及定价(论文提纲范文)
致谢 |
摘要 |
Abstract |
缩写、符号清单、术语表 |
1 绪论 |
1.1 研究背景 |
1.1.1 未来无线网络发展趋势 |
1.1.2 无线网络中的内容分发 |
1.1.3 无线网络运营模式的发展趋势 |
1.2 研究意义 |
1.3 经济学理论基础 |
1.3.1 博弈理论 |
1.3.2 拍卖理论 |
1.3.3 合同理论 |
1.4 内容分发中资源协作及定价相关研究现状 |
1.5 主要研究内容 |
1.6 论文主要贡献与创新点 |
1.7 论文组织结构 |
2 无线网络中针对节点资源协作的激励机制设计 |
2.1 D2D中继节点协作传输机制 |
2.1.1 系统模型 |
2.1.2 面向D2D中继的委托-代理MDP框架 |
2.1.3 委托-代理MDP模型的最优贪婪解 |
2.1.4 仿真结果 |
2.2 异构节点的协作缓存机制 |
2.2.1 系统模型 |
2.2.2 基于联盟博弈的问题建模 |
2.2.3 效用可转移的缓存合作问题 |
2.2.4 效用不可转移的缓存合作问题 |
2.2.5 仿真结果 |
2.3 本章小结 |
3 视频流中的异质资源联合分配与定价 |
3.1 系统模型 |
3.2 部分缓存视频流的QoE推导 |
3.3 异质资源联合分配及定价求解 |
3.4 仿真结果 |
3.5 本章小结 |
4 基于新鲜度的内容转售定价机制 |
4.1 系统模型 |
4.1.1 效用模型 |
4.1.2 构建问题 |
4.2 基于Stackelberg博弈的订阅价格问题 |
4.3 基于拍卖的内容购买问题 |
4.3.1 AoI拍卖中NSP的收益披露 |
4.3.2 相关概念 |
4.3.3 场景1:完整信息下的第一/第二价拍卖 |
4.3.4 场景2:不完整信息下的第一/第二价拍卖 |
4.3.5 场景3/4:完整/不完整信息下的反向Myerson拍卖 |
4.3.6 扩展到多CP的场景 |
4.4 仿真结果 |
4.5 本章小结 |
5 基于新鲜度和时延的内容定价机制 |
5.1 系统模型 |
5.1.1 视频用户QoE |
5.1.2 平台与用户效用 |
5.2 可行合同设计 |
5.2.1 合同约束 |
5.2.2 合同可行性的必要条件 |
5.2.3 合同可行性的充分条件 |
5.3 合同的最优结构 |
5.4 仿真结果 |
5.5 本章小结 |
6 总结与展望 |
6.1 本文总结 |
6.2 下一步工作展望 |
参考文献 |
攻读学位期间的学术论文及研究成果 |
(7)基于深度学习的动态手势识别方法研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题的研究背景及意义 |
1.1.1 手势识别的现有技术 |
1.1.2 手势的分类与表示 |
1.2 课题的研究现状 |
1.2.1 基于视觉的手势识别技术 |
1.2.2 基于深度学习的视觉手势识别 |
1.2.3 基于视觉的手势识别数据集 |
1.3 课题研究内容与结构安排 |
2 基于3D深度可分离卷积的手势识别方法 |
2.1 3D卷积神经网络 |
2.1.1 2D卷积运算 |
2.1.2 3D卷积运算 |
2.2 基于3D深度可分离卷积网络的手势识别 |
2.2.1 深度可分离卷积 |
2.2.2 基于3D深度可分离卷积的手势识别网络设计 |
2.2.3 数据集预处理 |
2.2.4 网络训练及实验结果与分析 |
2.3 本章小节 |
3 基于残差连接及通道混洗的手势识别方法研究 |
3.1 基于3D深度可分离卷积残差连接网络的手势识别 |
3.1.1 线性瓶颈 |
3.1.2 残差连接 |
3.1.3 基于3D深度可分离卷积残差连接的手势识别网络设计 |
3.1.4 网络训练及实验结果与分析 |
3.2 基于3D深度可分离组卷积及通道混洗网络的手势识别 |
3.2.1 组卷积 |
3.2.2 用于组卷积的通道混洗 |
3.2.3 基于3D深度可分离组卷积及通道混洗的手势识别网络设计 |
3.2.4 网络训练及实验结果 |
3.3 本章小结 |
4 系统开发平台与实现 |
4.1 开发平台 |
4.2 界面开发 |
4.3 识别系统介绍 |
4.4 本章小结 |
5 实验结果与分析 |
5.1 Ego Gesture手势数据集介绍 |
5.2 实验结果分析 |
5.3 本章小结 |
6 总结与展望 |
6.1 主要工作总结 |
6.2 存在的问题及对未来的展望 |
致谢 |
参考文献 |
攻读学位期间主要研究成果 |
(9)基于视频内容的动态摘要生成算法研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 视频摘要算法的研究现状 |
1.2.1 无监督的视频摘要 |
1.2.2 监督学习的视频摘要 |
1.3 研究难点及本文工作 |
1.4 论文的章节安排 |
2 视频摘要相关理论 |
2.1 视频数据结构及摘要表现形式 |
2.1.1 视频数据结构 |
2.1.2 视频摘要表现形式 |
2.2 卷积神经网络与循环神经网络 |
2.2.1 卷积神经网络 |
2.2.2 循环神经网络 |
2.3 动态视频摘要结构 |
2.3.1 图像特征提取 |
2.3.2 视频片段分割 |
2.4 数据集及性能评价标准 |
2.5 本章小结 |
3 特征增强的视频摘要模型 |
3.1 双流特征融合网络 |
3.1.1 光流特征提取 |
3.1.2 双流特征融合网络 |
3.2 增强序列特征的视频摘要模型 |
3.2.1 Bi-LSTM结构及自注意力机制 |
3.2.2 结合Bi-LSTM和 Self-Attention的得分回归网络 |
3.2.3 视频摘要生成 |
3.3 实验结果与分析 |
3.3.1 实验设置 |
3.3.2 实验结果 |
3.4 本章小结 |
4 加强重要性得分差异的视频摘要模型 |
4.1 问题的提出 |
4.2 得分差异约束项 |
4.2.1 得分差异的度量 |
4.2.2 全局得分差异项 |
4.2.3 分段得分差异项 |
4.3 加入得分差异约束的视频摘要模型 |
4.4 实验结果与分析 |
4.4.1 实验参数 |
4.4.2 全局得分差异对摘要结果的影响 |
4.4.3 分段得分差异对摘要结果的影响 |
4.4.4 加强得分差异前后测试指标对比 |
4.4.5 主流方法对比 |
4.5 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
攻读学位期间主要研究成果 |
(10)基于卷积神经网络的视频表征学习(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 选题的背景和意义 |
1.2 国内外研究现状 |
1.2.1 视频表征学习中的深度网络结构研究现状 |
1.2.2 视频表征学习中的自监督学习 |
1.3 研究内容及主要贡献 |
1.3.1 混合二维/三维卷积通道 |
1.3.2 概率视角分析时空融合 |
1.3.3 可学习池化 |
1.3.4 基于随机视频预测的自监督学习 |
1.3.5 基于时空解耦的自监督学习 |
1.4 本文的组织结构 |
第2章 视频表征学习中的深度学习背景介绍 |
2.1 卷积神经网络 |
2.1.1 基础概念 |
2.1.2 重要组成部分 |
2.1.3 深度卷积神经网络 |
2.1.4 神经网络结构搜索 |
2.2 视频表征学习中的深度时空卷积网络 |
2.2.1 基于时空交互的设计 |
2.2.2 基于卷积分解的设计 |
2.2.3 基于关系推理的设计 |
2.2.4 基于网络搜索的设计 |
第3章 基于混合卷积通道的时空网络结构设计 |
3.1 背景介绍 |
3.2 混合卷积通道和混合卷积通道网络 |
3.2.1 三维卷积 |
3.2.2 混合卷积通道:MiCT |
3.2.3 深度混合卷积通道网络:MiCT-Net |
3.3 在人类行为识别任务上的验证 |
3.3.1 实验设置 |
3.3.2 与传统三维卷积神经网络的对比 |
3.3.3 与最先进的三维卷积神经网络方案对比 |
3.4 讨论 |
3.4.1 可视化 |
3.4.2 总结 |
第4章 基于数据分布的自适应时空网络结构设计 |
4.1 背景介绍 |
4.2 算法 |
4.2.1 概率空间构造 |
4.2.2 通过Variational DropPath进行概率空间嵌入 |
4.2.3 概率视角下的自适应时空融合策略 |
4.3 理论证明 |
4.3.1 对公式4.5的证明 |
4.3.2 对公式4.7的证明 |
4.4 在人类行为识别任务上的应用 |
4.4.1 实验设置 |
4.4.2 实验结果 |
4.5 在第一人称动作识别任务上的应用 |
4.5.1 实验设置 |
4.5.2 实验结果 |
4.6 基于概率空间的观察 |
4.7 泛化性 |
4.8 讨论和拓展 |
第5章 基于可学习池化操作的时空网络结构设计 |
5.1 背景介绍 |
5.2 算法 |
5.2.1 MIL网络框架结构 |
5.2.2 可学习池化操作 |
5.2.3 包+实例损失函数 |
5.3 在网络视频多标签标注任务上的应用 |
5.3.1 实验设置 |
5.3.2 实验结果 |
5.3.3 分析 |
5.4 讨论和拓展 |
第6章 视频表征学习中的自监督学习 |
6.1 基于自然视频多未来预测的自监督学习 |
6.1.1 引言 |
6.1.2 背景介绍 |
6.1.3 算法 |
6.1.4 理论证明 |
6.1.5 在数字序列预测任务上的验证 |
6.1.6 在真实自然视频预测任务上的应用 |
6.1.7 可视化 |
6.1.8 讨论和拓展 |
6.2 基于时空解耦的自监督学习 |
6.2.1 引言 |
6.2.2 算法 |
6.2.3 实验 |
6.2.4 讨论和拓展 |
第7章 总结与展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
四、视频网络与视频网络中涉及的相关技术(论文参考文献)
- [1]面向实时视频流分析的边缘计算技术[J]. 杨铮,贺骁武,吴家行,王需,赵毅. 中国科学:信息科学, 2022(01)
- [2]智能视频监控关键技术:行人再识别研究综述[J]. 赵才荣,齐鼎,窦曙光,涂远鹏,孙添力,柏松,蒋忻洋,白翔,苗夺谦. 中国科学:信息科学, 2021
- [3]边缘计算的物联网任务处理策略研究[D]. 唐宁. 北京邮电大学, 2021(01)
- [4]社交网络舆情用户主题图谱构建及舆情引导策略研究[D]. 张柳. 吉林大学, 2021(01)
- [5]支持远程驾驶的视频控制决策算法研究[D]. 张家森. 北方工业大学, 2021(01)
- [6]无线网络内容分发中基于经济学的资源协作及定价[D]. 周旭颖. 浙江大学, 2021(01)
- [7]基于深度学习的动态手势识别方法研究[D]. 曹方洲. 西安理工大学, 2021(01)
- [8]基于对等网络的视频调度策略研究与实现[D]. 夏中. 重庆邮电大学, 2021
- [9]基于视频内容的动态摘要生成算法研究[D]. 潘晓容. 西安理工大学, 2021(01)
- [10]基于卷积神经网络的视频表征学习[D]. 周以舟. 中国科学技术大学, 2021(09)