视频社区中海量数据管理方法研究

视频社区中海量数据管理方法研究

论文摘要

伴随互联网的不断发展,网络信息的爆炸式增长及个人用户所能获取带宽的不断增加,网络视频内容已经逐步成为互联网上最为丰富且最为庞大的信息群体。同时,随着Web2.0概念的不断深入人心,视频社区成为互联网上视频发布、分享与交流的最大平台。资源的不断丰富就使得如何对这些资源进行有效的管理成为日益受到关注的问题之一。对互联网上视频内容进行管理,可以大致归纳为处理三个实体间相互关系的若干个问题。这三个实体分别是视频服务提供商、互联网用户及第三方监管部门。视频服务提供商为了便于自身网站的结构组织及用户的快速查找,需要寻找海量数据的有效组织方法;以用户为中心的Web2.0式的网络浏览方式为网站的维护者提出了更高的要求,个性化的视频推荐机制成为网站成功不可或缺的必要组成部分;此外,由于用户的行为不可能得到绝对的控制,第三方监管部门会要求视频服务提供商对用户上传的视频进行版权的检查,删除违反版权法律的视频以维护原作者的权益。而新鲜的网络视频社区环境,正为研究者解决以上问题提出了新的挑战与机遇。针对以上描述的问题,本文重点研究了在视频社区环境当中,如何利用视频间、用户间以及视频内部本身的信息,对前面提出的问题进行有效的解答。具体来说,论文主要研究内容和创新成果如下:1.提出一种能够利用视频网站结构信息,并立足于网络视频本身周围的文字信息、进行视频主题发现的算法。首先,针对视频网站上文本信息质量很低的情况,本文根据视频网站对每一个视频提供的相似视频的元数据,对目标视频进行文本信息增强。其次,在对文本信息图进行分割聚类从而发现视频主题的结果上,通过其指导重新定义原始的视频文本信息图,迭代地得到更加准确的主题发现结果。最后,利用视频网站中提供的视频对视频回复关系的结构图,依据“两个具有回复关系的视频应具有主题上的部分一致性”的假设,对己有主题发现结果进行优化。实验结果表明,本文提出的算法较之前该领域内的算法,在主题发现的准确度上有较大提升,同时,较之常用的隐主题模型方法,在发现大规模数据中小粒度主题这一问题上,能够节省大量的计算时间。2.提出一种基于用户情感分析及用户间社交关系的个性化视频推荐算法。首先为有效快速地实现对重复上传的视频的检测,提出了层次化的基于全局特征的重复视频检测算法。其次,根据已有的通过使用有上下文帮助的基于字典的情感判断模型,将用户对于某个视频的回复信息,量化成为用户对某个视频段集合的打分信息、。最后,提出使用用户的社交关系对推荐给特定用户的特定视频集合结果进行二次挑选的策略。在我们的实验数据集上,这个算法框架可以取得明显的性能提升。3.提出一种新的关于仿制视频的问题,同时提出一种能够对其进行有效描述的模型,并将其应用在一个新的仿制视频检索的系统框架里。首先,对仿制视频本身做出了较为准确的定义,提出了检测搜索仿制视频的问题。其次,针对仿制视频本身具有的特点,将仿制视频段落用一个以动作词集合为基础的时间序列模型进行表述。并在这一视频段落描述模型的基础上,设计了专为其使用的视频相似度计算方法:最大相似特征包度量。最后,使用视频上下文信息,对仿制视频检索系统进行了性能优化。通过在特意挑选的、覆盖大部分情况的7个主题的仿制视频构成的数据集上进行的实验表明,本文提出的模型及系统能够正确的对仿制视频本身进行描述,并有效的完成仿制视频检索的任务。论文的最后,在总结全文工作及贡献的基础上,对未来的研究工作提出了展望。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 图目录
  • 表目录
  • 第1章 绪论
  • 1.1 互联网视频社区网站发展历史与现状
  • 1.2 互联网视频管理中存在的矛盾与问题
  • 1.2.1 视频数量与用户查找之间的矛盾
  • 1.2.2 用户个性与通用检索之间的矛盾
  • 1.2.3 版权保护的问题
  • 1.3 论文主要内容和结构安排
  • 第2章 视频社区数据管理基础与现状
  • 2.1 海量数据组织方法
  • 2.1.1 基于分类结构的方法
  • 2.1.2 基于搜索引擎的方法
  • 2.1.3 基于主题检测的方法
  • 2.2 个性化推荐算法
  • 2.2.1 基于记忆的推荐算法
  • 2.2.2 基于模型的推荐算法
  • 2.2.3 其它常用推荐算法
  • 2.3 视频版权保护方法
  • 2.3.1 数字版权保护
  • 2.3.2 基于内容的视频版权保护方法
  • 第3章 基于网站结构信息的视频主题发现算法
  • 3.1 引言
  • 3.1.1 研究动机
  • 3.1.2 挑战与契机
  • 3.1.3 研究内容
  • 3.2 针对网络视频的主题发现
  • 3.3 双链接双优化的网络视频主题发现算法
  • 3.3.1 文本信息的丰富方法
  • 3.3.2 主题抽取及聚类
  • 3.3.3 聚类修正
  • 3.3.4 视频主题表达
  • 3.4 视频主题发现算法评价
  • 3.4.1 实验数据集
  • 3.4.2 文本增强效果评价
  • 3.4.3 主题发现
  • 3.4.4 聚类优化
  • 3.5 本章小结
  • 第4章 基于情感和社会关系的视频个性化推荐
  • 4.1 引言
  • 4.2 本章相关工作
  • 4.2.1 视频个性化推荐系统
  • 4.2.2 基于文本的情感分析
  • 4.3 基于情感和社会关系的视频个性化推荐系统详述
  • 4.3.1 系统框架
  • 4.3.2 基于层次化策略的相同视频聚合
  • 4.3.3 用户情感量化
  • 4.3.4 社会关系约束下的个性化推荐
  • 4.4 个性化推荐系统的性能分析
  • 4.4.1 视频数据集
  • 4.4.2 性能指标
  • 4.4.3 系统性能实验方案及结果
  • 4.4.4 情感量化实验方案及结果
  • 4.5 本章小结
  • 第5章 基于运动词模型的仿制视频检索
  • 5.1 引言
  • 5.2 什么是仿制视频
  • 5.2.1 仿制视频的定义
  • 5.2.2 仿制视频的分类
  • 5.3 本章相关工作
  • 5.3.1 视频中运动的表征
  • 5.3.2 上下文信息辅助的视频表达
  • 5.3.3 视频相似度匹配
  • 5.4 仿制视频检索系统框架
  • 5.5 基于运动词的视频段落表达
  • 5.5.1 运动词模型
  • 5.5.2 静态局部特征
  • 5.5.3 查询视频处理
  • 5.6 基于运动词的视频段落匹配
  • 5.6.1 最大相似特征包度量
  • 5.6.2 带上下文约束的系统集成
  • 5.7 仿制视频检索模型的评价
  • 5.7.1 数据集描述
  • 5.7.2 系统运行状况
  • 5.8 本章小结
  • 第6章 总结与展望
  • 6.1 工作总结
  • 6.2 未来展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文与取得的其它研究成果
  • 攻读学位期间参与项目及主要工作
  • 相关论文文献

    • [1].2019年我国短视频发展十大态势[J]. 新闻与写作 2019(12)
    • [2].短视频行业发展分析报告[J]. 中国商论 2019(23)
    • [3].短视频平台的盈利模式及发展趋势分析[J]. 海峡科技与产业 2019(06)
    • [4].短视频对中职学生的心理负效应及对策研究[J]. 西部学刊 2019(23)
    • [5].融合背景下的短视频发展状况及趋势[J]. 新闻传播 2019(20)
    • [6].论短视频对传统媒体转型的促进作用[J]. 中国报业 2019(24)
    • [7].短视频平台崛起下传统视频平台的优势及应对措施[J]. 卫星电视与宽带多媒体 2019(23)
    • [8].对抖音短视频内容生产异化的冷思考[J]. 采写编 2019(06)
    • [9].短视频《致敬》[J]. 当代广西 2020(04)
    • [10].5G时代催生短视频与长视频“双引擎”发展新思路[J]. 中国广播 2020(02)
    • [11].从横屏到竖屏:短视频形态演进的人性化趋势及特征探析[J]. 新媒体研究 2020(01)
    • [12].新闻短视频的基本要素和制作要点[J]. 新闻与写作 2020(01)
    • [13].基于4P理论的短视频电商变现研究——以李子柒为例[J]. 新闻研究导刊 2020(01)
    • [14].移动短视频发展的困境与对策探讨[J]. 新闻研究导刊 2020(01)
    • [15].从用户生产到专业生产——2019年中国短视频发展盘点[J]. 现代视听 2020(01)
    • [16].5G时代短视频的融合发展与创新策略探究[J]. 电声技术 2019(12)
    • [17].抖音VS快手 谁更胜一筹?[J]. 中国品牌 2020(02)
    • [18].动画短视频的新发展分析[J]. 西部广播电视 2020(03)
    • [19].桂戏歌《盼您平安把家还》[J]. 当代广西 2020(05)
    • [20].短视频《战疫·英雄无畏》[J]. 当代广西 2020(05)
    • [21].短视频《一切都会好起来的》[J]. 当代广西 2020(05)
    • [22].李子柒爆款短视频的特点分析及思考[J]. 西部广播电视 2020(03)
    • [23].移动短视频的国内外研究述评[J]. 中国市场 2020(09)
    • [24].短视频平台与电商深入结合的商业模式分析[J]. 营销界 2019(52)
    • [25].视频新模式应用前景探析[J]. 花炮科技与市场 2020(01)
    • [26].短视频“热呈现”引发内容危机探析[J]. 新闻潮 2020(02)
    • [27].社交与表演:网络短视频的悖论与选择[J]. 新闻与写作 2020(05)
    • [28].梨视频的内容生产模式探析[J]. 新闻世界 2020(04)
    • [29].5G时代短视频发展的机遇和挑战[J]. 东南传播 2020(03)
    • [30].我的战“疫”日记[J]. 中国税务 2020(04)

    标签:;  ;  ;  ;  ;  

    视频社区中海量数据管理方法研究
    下载Doc文档

    猜你喜欢