一个视频网站数据统计系统的设计与实现

一个视频网站数据统计系统的设计与实现

论文摘要

网站的运营过程中,需要及时了解自身运营状况,结合运营状况调整营销策略和战略方针。而认识网站当前状态的最有效途径,便是数据,网站访问次数、访问人数、访问IP数,逗留时长等等都是很好的指导性指标。视频网站的运营亦是如此,相对于其他类型网站而言,视频网站需要更多其他定制的指标来指导。当前网络环境下存在多家第三方统计机构或工具,如艾瑞、Comscore、GA等。这些第三方统计机构能提供最基本、较笼统的数据,但对于高层决策者来说,这些还远远不够,他们需要的是有自身特色的、最好是可定制的指标,这些第三方机构或工具提供的数据过于普遍化,过于通用化。此外第三方统计数据存在较大的时延性(一般延迟1到2个月)问题。本文介绍了一种由网站运营商自身进行数据统计和分析的解决方案。由网站运营公司技术部门以网站运营日志为最初数据源,基于公司高层业务需求,将数据经过层层数据清洗、转换和抽取,建立数据仓库,基于数据仓库进行数据分析和挖掘工作。该方案工作主线为基于分析主题,采用星型模型进行数据仓库多维建模。数据仓库架构建立后,以数据仓库结构为目标对日志源进行ETL, ETL过程基于Hadoop分布式计算框架,摒弃日志文件中的多余信息,将需要的数据抽取、计算,并装载入Hive数据仓库。随后基于Hive数据仓库及其提供的数据查询工具HQL,在Oozie工作流控制工具的控制下完成数据的分析和进一步抽取工作,分析结果存入OLTP数据库,并最终以报表、图形等方式对分析结果进行展示。由于该系统由网站运营商自身开发,能较完善地解决上述问题。本文介绍的解决方案,已得到内部的广泛使用,成为公司高层了解公司运营状况的最直接、最及时工具。此外,基于我们构建的数据仓库开发的推荐系统、搜索系统、风云榜系统已为全站带来视频播放次数至少达5000万/天。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 图目录
  • 表目录
  • 第一章 绪论
  • 1.1 工作背景
  • 1.2 国内外相关解决方案
  • 1.3 技术路线
  • 1.4 主要工作及论文结构
  • 第二章 相关技术
  • 2.1 Hadoop
  • 2.2 HDFS
  • 2.3 MapReduce
  • 2.4 Hive
  • 2.5 Oozie
  • 第三章 一个视频网站数据统计系统的设计
  • 3.1 需求分析
  • 3.1.1 指标定义
  • 3.1.2 功能需求概述
  • 3.2 架构设计
  • 3.3 数据存储层设计
  • 3.3.1 日志源介绍
  • 3.3.2 数据仓库设计
  • 3.4 数据分析模块设计
  • 3.4.1 架构设计
  • 3.4.2 详细设计
  • 3.5 数据展现模块设计
  • 3.6 本章小结
  • 第四章 一个视频网站数据统计系统的实现
  • 4.1 数据仓库构建
  • 4.2 数据分析模块实现
  • 4.3 数据展现模块实现
  • 第五章 总结和展望
  • 5.1 论文小结
  • 5.2 工作展望
  • 参考文献
  • 致谢
  • 附录
  • PingBack发送字段列表'>附表1 VideoPingBack发送字段列表
  • 附表2 客户端PingBack类型
  • page字段说明'>附表3 basepage字段说明
  • video字段说明'>附表4 basevideo字段说明
  • 相关论文文献

    • [1].中小企业电子商务网站运营模式的创新研究[J]. 营销界 2020(26)
    • [2].任天堂诉美国网站索赔110亿日元[J]. 中外玩具制造 2018(08)
    • [3].数据挖掘与网站运营管理[J]. 信息与电脑(理论版) 2015(05)
    • [4].网络技术在图书馆网站运营中的运用[J]. 电子技术与软件工程 2016(20)
    • [5].重新理解网站运营[J]. 互联网周刊 2008(09)
    • [6].网站运营存在的21条问题[J]. 计算机与网络 2017(11)
    • [7].网站运营如何关注你的对手[J]. 计算机与网络 2014(Z1)
    • [8].六大准则玩顺网站运营[J]. 报林 2009(09)
    • [9].农展馆农产品电子商务网站运营模式分析[J]. 南方农机 2015(02)
    • [10].网站运营管理中的网络广告问题思考[J]. 长江丛刊 2020(05)
    • [11].浅谈企业网站运营维护[J]. 计算机光盘软件与应用 2013(13)
    • [12].Web2.0时代标准化网站运营模式发展趋势分析[J]. 科技资讯 2014(20)
    • [13].SEO及其在网站运营的应用探析[J]. 信息与电脑(理论版) 2014(24)
    • [14].赖静平:让老外迷上中国IP网文[J]. 当代工人(C版) 2017(05)
    • [15].企业网站运营维护的有效路径探析[J]. 电子技术与软件工程 2013(17)
    • [16].浅论网站运营中网络编辑的网站流量策划之策略[J]. 长春教育学院学报 2013(15)
    • [17].数据挖掘与分析在网站运营管理中的应用[J]. 企业改革与管理 2018(19)
    • [18].实体市场支撑的B2B网站运营[J]. 中国市场 2008(30)
    • [19].医院门户网站运营管理策略[J]. 当代医学 2015(07)
    • [20].基于供应链管理的葡萄酒业网站运营模式研究[J]. 科技创新导报 2013(31)
    • [21].再生资源网站运营模式评价模型[J]. 经营与管理 2013(05)
    • [22].国内视频网站运营模式初探[J]. 科技创新导报 2009(30)
    • [23].医学信息服务网站运营中的法律与伦理问题[J]. 医学信息学杂志 2010(08)
    • [24].商业网站运营谈[J]. 考试周刊 2009(34)
    • [25].我国视频网站运营困局破解[J]. 新闻传播 2010(01)
    • [26].电子商务网站运营体会与思考[J]. 现代经济信息 2018(06)
    • [27].基于模糊综合评价的电子商务网站运营状况分析[J]. 市场周刊(理论研究) 2008(06)
    • [28].一览业问网前期SEO分析研究[J]. 东方企业文化 2014(09)
    • [29].政府网站运营的PPP模式探析[J]. 河北省社会主义学院学报 2013(02)
    • [30].我国农业网站运营中的问题及其对策[J]. 农业网络信息 2011(04)

    标签:;  ;  ;  

    一个视频网站数据统计系统的设计与实现
    下载Doc文档

    猜你喜欢