基于中日韩的多国语言编码系统的研究与实现

基于中日韩的多国语言编码系统的研究与实现

论文摘要

目前计算机取证的重点主要集中在简体中文操作系统中。随着国际交流的加强和我国改革开放的深入,以及涉及外国人的计算机案件量的不断增加。各省各地市缺乏精确高效的多语言后处理手段,使得涉及多语言的电子数据后处理工作诸多不便。当遇到此类案件的时候,往往让调查人员花费大量的时间。同时由于各自使用的手段方法不统一,也难于将各自的应用技术或方法推广与普及。本文研究的系统正是针对上面的一些问题,指出国内的信息分析系统和取证系统的不足,对中、日、韩三国的计算机常用编码规则进行深入分析与研究。通过给出取证搜索关键字在计算机中的可能的16进制编码的方式,让调查人员可以利用标准的计算机取证软件对16进制编码进行关键字搜索,从而实现案件线索的快速定位。为取证工作简化工作模式,在提高现有的工作质量前提下提高工作效率。本文首先阐述了基于中日韩的多国语言编码系统的重要意义,介绍了国内外计算机取证调查分析的现状;接着,详细研究了中日韩三国所涉及到的各种编码;然后,对这些编码的内容、特点、编码/解码原理及方法进行了深入的分析:本文以Unicode为核心编码,深入研究了中文的GB2312、BIG5、GBK等,日文的JIS、SHIFTJIS、EUC-JP等,韩文的EUC-KR等本地编码规则,以及写字板的rtf,邮件的base64与QP编码,UTF-8等二次编码规则和Unicode编码,本系统支持直接批量导出为重要取证软件EnCase的关键字搜索脚本:然后,介绍了系统设计、运行环境、和具体实现的基本情况等;最后,对本系统的研究开发情况进行了总结,并就开发中的不足之处提出了下一步的努力方向。经过测试,本文研究的基于中日韩的多国语言编码系统能有效的提高取证人员的工作效率,扩大取证搜索的范围,为有力打击计算机犯罪活动提供了很好的应用工具。本系统还可用于纠正乱码,增强国际信息交流等多方面。同时该系统得到了很好的推广应用,具有较高的社会意义和实用价值。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究现状
  • 1.2.1 计算机取证
  • 1.2.2 电子证据的收集
  • 1.2.3 取证软件EnCase
  • 1.3 系统目标与意义
  • 1.4 本文研究内容与组织
  • 第二章 中日韩三国编码使用情况汇总
  • 2.1 中日韩三国在Windows平台下常用字符编码
  • 2.2 各国存在的文字处理软件及其使用的字符编码
  • 2.2.1 Microsoft Word文档
  • 2.2.2 金山WPS文字
  • 2.2.3 写字板
  • 2.2.4 记事本
  • 2.3 各国字符在网页中的常用编码
  • 2.4 邮件中常使用的编码及各国常用的邮件客户端
  • 2.5 本章小结
  • 第三章 中日韩三国各种编码研究
  • 3.1 编码基础知识
  • 3.1.1 基本概念
  • 3.1.2 西文字符的表示
  • 3.1.3 ASCⅡ字符集
  • 3.2 汉字字符的表示
  • 3.2.1 汉字编码国家标准
  • 3.2.2 GB2312字符集
  • 3.2.3 GBK字符集
  • 3.2.4 中国台湾定义的汉字字符集
  • 3.2.5 BIG5字符集
  • 3.2.6 GB18030字符集
  • 3.2.7 简繁转换
  • 3.3 日韩编码及转换
  • 3.3.1 日文多字节编码
  • 3.3.2 日文编码转换
  • 3.3.3 韩文编码
  • 3.4 半\全角转换
  • 3.5 二次编码
  • 3.5.1 WPS的旧版本
  • 3.5.2 WPS的新版本
  • 3.5.3 写字板RTF编码
  • 3.5.4 邮件编码
  • 3.6 本章小结
  • 第四章 Unicode及其转换
  • 4.1 Unicode
  • 4.1.1 Unicode定义
  • 4.1.2 Unicode和IS010646
  • 4.1.3 组合字符
  • 4.1.4 UCS实现级别
  • 4.2 显示中日韩三国语言
  • 4.2.1 代码页
  • 4.2.2 SBCS、DBCS和MBCS
  • 4.2.3 显示中日韩三国字符
  • 4.3 UTF-8
  • 4.3.1 UTF-8的由来
  • 4.3.2 UTF-8的特性
  • 4.4 Unicode与UTF-8之间的相互转换算法与代码
  • 4.4.1 Unicode转换为UTF-8的算法及代码
  • 4.4.2 UTF-8转换为Unicode的算法
  • 4.5 本章小结
  • 第五章 系统实现
  • 5.1 需求分析
  • 5.2 系统设计
  • 5.2.1 总体结构
  • 5.2.2 输入输出
  • 5.2.3 项目流程
  • 5.3 系统实施
  • 5.3.1 开发测试环境
  • 5.3.2 编写Unicode程序
  • 5.3.3 EnCase脚本
  • 5.4 代码编写
  • 5.4.1 编码
  • 5.4.2 解码
  • 5.5 系统测试
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].伯恩斯坦语言编码理论视角下的隔代教育分析[J]. 萍乡学院学报 2015(04)
    • [2].寻共同的语言编码[J]. 阅读 2018(71)
    • [3].英语高/低分组语言编码能力差异分析[J]. 哈尔滨学院学报 2016(01)
    • [4].伯恩斯坦的语言编码理论对我国教师教学语言运用的启示[J]. 淮北职业技术学院学报 2014(03)
    • [5].语言编码理论能够解释当代中国教育问题吗[J]. 上海教育科研 2011(01)
    • [6].语言编码理论视角下教育过程公平探究[J]. 教学与管理 2015(21)
    • [7].中俄网络语言编码接口问题的研究[J]. 科技视界 2016(03)
    • [8].小班幼儿语言编码的影响因素与对策研究[J]. 现代职业教育 2017(27)
    • [9].论伯恩斯坦的精致语言编码与家庭教育[J]. 教育教学论坛 2018(26)
    • [10].语言符码理论对我国教师教学语言的启示[J]. 海南广播电视大学学报 2015(03)
    • [11].语言编码瓶颈现象与新格莱斯引发性三原则:语言自组织现象探究(一)[J]. 佳木斯职业学院学报 2016(05)
    • [12].儿童精密型语言编码及其培养策略[J]. 课程教学研究 2014(11)
    • [13].素质教育实施难的背后——对几个影响因素的探析[J]. 中国农业教育 2009(03)
    • [14].C语言编码时常见错误分析[J]. 兰州工业高等专科学校学报 2009(02)
    • [15].Java语言编码过程中的质量保证方法和工具[J]. 计算机应用与软件 2008(10)
    • [16].文学语言编码的基本守则[J]. 现代语文(语言研究版) 2014(11)
    • [17].以师生隐性冲突为动力催生和谐课堂的策略[J]. 教育导刊 2016(01)
    • [18].语言编码方式对词汇借用与改造的影响——以汉语和泰语为例[J]. 昆明学院学报 2017(01)
    • [19].认识文体学的美学效果[J]. 神州 2013(12)
    • [20].现代汉语顺序换算表达的分类与换算结构的功能及组合限制——兼论主观性程度与语言编码形式的关系[J]. 语文研究 2016(04)
    • [21].基于社会学视角的课堂评价[J]. 中国教育学刊 2015(02)
    • [22].从本土文化视角略论翻译的文化传播功能[J]. 科教导刊(下旬) 2015(05)
    • [23].当代中国诗歌中的古典质素探析[J]. 中国文学研究 2018(01)
    • [24].中国文化国际化传播中的文化自觉[J]. 对外传播 2015(12)
    • [25].校读洵非易,一字未可轻——以三则实例说说书稿的编校[J]. 萍乡学院学报 2016(04)
    • [26].英语阅读教学中的预设诱导[J]. 课程教育研究 2012(27)
    • [27].日语学习者格助词偏误与汉日母语者认知图式差异[J]. 外语教学与研究 2016(05)
    • [28].社会学视界下的阶层方言的差异性分析[J]. 教育教学论坛 2014(10)
    • [29].语境对言语交际中句式结构选择的影响[J]. 语文建设 2013(05)
    • [30].作为语言意义的意识世界的建立[J]. 外语学刊 2013(03)

    标签:;  ;  ;  

    基于中日韩的多国语言编码系统的研究与实现
    下载Doc文档

    猜你喜欢