论文摘要
Internet的迅速发展,在给人们带来丰富信息和极大便利的同时,也随之产生了许多的问题,个性化的信息服务和构建智能化Web站点便是其中之一。直接或间接地解决这个问题的途径之一就是将数据挖掘技术应用于Web服务器日志的挖掘。本文研究了Web日志挖掘中的相关技术,并在组织进化算法的基础上,提出了二种用于Web日志挖掘的算法。 本文的主要研究工作如下: 1.组织协同进化分类算法(Organizational CoEvolutionary algorithm for Classification,OCEC)与现有遗传算法的运行机制不同,OCEC算法中的个体不需要进行编码,且个体以组织的形式进行进化,为此定义了新的适合于组织操作的进化算子;另外,OCEC的进化操作直接作用于数据而不是规则,进化结束后再从组织中提取规则。本文基于OCEC的以上特点,提出了组织协同进化的Web日志挖掘算法。该算法针对Web日志挖掘的特点,改进了OCEC中的合并算子,并把增减算子和交换算子中的常数参数修改为百分数。仿真对比实验表明,该算法不仅有效可行,而且还有较快的收敛速度。 2.在组织进化算法的基础上,提出了基于组织多层次进化的关联规则挖掘算法。该算法将初始数据以自由态组织形式加入进化种群中,进化种群每次进化后,把包含相同属性集合的组织加入最优种群中;并同时用本文定义的聚合算子对最优种群进行进化,把其中相同属性集合相等的不同组织聚合为一个更大的组织;进化结束后,再从最优种群各组织的相同属性集合中提取出关联规则。该算法避免了计算大量无效频繁项的支持度,而且进化种群和最优种群同时进化,因此有较快的进化速度。仿真对比实验表明,该算法不但加快了挖掘关联规则的速度,而且还保持了较高的有效关联规则提取率。
论文目录
第一章 绪论1.1 论文的研究背景及意义1.1.1 研究背景1.1.2 研究意义1.2 WEB日志挖掘的研究现状1.3 本文的内容与结构第二章 WEB日志挖掘2.1 数据挖掘和WEB挖掘技术2.1.1 数据挖掘2.1.2 Web挖掘2.2 WEB日志挖掘的数据分析2.2.1 数据源2.2.2 数据的模型2.3 数据预处理2.3.1 数据预处理的必要性2.3.2 数据清洗2.3.3 用户与会话识别2.3.4 网页浏览识别2.3.5 路径补全2.4 WEB日志中的事务识别2.4.1 浏览行为模型2.4.2 一般事务模型第三章 组织进化计算3.1 引言3.2 组织进化算法3.2.1 组织的含义3.2.2 组织进化算子3.2.3 组织进化算法的描述3.3 组织协同进化分类算法3.3.1 引言3.3.2 组织的定义3.3.3 组织适应度的计算3.3.4 组织进化算子3.3.5 组织协同进化分类算法的描述第四章 组织协同进化WEB日志挖掘算法4.1 引言4.2 WEB日志挖掘数据模型的建立4.3 组织协同进化WEB日志挖掘算法4.3.1 算法的设计思想4.3.2 算法的具体描述4.4 算法分析4.4.1 计算复杂度分析4.4.2 性能分析4.5 实例仿真4.6 结论第五章 基于组织进化的关联规则挖掘算法5.1 引言5.2 基于组织进化的关联规则挖掘算法5.2.1 组织的定义5.2.2 组织适应度的计算5.2.3 组织进化算子5.2.4 算法描述5.3 仿真试验与结果分析5.4 结论第六章 基于组织多层次进化的关联规则挖掘算法6.1 引言6.2 基于组织多层次进化的关联规则挖掘算法6.2.1 算法的思想6.2.2 算法描述6.2.3 算法的计算复杂性分析6.3 仿真试验与结果分析6.3.1 算法有效性验证6.3.2 算法可扩展性验证6.4 结论第七章 总结与展望7.1 总结7.2 展望致谢参考文献在读期间撰写(完成)的论文目录
相关论文文献
标签:日志挖掘论文; 组织进化论文; 相同属性论文; 用户分类论文; 关联规则论文;