基于仿生类算法的Web日志挖掘技术研究

论文摘要

Internet的迅猛发展，尤其是Web的全球普及，使得Web上的信息量无比的丰富。通过对Web数据的挖掘，不仅可以得出关于群体用户访问行为和方式的普遍知识，用于改进Web服务设计，更重要的是，通过对用户特征的理解和分析，可以有助于开展有针对性的电子商务活动。为了解决来自用户和网站双方面的问题，自适应网站应运而生，它通过学习用户访问模式，呈现不同的界面给不同的用户并且完善网站自身拓扑结构。蚁群算法由于其独特的正反馈机制受到越来越多的关注，应用领域也越来越广阔。本文在分析了蚂蚁觅食行为和Web用户访问行为相似性的基础上，给出了基于蚁群的Web自适应站点算法，通过该方法，能使用户通过最优路径到达目标页面。另外，受蚂蚁能识别与之相遇蚂蚁是敌是友行为的启发，给出了基于蚁群本能识别能力的Web用户聚类算法，通过用户事务的相似度矩阵实现了对Web用户模式的聚类。另一方面，本文在分析遗传算法基本理论的基础上，将标准遗传算法和K-均值划分聚类方法有机的结合，给出了一种用混合遗传聚类方法对Web用户的行为进行分析的方法。该方法是一个具有全局最优解的聚类方法，其结果明显优于标准遗传聚类方法。该算法能够有效地剔除噪音，得到很好的用户聚类和页面聚类效果，为网站的管理者设计个性化的商务网站提供了有效的决策依据。最后，本文综合利用遗传算法的快速全局搜索能力和蚁群算法的正反馈收敛机制，优势互补，给出了一种融合的Web挖掘算法，该算法比单独的蚁群算法以及遗传算法在优化性能和时间性能上有一定的优势。

论文目录

摘要

Abstract

第1章绪论

1.1 课题的背景及意义

1.2 国内外相关领域的研究现状

1.2.1 Web日志挖掘

1.2.2 Web个性化

1.2.3 Web自适应站点

1.2.4 仿生类算法

1.3 论文组织结构

第2章智能站点及Web挖掘

2.1 智能Web站点介绍

2.2 Web服务器日志分析

2.3 Web数据挖掘

2.3.1 Web挖掘分类

2.3.2 Web日志挖掘的基本过程及相关技术介绍

2.4 本章小结

第3章基于蚁群算法的Web日志挖掘应用

3.1 蚁群算法

3.1.1 蚁群算法简介

3.1.2 蚁群算法的基本原理

3.1.3 蚁群算法的数学模型及实现

3.2 用户浏览行为与蚁群觅食行为的相似性

3.3 基于蚁群的自适应站点算法

3.3.1 算法的基本理论

3.3.2 基于蚁群的自适应站点算法

3.3.3 算法实验

3.3.4 算法改进

3.4 基于蚁群的Web用户聚类算法

3.4.1 算法的基本原理

3.4.2 Web用户事务模式聚类

3.4.3 聚类实验分析

3.5 本章小结

第4章基于遗传算法的Web日志挖掘与用户聚类

4.1 遗传算法简介

4.2 遗传算法与聚类

4.2.1 遗传聚类

4.2.2 遗传聚类需要解决的主要问题

4.3 遗传算法的聚类分析

4.3.1 染色体构造

4.3.2 聚类分析的数学模型及目标函数

4.3.3 适应度函数的定义

4.3.4 控制参数

4.4 基于遗传算法的Web用户聚类

4.4.1 Web站点拓扑分析和URL编码方案

4.4.2 基于遗传算法的用户聚类技术

4.4.3 遗传用户聚类算法

4.4.4 遗传用户聚类实验分析

4.4 本章小结

第5章遗传与蚁群算法相融合Web日志挖掘算法

5.1 基本原理和设计思想

5.2 融合算法中遗传算法的定义

5.2.1 适应度函数及遗传算子操作

5.2.2 融合算法中遗传算法的整体描述

5.3 融合算法中蚁群聚类算法的使用

5.3.1 蚁群算法的基本思想

5.3.2 蚂蚁圈模型

5.3.3 融合算法中蚁群算法的描述

5.4 遗传蚁群算法的衔接

5.5 融合算法描述

5.6 仿真实验

5.6.1 实验分析

5.7 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

基于仿生类算法的Web日志挖掘技术研究

论文摘要

论文目录

相关论文文献

猜你喜欢