论文摘要
Internet的迅猛发展,尤其是Web的全球普及,使得Web上的信息量无比的丰富。通过对Web数据的挖掘,不仅可以得出关于群体用户访问行为和方式的普遍知识,用于改进Web服务设计,更重要的是,通过对用户特征的理解和分析,可以有助于开展有针对性的电子商务活动。为了解决来自用户和网站双方面的问题,自适应网站应运而生,它通过学习用户访问模式,呈现不同的界面给不同的用户并且完善网站自身拓扑结构。蚁群算法由于其独特的正反馈机制受到越来越多的关注,应用领域也越来越广阔。本文在分析了蚂蚁觅食行为和Web用户访问行为相似性的基础上,给出了基于蚁群的Web自适应站点算法,通过该方法,能使用户通过最优路径到达目标页面。另外,受蚂蚁能识别与之相遇蚂蚁是敌是友行为的启发,给出了基于蚁群本能识别能力的Web用户聚类算法,通过用户事务的相似度矩阵实现了对Web用户模式的聚类。另一方面,本文在分析遗传算法基本理论的基础上,将标准遗传算法和K-均值划分聚类方法有机的结合,给出了一种用混合遗传聚类方法对Web用户的行为进行分析的方法。该方法是一个具有全局最优解的聚类方法,其结果明显优于标准遗传聚类方法。该算法能够有效地剔除噪音,得到很好的用户聚类和页面聚类效果,为网站的管理者设计个性化的商务网站提供了有效的决策依据。最后,本文综合利用遗传算法的快速全局搜索能力和蚁群算法的正反馈收敛机制,优势互补,给出了一种融合的Web挖掘算法,该算法比单独的蚁群算法以及遗传算法在优化性能和时间性能上有一定的优势。
论文目录
摘要Abstract第1章 绪论1.1 课题的背景及意义1.2 国内外相关领域的研究现状1.2.1 Web日志挖掘1.2.2 Web个性化1.2.3 Web自适应站点1.2.4 仿生类算法1.3 论文组织结构第2章 智能站点及Web挖掘2.1 智能Web站点介绍2.2 Web服务器日志分析2.3 Web数据挖掘2.3.1 Web挖掘分类2.3.2 Web日志挖掘的基本过程及相关技术介绍2.4 本章小结第3章 基于蚁群算法的Web日志挖掘应用3.1 蚁群算法3.1.1 蚁群算法简介3.1.2 蚁群算法的基本原理3.1.3 蚁群算法的数学模型及实现3.2 用户浏览行为与蚁群觅食行为的相似性3.3 基于蚁群的自适应站点算法3.3.1 算法的基本理论3.3.2 基于蚁群的自适应站点算法3.3.3 算法实验3.3.4 算法改进3.4 基于蚁群的Web用户聚类算法3.4.1 算法的基本原理3.4.2 Web用户事务模式聚类3.4.3 聚类实验分析3.5 本章小结第4章 基于遗传算法的Web日志挖掘与用户聚类4.1 遗传算法简介4.2 遗传算法与聚类4.2.1 遗传聚类4.2.2 遗传聚类需要解决的主要问题4.3 遗传算法的聚类分析4.3.1 染色体构造4.3.2 聚类分析的数学模型及目标函数4.3.3 适应度函数的定义4.3.4 控制参数4.4 基于遗传算法的Web用户聚类4.4.1 Web站点拓扑分析和URL编码方案4.4.2 基于遗传算法的用户聚类技术4.4.3 遗传用户聚类算法4.4.4 遗传用户聚类实验分析4.4 本章小结第5章 遗传与蚁群算法相融合Web日志挖掘算法5.1 基本原理和设计思想5.2 融合算法中遗传算法的定义5.2.1 适应度函数及遗传算子操作5.2.2 融合算法中遗传算法的整体描述5.3 融合算法中蚁群聚类算法的使用5.3.1 蚁群算法的基本思想5.3.2 蚂蚁圈模型5.3.3 融合算法中蚁群算法的描述5.4 遗传蚁群算法的衔接5.5 融合算法描述5.6 仿真实验5.6.1 实验分析5.7 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:数据挖掘论文; 日志论文; 蚁群算法论文; 遗传算法论文; 个性化服务论文;