Web中文信息智能获取与分类研究

Web中文信息智能获取与分类研究

论文题目: Web中文信息智能获取与分类研究

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 胡明

导师: 刘大有

关键词: 数据挖掘,分类标引,遗传算法,系统动力学,不动点,吸引性,信息分类,格机,多通信,逻辑,言语行为

文献来源: 吉林大学

发表年度: 2005

论文摘要: 本文针对中文文献(文本)进行信息检索、信息分类和信息抽取中存在的问题,对中文文献的主题词标引、文献集主题词标引、中文文献的自动分类等方面进行了较深入的研究。利用数据挖掘技术、统计学理论和作者发现的中文文献领域知识进行了文献主题词标引;利用遗传算法理论和技术,根据领域背景提出了启发式变异策略,进行中文文献集的主题标引,提高了算法的效率和效果,并结合实例分析了遗传算法的全局动力学形态;扩展了格机理论及应用,并将其用于中文文献的分类,取得了满意的结论;较深入研究了支持多Agent 通信的BDI 逻辑,并将上面获得检索、分类和抽取的知识置于Agent 系统中,最后给出一个Web 信息挖掘中Agent 框架。

论文目录:

第一章 绪论

1.1 中文文本主题提取

1.2 进化计算研究现状

1.3 格机理论研究现状

1.4 本文工作

第二章 中文文本主题词自动提取

2.1 引言

2.2 候选主题词(关键词)切分算法

2.2.1 分词词典

2.2.2 候选主题词切分算法

2.2.3 标引主题词的确定

2.3 基于相互依赖的主题词(关键词)选择

第三章 基于遗传算法的文献集总结提取

3.1 引言

3.2 遗传算法基础

3.2.1 遗传算法的基本概念

3.2.2 遗传算法的基本结构和特征

3.2.3 设计遗传算法的基本原则和步骤

3.3 遗传算法的全局动力学形态分析

3.3.1 动力系统

3.3.2 CGA 的动力学建模方法

3.3.3 CGA 的数学模型及分析

3.4 启发式变异遗传算法的中文文献集总结提取

3.4.1 问题解编码表示

3.4.2 解的适应性度量

3.4.3 选择策略设计

3.4.4 交叉算子设计

3.4.5 启发式变异算子设计

第四章 扩展格机及其在文本分类中的应用

4.1 引言

4.2 格机的基本理论

4.3 文本分类问题中数据表示

4.4 扩展格机与多类别文档分类

第五章 支持多Agent 通信的扩展BDI 逻辑

5.1 引言

5.2 多agent 通信和言语行为理论(speech act theory)

5.3 基本概念

5.4 支持多agent 通信的扩展BDI 逻辑

5.4.1 语法

5.4.2 语义

5.4.3 派生算子和连接符

5.4.4 言语行为的语用解释

5.5 结论

第六章 Web 文本信息挖掘Agent 框架的设计

6.1 框架结构及其描述

6.2 用户子系统设计

6.2.1 用户输入接口

6.2.2 请求/结果处理器

6.2.3 抽取Agent

6.2.4 抽取知识库

6.3 供应者子系统

6.4 中介服务

6.5 驿站服务

6.6 系统容错机制的考虑

第七章 总结和进一步的工作

致谢

在读博士期间完成的主要研究工作

参考文献

摘 要

Abstract

发布时间: 2005-08-26

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

Web中文信息智能获取与分类研究
下载Doc文档

猜你喜欢