论文摘要随着因特网技术的迅速发展,网上信息成几何级数增长,如何自动处理这些海量联机文本信息成为目前重要的研究课题。文本信息抽取是指从一段文本中抽取指定的信息(例如事件、事实),...
论文摘要随着Internet的迅速发展,Web作为全球化的信息源已经成为人们获取信息的重要来源。但是,由于Web页面的无结构性、Web内容的多样性和Web页面的动态变化等原因,...
论文摘要HTML网页正文信息抽取功能已经成为目前很多互联网应用的基础工作和亟待解决的问题。HTML网页所要表达的“正文”信息通常会包含在“噪音”信息中。我们在浏览网页的时候经常...
论文摘要随着互联网技术的发展,人们进入了信息化的时代。在这个信息化的时代,信息就意味着财富,如何有效快速获得准确的、有价值的信息成为关键环节。当前,Web上出现了大量的、结构不...
论文摘要在Internet发展的初始阶段,网络资源比较稀少,信息资源的查找比较容易。随着互联网的迅猛发展,Web中所容纳的信息量呈现指数级增长。面对海量的网络信息资源,如何快速...
论文摘要自2004年Web2.0的概念提出之后,Internet的使用方式发生了很大的变化。以前人们主要是通过Internet浏览网站新闻。而出现了Web2.0之后主要是采用交...
论文摘要近年来,计算机、网络及通信技术取得的重大突破推动了互联网在各领域的应用普及,促进了企业与企业(B2B)、企业与顾客(B2C)电子商务的迅猛发展,电子商务的发展打破了地域...
论文摘要突发事件都具有随机性、突然性和危害性的特征。在互联网环境下,突发事件网络信息通过新闻、评论、发贴、回复等形式反映出来,具有传播快捷、信息多元、方式互动等显著特点,这使突...
论文摘要身处一个高速发展的信息时代,随着互联网的日渐普及,信息载体的日益增多,使得大量的无关信息充斥着人们的眼球;面对信息量的爆炸式增长,单纯的依靠人工筛选价值信息已经不太现实...
论文摘要随着我国办公自动化事业的飞速发展,对人事信息管理智能化的需求与日俱增;目前,人事工作中的表格处理工作基本上都要通过人工输入方式来完成,而人事数据却在逐年增多,这也为准确...
论文摘要万维网(Web)是世界上规模最大的公共数据源,但Web上信息资源的有效利用是一个难点。Web信息资源大多以HTML文档形式存在,HTML文档的特点决定了它无法作为有效的...
论文摘要随着Internet技术的不断发展,网上的文本信息数量成指数级增长,大量非结构化信息的激增使得“信息爆炸与知识饥渴”的矛盾日趋激烈,因此如何自动地使非结构化信息结构化是...
论文摘要随着Internet的迅速发展,WWW已发展为一个庞大的信息空间,为人们供了极其丰富的信息资源。然而一个网页的正文四周,通常会夹杂着许多与正文不相关的“噪音信息”,这些...
论文摘要随着互联网资源的迅速增长,仅仅依靠浏览器以及基于关键字检索查询的搜索引擎,已远不能满足互联网用户的信息需求,Web信息抽取应运而生。本文以条件随机域模型为主要研究内容,...
论文摘要随着互联网的发展,网络成为人们获取自己需要的信息的重要途径,Web信息抽取是一种可以从Web页面信息中抽取出结构化的信息的技术,为人们从浩瀚如海的internet网上获...
论文摘要实体关系抽取就是从特定领域的文本中发现实体对间的各种语义关系,并以结构化的形式存储。它在信息检索、自动问答系统中有广泛的应用,且作为信息抽取领域中的一项关键技术越来越受...
论文摘要自动问答系统能用准确简洁的答案回答用户使用自然语言提出的问题,作为一种新的信息获取方式,正受到越来越多的关注。传统的自动问答系统趋向使用结构化或半结构化的封闭式知识库系...
论文摘要随着Internet的快速发展,Web已经发展成为一种巨大的、分布式的和共享的信息资源。目前Web数据大都以HTML页面的形式出现。由于HTML描述的数据是一种半结构化...
论文摘要互联网提供了海量的信息,最理想的情况是互联网提供的这些信息不仅能被人们很容易地浏览,更重要是作为一个数据源能像关系型数据库一样被查询,各种计算机应用能有效地利用上这些信...
论文摘要互联网技术的不断更新带动了电子商务业务的高速发展。信息技术已经渗透到人们生活的各个角落。随着网络购物理念逐渐普及,消费者不仅可以足不出户地在网上挑选、购买商品,而且可以...