赵伯鑫王小兵
1.河北软件职业技术学院(华北电力大学在读研究生)
2.保定市天河电子技术有限公司,河北保定071000
摘要:随着信息技术和网络的飞速发展,网格的应用逐渐提上日程。本文对网格技术应用的一个重要分支——基于网格的信息检索(简称GridIR)的组成做了介绍,对网格信息检索中三大功能组件对资源的需求特点加以分析,引入资源服务质量概念,结合经济学原理和博弈论,设计了一种自适应资源分配机制,确保了资源在三大功能组件间的合理分配。
关键词:网格;信息检索;资源分配
中图分类号:G354.4文献标识码:A文章编号:1673-0992(2010)07A-0077-01
一、网格信息检索中三大功能组件
网格信息检索系统由搜索管理器、索引器和查询处理器三个服务功能模块组成,。各功能模块的具体描述如下:
(1)搜集管理器(CM)
CM通过网格信息检索服务组件搜集和管理需索引的源文献。搜集管理器搜集本地和远程的文献并进行预处理,然后存放于本地存储器。通常搜集管理器要把这些本地存储按照特定规则提供给客户。这里的客户通常是指索引器(IS),索引器将对这些源文献进行索引。
(2)索引器(IS)
CM将源文献组织起来提供给IS,IS对CM提供的源文献进行索引、创建数据结构等预处理,这些预处理为后期的搜索作准备。IS从CM那里获得源文献,并加以标引建库,然后提供检索功能,而且其检索界面和传统检索系统是兼容的。
(3)查询处理器(QP)
QP负责管理查询和检索结果集,其主要功能包括对用户提交的查询请求进行扩展等预处理,此外还要将查询请求发送给多个IS进行处理。QP的典型应用是作为独立IS和CM的搜索接口,其中IS和CM可以不依赖QP进行动态管理,检索接口可以由QP单独组成,也可以由IS和CM协同组成,这样便于单独访问CM和IS。
CM、IS和QP都是计算密集型的,都需要较强的计算能力,如何为这三种组件合理的分配计算资源,以使得网格信息检索系统高效的运行,是决定信息检索系统性能的关键因素。如果不对计算资源进行合理分配,会存在一个组件长期占有某些资源而不用,其他的组件此时又没有足够的资源可用的问题。
二、资源竞争模型构建与价格策略
在网格信息检索系统中,QP、IS和CM三个服务组件作为资源消费者为了避免出现以上提到的没有足够的资源可用的问题而彼此竞争有限的计算资源。这种竞争表现为这些网格消费者需要购买网格资源以使完成各自的任务(例如搜索、分词和匹配计算)。每个组件必须在其他组件可能的出价基础上确定自己的最优出价。
现在我们采用组合投标的方式匹配多个请求方和提供方的资源。如图1所示,假设当前网格中有p∈?个VO资源作为提供者,信息检索系统周期性地发布当前拥有的资源数量及价格。CM、QP和IS作为消费者,采用投标方式选择所需资源。针对多个消费者的资源请求,我们来着重讨论提供者的分配策略,分析一种信任度资源分配机制,其主要特性如下:
(1)资源提供者根据消费者的投标报价、信任度及完成时间的约束,构造效益函数;
(2)资源VO共享资源,获取更高的信任度;
(3)根据当前资源的供需和负载状况,自适应地调整资源分配策略;
(4)最大化资源的聚合效用。
由此我们可以看出这是一种互动机制,它可以有效地促进资源的供应与需求的满足,也为资源的优化组织和发展提供某一方面的基础。
在不同的前提和目的下,基于经济学的一般均衡定理,从微观经济主体的行为角度出发,考察每一种产品的供需达到均衡状态时所需的条件、相应的均衡价格和均衡数量,可以建立相对有效的价格模型。
我们可以采用公式计算资源的均衡价格,P=P+δ(W-G)和ε分别表示价格调整速率和迭代终止参数,当资源的供给大于资源的需求,即W-G>0时,下调价格;反之,上调价格,并且价格升降的速度与|D-S|成正比。在经济学中,这样的价格调整过程称为摸索过程,我们可以通过构造李亚普诺夫能量函数的方法证明Tatonnement过程收敛于均衡价格。
三、价格资源分配
在网格信息检索体系中,每个信息检索服务组件必须在其他组件可能的出价基础上确定自己的最优出价。这种竞争和决策行为正是博弈论要研究的问题,其结果是一个纳什均衡,它可能不是各方及整体利益的最大化,但它是在已给定信息条件下的一种必然结果。我们定义如下参数:
(1):信息检索服务组件i的任务序列。
(2):当服务组件的资源充裕时,以的价格卖出k类资源。
(3):当服务组件有剩余资源时,为了防止某一组件长期占有某一资源,强制其卖出的k类资源量。
(4)bik:信息检索组件i对k类资源的出价。
(5)pk:当前信息检索系统对k类资源的最高标价。
(6)si:信息检索服务组件i总的虚拟资本量。
(7)Bk:所有信息组件对资源k出价的总和。
(8)Rik:服务组件i获得k类型的资源量。
(9)Rk:总的k类型的资源量。
网格信息检索服务组件投标可以追索为:在有限的虚拟资金Ei下,获得尽可能多的资源,完成尽可能多的任务,服务组件i为获取k类资源的预算资金不能多于Ei,因此有图2公式(1);对k类资源的出价更不能大于估计的系统对Pk类资源的最高标价,于是有图2公式(2);为了获得最大的收益,获取资源的比例一定要大于资金投入的比例,得到公式图2(3);当组件有过剩的k类资源时,可以将此类资源以适当价格卖出,此价格肯定不能高于系统最高标价,此时有公式图2(4)和图2公式(5)。
信息检索系统服务组件的具体价格博弈过程为:
(1)系统(卖家)查看当前资源状况,如果资源相对比较充裕,那么系统就自动降低单位资源的标价,例如降价10%,反之,就提高单位资源价格。
(2)计算需求资源的种类和量值,根据对资源的需求强度r和自己的虚拟资金量,计算出此次投标的预算资金,可增加的预算资金量sx,其中r为区间(0,1)之间的值,r越大则需求强度越大。
(3)根据历史情况估计其他组件对资源的需求强度r。
(4)依据上述三个过程以及公式(1)-(5)对资源进行出价。
各信息检索服务组件是按照上述过程进行博弈竞争资源的,当然系统可能会考虑一些特殊情况,例如,有些组件资金较少,那么在出价上占不了优势,而其本身对资源的需求又非常强烈,此时,系统就可以依据需求强度出售资源。
参考文献
[1]李伟,徐志伟,卜冠英,查礼.网格环境下一种有效的资源查找方法.计算机学报,2003,26(11)
[2]李曼,王大治,杜小勇,王珊.基于领域本体的Web服务动态组合.计算机学报,2005,28(4)
[3]陈磊,韩颖,李三立.信息网格中基于本体的Web服务动态集成和重构.2006,17(11)