论文摘要
近年来,信息处理技术的应用领域得到了很大的拓展,如:网络、金融应用、电子商务、传感器网络等。在这些应用中,数据不再拘泥于静态的关系数据,而是一种连续、无界、实时传输、不定速度的流式数据(即数据流)。传统数据处理技术突显出自身的局限性,目前数据流处理技术成为数据库研究领域的又一热点。目前,对数据流技术的研究主要集中在一般的实时应用上,但在关键任务型应用中(如飞船的实时控制系统、在线拍卖会系统等),数据处理的实时性要求亦很高,一旦错过截止期会造成灾难性的后果。截止期和关键性是这类应用中的两个突出特征,结合这些特征研究合适的数据流处理技术对提高关键任务型应用的处理效率是非常必要的。本文针对高关键性的一些特殊的应用,把传统实时系统中的截止期、空闲时间、关键性等概念引入数据流系统,并根据数据流条件下查询等方面的特点,赋予其新的含义;并从这三方面进行综合考虑,提出了关键任务型应用的优先级模型CriticalModel,使得流截止期越早、空闲时间越短、关键性越高的查询具有更高的优先级。并给出了一种优先级树结构,使得基于优先级的查询执行序列唯一化。且在优先级模型CriticalModel以及优先级树的基础上,从提高关键任务型应用连续查询实现价值率的角度,进一步提出了一种基于优先级的实时调度策略RealScheduling。实验结果表明基于优先级的实时调度策略RealScheduling在不同的数据流流速下都表现出其优越性,提高了连续查询的实现价值率,从而使连续查询调度的成功率得到很大提高。