时空数据流
时空解释在时间和空间中通过时间序列传送可持续数据。
时间序列(time series model) 数据按照其属性(实际上就是时间)的顺序前来。在这种情况下,i = t,即一个t时刻的更新为(t, ct)。此时对α的更新操作为αt(t)= ct, 且对于i. =.t,αi. (t)= αi. (t . 1)。这种模型适用于时序数据,如某特定IP的传出的数据,或股票的定期更新数据等。
数据流解释每时每刻都在源源不断地产生大量的数据.与传统的数据集不同,这些数据是海量的(massive),时序的
(temporally ordered),快速变化的和潜在无限的(potentially infinite).[1]我们称这样的数据形态为数据流(Data
Steaming, 简称Streaming),并用数据流模型(Data Streaming Model)来描述它.
概述基于时空划分的思想,设计概要数据结构的在线生成算法。概要数据结构保存流数据不同时刻的分布状态,以支持离线阶段的分类、聚类和关联规则发现等数据挖掘操作。研究时间粒度、量化向量调整和子区域索引等3项内存需求控制策略,以平衡概要数据结构的内存需求和内外存之间的I/O次数。