当前,基于海量存储系统的云计算应用面临处理大规模数据的难题。大规模数据中心的存储系统的数据规模超过ZB量级,这些数据具有多源、异构、海量等特点,因此需要高效和快速的近似查询服务的支持,以增强存储系统的可扩展性,为存储系统的大量用户提供高质量的存储服务。
武汉光电国家实验室(筹)信息存储与光显示功能实验室的华宇副教授等提出一种基于海量数据的局部性特征的近似查询的方法,称为NEST。这种方法通过快速、简单的哈希计算来挖掘和获取数据的多维元数据信息和访问模式,所生成的数据结构不仅能够较好的保持数据之间的关联关系,而且能够显著地提高查询准确性、实现负载均衡。通过大量的测试和实验分析,NEST能够实现轻量级的索引结构和提供快速准确的数据查询服务。
这项研究成果发表在中国计算机学会A类国际会议INFOCOM 2013上,相关研究工作得到国家自然科学基金(61173043)和国家“ 973计划”项目(2011CB302301)的支持。
图1:均匀查询请求下的平均查询延迟
图2:不同查询准确率所需的存储空间
(责任编辑:陈智敏)