云计算平台上基于过滤器的多表连接算法.pdf

云计算平台上基于过滤器的多表连接算法.pdf

(0个评分)

文集编号: 20140108008760

我要下载 收藏文档 0 学分

文档介绍

计算是当前处理大规模数据分析的重要技术.然而,云计算平台上数据的广泛分布性使多表 连接运算代价过高,这是一个迫切需要解决的问题.针对这一问题,首先对云计算环境中已有的多表连接算法进行分析,然后提出一种新的基于过滤器的多表连接算法.对多个表同时进行连接,避免中间结果的产生;通过预先统计连接属性的取值分布,减少不必要的元组复制与数据传输.在TPDH数据上的实验结果显示,基于过滤器的多表连接算法与Hive及另外两种已有算法相比,显著提高了云计算环境中多表连接运算的效率.

文档标签: 计算机科学与技术
贡献者

王培培新来的

分享文档128 联系TA