Sampling with Incremental MapReduce
Marc Schafer Johannes Schildgen Stefan Deloch
The goal of this paper is to increase the computation speed of MapReduce jobs by reducing the accuracy of the result. Often, the timely p
Google三大云計算技術對海量數據分析流程的技術改進優化研究
盧小賓 王濤
建構云計算技術環境下的海量數據分析是一種需要預載大量數據集的數據計算處理。針對傳統海量數據分析處理數據細節方式所導致的分析質量與效率問題,運用Google三大云計算技術對其進行改進。[方法/過程] 通過對Google三大云計算技術——GFS、MapReduce和Bigtable進行文獻調查、內容分析和技術分析,梳理出Goo
Parallel Tree Reduction on MapReduce
Kento Emoto Hiroto Imachi
In this paper, restructuring our previous BSP algorithm for tree reduction computations, we propose a new MapReduce al