大數據評測基準的研發現狀與趨勢
周曉云 覃雄派 王秋月
工業界、學術界,以及最終用戶都急切需要一個大數據的評測基準, 用以評估現有的大數據系統,改進現有技術以及開發新的技術。回顧了近幾年來大數據評測基準研發方面的主要工作。 對它們的特點和缺點進行了比較分析。在此基礎上, 對研發新的大數據評測基準提出了一系列考慮因素:1)為了對整個大數據平臺的不同子工具進行評測, 以及把大數據平臺作為一個整體進行評測, 需要研發面向組件的評測基準和面向大數據平臺整體的評測基準, 后者是前者的有機組合;2)工作負載除了SQL查詢之外, 必須包含大數據分析任務所需要的各種復雜分析功能, 涵蓋各類應用需求;3)在評測指標方面,除了性能指標(響應時間和吞吐量)之外, 還需要考慮其他指標的評測, 包括系統的可擴展性、容錯性、節能性和安全性等。
