日韩精品一区二区三区swag_一区二区三区在线高清_亚洲国内欧美_国产精品xnxxcom

你好,游客 登錄
背景:
閱讀新聞

[PDF]基于分布式平臺(tái)Spark和YARN的數(shù)據(jù)挖掘算法的并行化研究

[日期:2015-03-09] 來源:CNKI  作者:梁彥 [字體: ]

基于分布式平臺(tái)Spark和YARN的數(shù)據(jù)挖掘算法的并行化研究

中山大學(xué)  梁彥

本文在Spark平臺(tái)上實(shí)現(xiàn)k-means算法并行化。針對(duì)k-means算法的不足,本文使用canopy算法對(duì)k-means算法進(jìn)行優(yōu)化提高算法效率和聚類結(jié)果的準(zhǔn)確性,并在Spark平臺(tái)上實(shí)現(xiàn)canopy-kmeans算法的并行化。對(duì)基于Spark平臺(tái)的k-means并行算法和canopy-kmeans并行算法在準(zhǔn)確性、加速比、擴(kuò)展性、與其他平臺(tái)性能進(jìn)行了比較。實(shí)驗(yàn)結(jié)果表明,算法并行化后得到較好的聚類結(jié)果,在面對(duì)海量數(shù)據(jù)時(shí)有較好的加速比和擴(kuò)展性。與Hadoop平臺(tái)比較,基于Spark平臺(tái)算法并行化效率更高。而Spark平臺(tái)執(zhí)行需求資源不同的聚類任務(wù)時(shí),在資源管理平臺(tái)YARN調(diào)度任務(wù)相較于資源管理平臺(tái)Mesos有更高的執(zhí)行任務(wù)效率。研究表明,結(jié)合Spark+YARN平臺(tái)實(shí)現(xiàn)并行化是可行高效且具有現(xiàn)實(shí)意義的。

 

基于分布式平臺(tái)Spark和YARN的數(shù)據(jù)挖掘算法的并行化研究

推薦 打印 | 錄入: | 閱讀:
本文評(píng)論   
評(píng)論聲明
  • 尊重網(wǎng)上道德,遵守中華人民共和國的各項(xiàng)有關(guān)法律法規(guī)
  • 承擔(dān)一切因您的行為而直接或間接導(dǎo)致的民事或刑事法律責(zé)任
  • 本站管理人員有權(quán)保留或刪除其管轄留言中的任意內(nèi)容
  • 本站有權(quán)在網(wǎng)站內(nèi)轉(zhuǎn)載或引用您的評(píng)論
  • 參與本評(píng)論即表明您已經(jīng)閱讀并接受上述條款
主站蜘蛛池模板: 融水| 全州县| 邵东县| 利川市| 达尔| 托克逊县| 黄浦区| 京山县| 阿鲁科尔沁旗| 潼关县| 贵州省| 江口县| 永城市| 彰武县| 朝阳区| 惠来县| 保德县| 宁乡县| 乐至县| 探索| 德格县| 江源县| 黄石市| 会宁县| 文水县| 穆棱市| 福安市| 连城县| 西贡区| 太谷县| 文水县| 永仁县| 黔江区| 浦北县| 阜宁县| 高碑店市| 靖远县| 曲阜市| 洪泽县| 皮山县| 乐安县|