日韩av片子_国产自在自线午夜精品视频在_使劲快高潮了国语对白在线_久久免费毛片大全_激情丁香综合_欧美成人精品欧美一级乱黄码

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 軟件研發 > Hadoop與Spark兩大架構的比較

Hadoop與Spark兩大架構的比較

2017-04-20 17:02:51 | 來源:中培企業IT培訓網

  HadoopSpark是當前兩個流行的大數據架構,也是非常重要的開源技術。對于HadoopSpark,業內很多專業人士都進行了對比分析。中培偉業《大數據平臺搭建與高性能計算應用實戰》培訓蔣老師在這里就HadoopSpark兩大架構的認識發表了自己的看法。

  Hadoop

Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業內的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) 和 Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統計。使用Map進行分詞,然后Reduce得到詞頻。

那經常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數據倉庫,可以通過Sql查詢和實現一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數據庫。模型也是產生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現。

你可能會聽到 Hadoop YARN ,YARN 是作業管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark

在Spark 出來之后看到有人說Spark會代替Hadoop 但經老師根據自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數據的處理和計算能力,它并沒有解決數據存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統,Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。


標簽: 數據架構
主站蜘蛛池模板: 久久精品草 | 国产精品9999久久久久 | 国产人人草 | 九一在线 | 亚洲熟妇自偷自拍另欧美 | 国产美女精品视频线免费播放软件 | 中文字幕人妻少妇引诱隔壁 | 亚洲精品看片 | 国产偷久久一级精品60部 | 无码裸模视频在线观看 | 国产盗摄TP摄像头偷窥 | 天天弄天天模 | 亚洲AV激情无码专区在线播放 | 538任你躁精品视频网免费 | 最近免费中文字幕mv免费高清 | 国产A一级毛片高清视频完整片 | 久久免费综合视频 | 伊人久久大香线蕉综合网 | 91在线视频免费?看 伊人久久大香线蕉av网禁呦 | 亚洲多毛女人厕所小便 | 小明久久 | 亚洲精品国产第一综合99久久 | 国产97色在线 | 欧美极品kennajames喷水 | 久操免费在线视频 | 国产一级一级毛片女人精品 | 久久精品2 | 黄网久久 | 国产愉拍自愉免费第1页 | 69pao强力打造国产成人 | 色欲色香天天天综合网WWW | 亚洲欧美久久 | 23部禽女乱小说内裤畸情视频 | 欧美日韩一区二区三区不卡 | 公车上玩弄白嫩少妇 | 在线观看国产精品日韩av | 青青草视频在线免费观看 | 日本道色综合久久影院 | 污的网站在线观看 | 亚洲熟妇无码八V在线播放 韩日一级 | 天堂视频一区二区 |