日韩av片子_国产自在自线午夜精品视频在_使劲快高潮了国语对白在线_久久免费毛片大全_激情丁香综合_欧美成人精品欧美一级乱黄码

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 從基礎到深度解析Hadoop與Spark

從基礎到深度解析Hadoop與Spark

2017-02-06 16:53:12 | 來源:中培企業IT培訓網

Hadoop與Spark是當前兩個流行的大數據架構,也是非常重要的開源技術。對于Hadoop與Spark,業內很多專業人士都進行了對比分析。中培偉業《大數據平臺搭建與高性能計算最佳實踐》培訓蔣老師在這里就Hadoop與Spark兩大架構的認識發表了自己的看法。

Hadoop——Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業內的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統計。使用Map進行分詞,然后Reduce得到詞頻。

那經常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數據倉庫,可以通過Sql查詢和實現一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數據庫。模型也是產生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現。

你可能會聽到 Hadoop YARN ,YARN 是作業管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark——在Spark 出來之后看到有人說Spark會代替Hadoop 。但經老師根據自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數據的處理和計算能力,它并沒有解決數據存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統,Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

標簽: 大數據平臺
主站蜘蛛池模板: 一区二区久久久久草草 | 国产精品JⅠZZ视频 91视频青青 | 欧美69久成人做爰视频 | 国产日韩AⅤ无码一区二区三区 | 免费观看一级大片 | 精品无码成人久久久久久 | 久久久久久久久久久久久久久国产 | 精品久久久一二三区播放播放播放视频 | 日日操天天操夜夜操 | 91成人午夜 | 夜色毛片永久免费 | 国产成人亚洲综合色婷婷秒播 | 欧美人与禽性xxxxx杂性 | 国产在线视频福利 | 天天躁日日躁狠狠躁av麻豆男男 | 欧美精品日日鲁夜夜添 | 欧美三级精品三区四区 | 日本一本二本在线 | 久久精品99国产精品亚洲 | 一区一区三区产品乱码亚洲 | 黄色小影片 | 亚洲午夜无码AV毛片久久 | 超碰成人免费 | 波多野结衣成人在线 | 丰满岳乱妇三级高清 | 亚洲国产天堂久久国产91 | 婷婷色综合久久 | 国产品无码一区二区三区在线 | 久久69精品久久久久久国产越南 | 日本免费高清色视频在线观看 | 久久精品国产日本波多麻结衣 | 日韩在线视频观看免费网站 | 色就色综合偷拍区91网 | 欧美日韩国产综合网 | 日韩精品美腿丝袜 | 91麻豆国产福利精品 | 国产一卡2卡3卡4卡网站免费 | 日本做暖暖影院免费视频大全 | 国产免国产免费 | 国产性夜夜春夜夜爽有声小说 | 91成人免费视频观看 |