日韩av片子_国产自在自线午夜精品视频在_使劲快高潮了国语对白在线_久久免费毛片大全_激情丁香综合_欧美成人精品欧美一级乱黄码

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 大數(shù)據(jù) > 從基礎到深度解析Hadoop與Spark

從基礎到深度解析Hadoop與Spark

2017-01-19 15:20:04 | 來源:中培企業(yè)IT培訓網(wǎng)

Hadoop與Spark是當前兩個流行的大數(shù)據(jù)架構,也是非常重要的開源技術。對于Hadoop與Spark,業(yè)內(nèi)很多專業(yè)人士都進行了對比分析。中培偉業(yè)《大數(shù)據(jù)Hadoop與Spark架構應用實戰(zhàn)》蔣老師在這里就Hadoop與Spark兩大架構的認識發(fā)表了自己的看法。

  Hadoop

Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發(fā)誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業(yè)內(nèi)的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) 和 Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統(tǒng)計。使用Map進行分詞,然后Reduce得到詞頻。

那經(jīng)常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數(shù)據(jù)倉庫,可以通過Sql查詢和實現(xiàn)一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數(shù)據(jù)庫。模型也是產(chǎn)生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現(xiàn)。

你可能會聽到 Hadoop YARN ,YARN 是作業(yè)管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark

在Spark 出來之后看到有人說Spark會代替Hadoop 但經(jīng)老師根據(jù)自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數(shù)據(jù)的處理和計算能力,它并沒有解決數(shù)據(jù)存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統(tǒng),Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

主站蜘蛛池模板: 一个人看的www免费观看视频 | 美女做爰内谢免费网站 | 久久久久国产精品一区二区三区 | 欧美一级特黄aaa大片在线观看 | 久久999精品久久久有什么优势 | 成人午夜影片 | 懂色av中文一区二区在 | 亚洲AV无码一区二区三区网址 | 国产V在线最新观看视频 | 973理论片235影院| 超碰在线视频人人湿人人澡com | 四虎影视久久久免费 | 狠狠色噜噜狠狠狠狠888奇禾 | 三级理论 | 久草资源视频 | 日本美女影院 | 人人草人人搞 | 亚洲国产精品成人一区二区 | 91香蕉影院 | 欧美a大片欧美片 | 国产帅男男GAY网站视频 | 欧美激情综合亚洲一二区 | 99久久人妻精品免费二区 | 欧美精选视频 | 无码国产乱人伦偷精品视频 | 性欧美videos | 亚洲视频高清无码 | 亚洲美女久久久久 | 91国偷自产一区二区三区老熟女 | 亚州AⅤ中文Aⅴ无码Aⅴ | 日韩久久久精品首页一本在线免费视频 | 午夜精品久久久久久久久久久久久蜜桃 | 免费国产黄色大片 | 一色屋精品视频在线观看 | 麻豆影视在线免费观看 | AV无码精品1区2区3区 | 国产喷水1区2区3区咪咪爱AV | 久爱WWW人成免费网站 | 欧美大杂交18p | 国产丝袜精品视频 | 亚洲777理论|