日韩av片子_国产自在自线午夜精品视频在_使劲快高潮了国语对白在线_久久免费毛片大全_激情丁香综合_欧美成人精品欧美一级乱黄码

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 【專家視點】詳解Spark架構的性能與應用

【專家視點】詳解Spark架構的性能與應用

2017-01-20 11:47:59 | 來源:中培企業IT培訓網

Spark作為UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的并行計算框架,其基于map reduce算法實現的分布式計算,有Hadoop MapReduce所具有的優點;但不同于MapReduce的是Job中間輸出和結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數據挖掘與機器學習等需要迭代的map reduce的算法。其架構如下圖所示:spark-framwork

Spark與Hadoop的比較

Spark的中間數據放到內存中,對于迭代運算效率更高。 ?Spark更適合于迭代運算比較多的MLDM運算。因為在Spark里面,有RDD的抽象概念。 

SparkHadoop更通用。 ?Spark提供的數據集操作類型有很多種,不像Hadoop只提供了MapReduce兩種操作。比如map, filter, flatMap, sample, groupByKey, reduceByKey, union, join, cogroup, mapValues, sort,partionBy等多種操作類型,Spark把這些操作稱為Transformations。同時還提供Count, collect, reduce, lookup, save等多種actions操作。

這些多種多樣的數據集操作類型,給給開發上層應用的用戶提供了方便。各個處理節點之間的通信模型不再像Hadoop那樣就是唯一的Data Shuffle一種模式。用戶可以命名,物化,控制中間結果的存儲、分區等。可以說編程模型比Hadoop更靈活。 

不過由于RDD的特性,Spark不適用那種異步細粒度更新狀態的應用,例如web服務的存儲或者是增量的web爬蟲和索引。就是對于那種增量修改的應用模型不適合。 

容錯性。 在分布式數據集計算時通過checkpoint來實現容錯,而checkpoint有兩種方式,一個是checkpoint data,一個是logging the updates。用戶可以控制采用哪種方式來實現容錯。

可用性。 ?Spark通過提供豐富的Scala, JavaPython API及交互式Shell來提高可用性。

Spark與Hadoop的結合

Spark可以直接對HDFS進行數據的讀寫,同樣支持Spark on YARNSpark可以與MapReduce運行于同集群中,共享存儲資源與計算,數據倉庫Shark實現上借用Hive,幾乎與Hive完全兼容。

Spark的適用場景

Spark是基于內存的迭代計算框架,適用于需要多次操作特定數據集的應用場合。需要反復操作的次數越多,所需讀取的數據量越大,受益越大,數據量小但是計算密集度較大的場合,受益就相對較小

由于RDD的特性,Spark不適用那種異步細粒度更新狀態的應用,例如web服務的存儲或者是增量的web爬蟲和索引。就是對于那種增量修改的應用模型不適合。 

總之Spark作為一種非常高校的分布式計算系統,其在互聯網行業當中擁有十分廣泛和通用的應用前景。

標簽: Spark
主站蜘蛛池模板: 红桃视频一区 | 欧洲-级毛片内射八十老太婆 | 欧美巨大丰满猛性社交 | 丁香色婷婷国产精品视频 | 硬汉视频官网在线观看 | 桃色成人网 | 久久国产乱子伦免费精品无码 | 91婷婷| 夜夜草福利视频 | 亚洲卡一卡二卡三乱草莓 | 欧美黑人巨大久久久精品一区 | 国产精品久久久久久久粉嫩 | 激情内射人妻1区2区3区 | 国产精品人妻一区二区三区a | 曰批全过程免费视频在线观看草莓 | 网站一区二区三区 | 亚洲美女久久久久 | 黄色片视频免费在线观看 | 女友莹莹的秘密调教69 | 国产农村妇女一区二区 | 九九热免费在线视频 | 性情中人中文网 | 中文字幕无码家庭乱欲 | 国产一级毛片视频 | 美女黄色毛片 | 日本69xxxxx | 人人做人人妻人人精 | 国产成人无码午夜视频在线观看 | 国产性插 | 夫妻性生活视频免费看 | 久久久久亚洲精品无码蜜桃 | 少妇愉情理伦片BD | 日本少妇一区二区三区 | 无码人妻国产一区二区三区 | 亚洲成人av免费看 | 亚洲国产精品成人久久久麻豆 | 亚洲xxxx在线观看 | 老司机福利入口 | 加勒比AV中文字幕不卡 | 国产一区二区三区视频播放 | 日本妇人成熟免费视频 |