性少妇vide0seⅹfree_国产剧情视频在线观看_日日碰夜夜爽_九九这里只有精品视频_性free毛茸茸偷窥videos_国产v亚洲

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 從基礎到深度解析Hadoop與Spark

從基礎到深度解析Hadoop與Spark

2017-01-19 15:20:04 | 來源:中培企業IT培訓網

Hadoop與Spark是當前兩個流行的大數據架構,也是非常重要的開源技術。對于Hadoop與Spark,業內很多專業人士都進行了對比分析。中培偉業《大數據Hadoop與Spark架構應用實戰》蔣老師在這里就Hadoop與Spark兩大架構的認識發表了自己的看法。

  Hadoop

Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業內的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) 和 Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統計。使用Map進行分詞,然后Reduce得到詞頻。

那經常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數據倉庫,可以通過Sql查詢和實現一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數據庫。模型也是產生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現。

你可能會聽到 Hadoop YARN ,YARN 是作業管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark

在Spark 出來之后看到有人說Spark會代替Hadoop 但經老師根據自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數據的處理和計算能力,它并沒有解決數據存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統,Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

標簽: 大數據架構
主站蜘蛛池模板: 亚洲综合激情在线 | 天天操天天操天天操 | 久久久精品人妻一区二区三区蜜桃 | 青青操在线 | 国产精品国产三级国产三不 | 久精品视频免费观看2 | 夜夜操夜夜爱 | 中文字幕在线观看一区 | 国产一区二区三区视频在线 | 久久成年片色大黄全免费网站 | 夭天干天天躁天天摸 | 亚洲综合五月婷婷 | yw在线观看| 国产劲爆久久 | 日本地区不卡一区二区三区搜索 | 伊人网免费视频 | 奇米影视7777狠狠狠狠视频 | 日本午夜三级视频 | 欧洲国产伦久久久久久久 | 久久综合久久综合九色 | 欧美日韩大片在线观看 | 91免费资源 | 老师办公室被吃奶好爽在线观看 | 日韩欧美中文字幕在线四区 | 亚洲午夜久久久精品一区二区三区 | 又粗又大又黄又硬又爽免费看 | 蜜桃视频一区二区三区在线观看 | 美女在线不卡 | 欧洲精品在线播放 | 91精品国产99久久 | 日韩 中文字幕 91 | 久久久影片 | 射精专区一区二区朝鲜 | 精品国产一区二区三区电影小说 | 中文字幕第13页 | 一区二区和激情视频 | α片毛片免费看 | 久久精品国产亚洲aⅴ瑜伽 国产又黄又爽刺激片 | 亚洲精品一区二区另类图片 | 国产对白刺激视频 | 国产精品 亚洲一区 |