五月天堂网_免费看影片_1024手机看毛片_亚洲综合四区_男人的天堂影院_在线亚洲自拍

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 從基礎到深度解析Hadoop與Spark

從基礎到深度解析Hadoop與Spark

2017-01-19 15:20:04 | 來源:中培企業IT培訓網

Hadoop與Spark是當前兩個流行的大數據架構,也是非常重要的開源技術。對于Hadoop與Spark,業內很多專業人士都進行了對比分析。中培偉業《大數據Hadoop與Spark架構應用實戰》蔣老師在這里就Hadoop與Spark兩大架構的認識發表了自己的看法。

  Hadoop

Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業內的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) 和 Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統計。使用Map進行分詞,然后Reduce得到詞頻。

那經常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數據倉庫,可以通過Sql查詢和實現一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數據庫。模型也是產生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現。

你可能會聽到 Hadoop YARN ,YARN 是作業管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark

在Spark 出來之后看到有人說Spark會代替Hadoop 但經老師根據自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數據的處理和計算能力,它并沒有解決數據存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統,Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

標簽: 大數據架構
主站蜘蛛池模板: 九一精品视频 | 欧美日韩激情视频一区二区三区 | 在线中文字幕第一区 | 人妻饥渴偷公乱中文字幕 | 我们的2018高清在线观看 | 韩国私人vps啪啪 | 欧美精品在线第一页 | 中文字幕一区在线观看 | 国产精品毛片久久久久久久av | 国产亚洲欧美日韩在线一区二区三区 | 大香伊在人线免97 | 一级裸体黄色片 | 一起草视频在线播放 | 国产91xxx在线观看大全 | 亚洲欧洲在线视频 | 在线观看mv的中文字幕网站 | 欧美精产国品一二三产品区别在哪 | 一区二区三区午夜视频 | 精品永久久福利一区二区 | 日韩欧美成人激情 | 一本一道中文字幕 | 永久黄色网址 | 精品亚洲成a人片在线观看少妇 | 亚洲aⅴ天堂av在线电影软件 | 熟妇女人妻丰满少妇中文字幕 | 亚洲成人久久一区 | 日韩中文综合网 | 国产欧美日韩在线精品 | 亚洲欧美日韩精品 | a在线视频| 午夜福利免费a片在线观看无码 | 91桃色在线 | 国产精品丝袜一区二区三区 | 日本视频精品一区 | 天天摸夜夜添狠狠添高潮出水 | 国产三级黄色录像 | 亚洲伊人无码一区二区三区 | 一二三四视频高清在线观看 | 岳好紧好湿夹太紧了好爽矜持 | 午夜成在线www | 久久爽久久爽久久免费观看 |