五月天堂网_免费看影片_1024手机看毛片_亚洲综合四区_男人的天堂影院_在线亚洲自拍

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 使用Spark常見的一些問題

使用Spark常見的一些問題

2016-08-11 10:02:09 | 來源:中培企業IT培訓網

任何新技術的引入都會歷經陌生到熟悉,從最初新技術帶來的驚喜,到后來遇到困難時的一籌莫展和惆悵,再到問題解決后的愉悅,大數據新貴Spark同樣不能免俗。大數據Hadoop與Spark架構應用實戰》專家鐘老師介紹了Spark過程中常見的一些問題

問題一:跑很大的數據集的時候,會遇到org.apache.spark.SparkException: Error communicating with MapOutputTracker

這個錯誤報得很隱晦,從錯誤日志看,是Spark集群partition了,但如果觀察物理機器的運行情況,會發現磁盤I/O非常高。進一步分析會發現原因是Spark在處理大數據集時的shuffle過程中生成了太多的臨時文件,造成了操作系統磁盤I/O負載過大。找到原因后,解決起來就很簡單了,設置spark.shuffle.consolidateFiles為true。這個參數在默認的設置中是false的,對于linux的ext4文件系統,建議大家還是默認設置為true吧。Spark官方文檔的描述也建議ext4文件系統設置為true來提高性能。

問題二:運行時報Fetch failure錯

在大數據集上,運行Spark程序,在很多情況下會遇到Fetch failure的錯。由于Spark本身設計是容錯的,大部分的Fetch failure會經過重試后通過,因此整個Spark任務會正常跑完,不過由于重試的影響,執行時間會顯著增長。造成Fetch failure的根本原因則不盡相同。從錯誤本身看,是由于任務不能從遠程的節點讀取shuffle的數據,具體原因則需要利用:    

查看Spark的運行日志,從而找到造成Fetch failure的根本原因。其中大部分的問題都可以通過合理的參數配置以及對程序進行優化來解決。2014年Spark Summit China上陳超的那個專題,對于如何對Spark性能進行優化,有非常好的建議。

當然,在使用Spark過程中還遇到過其他不同的問題,不過由于Spark本身是開源的,通過源代碼的閱讀,以及借助開源社區的幫助,大部分問題都可以順利解決。

鐘老師最后總結道,Spark目前已經取得了長足的發展,圍繞Spark的大數據生態系統也逐漸的完善。Spark 1.3引入了一個新的DataFrame API,這個新的DataFrame API將會使得Spark對于數據的處理更加友好。同樣出自于AMPLab的分布式緩存系統Tachyon因為其與Spark的良好集成也逐漸引起了人們的注意。鑒于在業務場景中,很多基礎數據是需要被多個不同的Spark任務重復使用,下一步,我們將會在架構中引入Tachyon來作為緩存層。另外,隨著SSD的日益普及,我們后續的計劃是在集群中每臺機器都引入SSD存儲,配置Sparkshuffle的輸出到SSD,利用SSD的高速隨機讀寫能力,進一步提高大數據處理效率。

在機器學習方面,H2O機器學習引擎也和Spark有了良好的集成從而產生了Sparkling-water。相信利用Sparking-water,作為一家創業公司,我們也可以利用深度學習的力量來進一步挖掘數據的價值。

標簽: Spark
主站蜘蛛池模板: 成人国产精品一区二区网站公司 | 久久久无码人妻精品一区二区三区 | 2020年国产高中毛片在线视频 | 国产一区二区在线观看视频 | 污网址在线 | av在线一区二区三区四区 | 91看影院| 小仙女JK白丝袜美腿自慰 | a在线视频 | 中国chinesebdsm系列| 久久久久久久久国产精品毛片资源 | 91免费国产在线观看 | 亚洲一区中文字幕永久在线 | xxxxwww一片| 国产精品久久久久久久久久白浆 | 香蕉靠逼视频 | 男男激情网站 | 国语免费一级毛片私人 | 精品 一区 在线 | xxxnxxxx中国女人 | 黄一级片 | 成人国产精品一区在线观看播放 | 日本不卡高清 | 一区二区三区四区影院 | 无套内谢少妇高潮毛片 | 中文av电影 | 91视频免费版污 | 在线观看免费视频资源 | 超碰在线观看97 | 欧美一区二区三区日本 | av一区免费 | 欧美高清videossexo| 午夜影院一区二区三区 | 黄色免看| 欧美体内she精高潮 动漫被到爽动漫视频免费 男人操女人b | r日本韩国香港黄色影片三级网站 | 免费丰满少妇一级毛片 | 99riav3国产精品视频 | 精品欧美久久 | 日韩成人无码中文字幕 | 欧美性视频在线看 |