Spark是什麼?用Spark進行數據分析 - Big Data in Finance
文章推薦指數: 80 %
(來源:36大數據)
Apache Spark是一個為速度和通用目標設計的集群計算平台。
從速度的角度看,Spark從流行的MapReduce模型繼承而來,可以更有效地支持多種類型的計算,如交互式查詢和流處理。
速度在大數據集的處理中非常重要,它可以決定用戶可以交互式地處理數據,還是等幾分鐘甚至幾小時。
Spark為速度提供的一個重要特性是其可以在內存中運行計算,即使對基於磁盤的複雜應用,Spark依然比MapReduce更有效。
從通用性來說,Spar