Spark是什麼?用Spark進行數據分析 - Big Data in Finance

文章推薦指數: 80 %
投票人數:10人

  (來源:36大數據) Apache Spark是一個為速度和通用目標設計的集群計算平台。

從速度的角度看,Spark從流行的MapReduce模型繼承而來,可以更有效地支持多種類型的計算,如交互式查詢和流處理。

速度在大數據集的處理中非常重要,它可以決定用戶可以交互式地處理數據,還是等幾分鐘甚至幾小時。

Spark為速度提供的一個重要特性是其可以在內存中運行計算,即使對基於磁盤的複雜應用,Spark依然比MapReduce更有效。

從通用性來說,Spar



請為這篇文章評分?