1樓:加米穀大資料科技
hadoop:可靠的、可擴充套件的、分散式計算開源軟體。允許使用簡單的程式設計模型,在計算機叢集分散式地處理大型資料集。
可以從單個伺服器擴充套件到數千臺機器,每個機器都提供本地計算和儲存。
hadoop能幹什麼?
大資料儲存:分散式儲存
日誌處理:擅長日誌分析
etl:資料抽取到oracle、mysql、db2、mongdb及主流資料庫
機器學習: 比如apache mahout專案
搜尋引擎:hadoop + lucene實現
hadoop是專為離線和大規模資料分析而設計的。
大資料和hadoop什麼關係?為什麼大資料要學習hadoop?
2樓:資料分析
hadoop是一個由apache**會所開發的分散式系統基礎架構。使用者可以在不瞭解分散式底層細節的情況下,開發分散式程式。充分利用叢集的威力進行高速運算和儲存。
hadoop實現了一個分散式檔案系統(hadoop distributed file system),簡稱hdfs。hdfs有高容錯性的特點,並且設計用來部署在低廉的(low-cost)硬體上;而且它提供高吞吐量(high throughput)來訪問應用程式的資料,適合那些有著超大資料集(large data set)的應用程式。hdfs放寬了(relax)posix的要求,可以以流的形式訪問(streaming access)檔案系統中的資料。
hadoop的框架最核心的設計就是:hdfs和mapreduce。hdfs為海量的資料提供了儲存,而mapreduce則為海量的資料提供了計算.
一般來說資料的儲存都是用hadoop叢集的,但是如果你是做資料分析的其實不一定學習hadoop,資料分析的主要用hive寫sql**,或者是spark。這些都是在hadoop之上的。hadopp偏底層。
對做大資料開發的人來說hadoop是基礎了。
hadoop是什麼要學多長時間?
3樓:匿名使用者
差不多要半年,到魔據條件不錯,很注重基礎教育,看合不合適。如果沒有基礎一般需要5個月,雖然剛開始有些枯燥,薪資不錯。
為什麼學校裡學習雲端計算或者大資料都要從hadoop開始
4樓:八維教育
我來給你分享下我的想法 1、 hadoop開源,更容易拿到源**等,微軟等相關產品都是閉源的。hadoop和微軟就好比安卓和ios。市面上華為,小米,三星基本上都在google開源android的基礎上二次開發成自己的rom。
2、 大資料現在是中國的十三五國家戰略,大資料火啊,而apache hadoop現在已經發展成一個龐大的生態圈。全球各地的開發者都在貢獻者自己的**。各個分支也是相當火爆,例如spark。
3、 現在普遍認為,大資料狹義的代表就是hadoop,其實並不是這樣,現在大資料公司有很多, 有做大資料基礎平臺的,例如星環科技,mapr,hortonwork,cloudera,這四家應該是現在全球頂尖top4了,3家美國矽谷的,一家中國上海的。這四家都是基於開源hadoop發展起來的。 有mpp架構的dw產品,例如teredata,gp,ibm等 有做上層資料應用的,這類公司非常多,很多需要賣人力工時。
也有現在賣資料的公司,這種公司也非常多。
hadoop通俗點說是什麼?應該怎麼學?有哪些前提的知識條件嗎? 200
房事和雲雨究竟有什麼關係,為何要把房事稱為「雲雨」
古人為什麼把房事稱為雲雨 古代 不論是傳奇 言情 還是 紅樓夢 水滸傳 等古典名著,寫到男女進 事的時候,無一例外地寫道,共赴巫山雲雨 或者 不免雲雨一番 曹雪芹在 紅樓夢 第六回 寶玉初試雲雨情 中寫的就是賈寶玉與丫環襲人房事之時的情景 即便是現代的一些 也效法古人,常有 某 攜某美女到某大酒店 ...
張作霖和日軍之間什麼關係?為什麼東北駐有日軍隊
張作霖可以說是一個梟雄,從剛開始一個實力很小的山野土匪頭子一路 升 到了師長之後,又通過很多手段做到了 東北王 的位置,最後甚至成為了北洋 的首腦。當然,他們對於張作霖的支援也不是沒有條件的。日本人如此幫助張作霖的背後,也是想要張作霖成為東北王之後投桃報李,幫助他們在中國攫取利益。對於生活在島國上的...
微分和導數之間為什麼相等?他們有什麼關係?為什麼這個式子的l xl趨於零的時候有下面那個式子存在
微分和導數之間並不相等 他們之間的關係是變數與比 值的關係 如果兩個變數x和y的微分dx和dy成比例關係 dx kdy那麼我們就把這個比例數k叫做x對y的導數 那麼微分又是什麼呢?微分dx是對變數x的一種運算 具體地說就是變數由x變到x 的差值 x x x當這個差值足夠小,達到某種穩定狀態 見後述 ...