<progress id="uuezx"></progress>
<th id="uuezx"></th>
  • <li id="uuezx"><acronym id="uuezx"><cite id="uuezx"></cite></acronym></li>

    大數據技術初學者該從何入手

    大數據技術范圍太寬了,主要還是看你專攻那個領域。大數據技術初學者該從何入手?基本的入門知識:概率統計、統計軟件、數據庫??梢匀ゴ髷祿搲纯?,里面有些前人的學習方法還有一些入門的書。不懂了你可以向論壇里面提問。大數據處理里面大部分都用Java語言了,不知道你這個學的怎么樣。你也可以自己先在電腦上搭建個Hadoop環境練練手。

      1.自己裝個小集群跑hadoop/hive,可以到cloudera網站上下現成的打包虛擬機??纯磆adoopinaction.這本書比權威指南容易懂很多。

      2.裝個cassandra什么的玩玩,在上面架個小項目,比如留言板什么的。

      3.讀一些著名的paper,nosql的或者mapreduce。

      4.看看apachehadoop家族的其他幾個項目,比如zookeeper,pig,了解一下生態圈

      到這里為止你大概有個概念,知道bigdata怎么回事了。

      大數據技術初學者該從何入手?數據科學并沒有一個獨立的學科體系,統計學,機器學習,數據挖掘,數據庫,分布式計算,云計算,信息可視化等技術或方法來對付數據。

      但從狹義上來看,我認為數據科學就是解決三個問題:

      1.datapre-processing;(數據預處理)

      2.datainterpretation;(數據解讀)

      3.datamodelingandanalysis.(數據建模與分析)

      這也就是我們做數據工作的三個大步驟:

      1、原始數據要經過一連串收集、提取、清洗、整理等等的預處理過程,才能形成高質量的數據;

      2、我們想看看數據“長什么樣”,有什么特點和規律;

      3、按照自己的需要,比如要對數據貼標簽分類,或者預測,或者想要從大量復雜的數據中提取有價值的且不易發現的信息,都要對數據建模,得到output。

      這三個步驟未必嚴謹,每個大步驟下面可能依問題的不同也會有不同的小步驟,但按我這幾年的經驗來看,按照這個大思路走,數據一般不會做跑偏。

      大數據技術初學者該從何入手?大數據更多是工程的東西,不是那么學術,多看看比深挖一個對初學者更有好處。每個工具被發明,都是解決一個特定問題的,大數據沒有一個產品是萬能的,都是解決某個特定問題來的,看到新鮮事物就想想為什么需要這樣的工具,背后有什么需求。

      數據要靠實踐多一點。在真的上百上千節點的cluster上跑hadoop和自己虛擬機架的完全不同。cluster上跑各種奇葩的事情單機都是碰不到的。所以最終還是要找個公司實習。不過如果上面幾個都做到的花,基本上應聘大數據公司問題不大了。

      大數據技術初學者該從何入手?如果你想快速進入大數據行業的話,培訓是一個非常好的途徑,北大青鳥合肥一元中心是合肥專業的大數據培訓機構,來這里,4個月讓你精通大數據。詳情請聯系我們的在線老師。

    上下文導航
    相關內容
    全國熱線

    0551-69117050

    咨詢服務熱線:8:00-23:00

    合肥一元教育咨詢有限公司版權所有 如有圖片侵權請及時聯系本站,將及時刪錯或更改

    皖ICP備13012660號-1

    在線咨詢
    電話咨詢
    Tel:0551-69117050
    微信

    掃一掃
    歡迎微信咨詢

    QQ咨詢
    返回頂部