<progress id="uuezx"></progress>
<th id="uuezx"></th>
  • <li id="uuezx"><acronym id="uuezx"><cite id="uuezx"></cite></acronym></li>

    什么是大數據

    大數據只是一個空洞的商業術語,就跟所謂的商業智能一樣空洞無物。當然,這并不是說大數據沒有意義,只是對于不同的人有不同的含義。

    對于投資人和創業者而言,大數據是個熱門的融資標簽。就和前幾年流行的 SoLoMo,這幾年火爆的 P2P 一樣,大數據是資本泡沫的催化劑。如今任何一家(移動)互聯網公司都忙著把自己標榜為大數據公司,或者干脆說自己是一家數據公司。遺憾的是,大多數中國的互聯網公司都是流量驅動的企業。與其說這些公司是大數據公司,不如說它們是數據采集公司。是的,每一家互聯網公司都是數據公司,因為數據(Data)是比信息(Information)要狹隘得多的詞匯。換句話說,任何一家 IT 行業的公司天然地都是數據公司。但是非 IT 公司同樣可以是數據公司,例如房地產企業和汽車銷售公司——畢竟他們優質低價地將顧客的信息轉賣給任何感興趣的個人或實體。遺憾的是,中國并沒有幾家 Pure-Play 的數據公司,因此中國不太可能出現 Palantir 這樣偉大的企業。我不幸見過一兩家國產獨角獸企業的技術/數據負責人,他們似乎并不了解這家 CIA 投資的創業公司,但這并不妨礙他們把自己的公司定位為世界級的大數據公司。我可以臆測,國內這些獨角獸企業的道德底線遠遠低于(為美帝情報機構服務的) Palantir,只是它們還沒有足夠的人才和技術來充分挖掘數據中的有效信息。

    對于大多數互聯網公司或者工程師而言,大數據實際上只有一個意思,就是把一堆亂七八糟的數據扔到 HDFS 上面然后進行計算。計算的工具有很多,最常見的是 Map-Reduce,但是技術一直在演進,現在還流行 Impala、Spark、Presto 什么的。對于這些搞大數據的工程師而言,這是一個非常好的事情,因為要把這么多異構的數據和系統跑起來,需要很多人寫很多代碼,還需要有人來做運維。這么一個部門總得需要幾十臺機器否則還不如單機計算能力強,工程師也得有十來人。然后可能還需要數據分析師,否則這部門跟擺設也沒什么區別。如果系統做得不錯數據量也有了,總得配個數據科學家搞點數據挖掘或者機器學習什么的吧。所以大數據這件事情可以解決很多就業問題,畢竟很多上了規模的互聯網公司都想搞大數據。

    但是對于消費者或者互聯網所謂的“用戶”來說,大數據卻是另外一個意思。大數據的意思就是盡可能地搜集跟終端消費者相關的隱私,然后進行營銷。從理論上說,大數據公司通過搜集用戶行為,可以更好地了解消費者的需求,增強用戶體驗。但是在實踐上,這些所謂的智能推薦還停留在很初級的階段,因此會有人在淘寶上搜索棺材結果在微博上不停地看到跟喪葬相關的廣告。對于微博這樣的公司,還意味著它會傾向于通過直接或者間接地暴露你的隱私來獲得商業利益。據說,評價一家國內公司的大數據能力是跟被查水表的頻繁程度正相關的。就目前而言,大數據對于終端消費者更多的是“被實名”。舉一個例子,如果你在 Android 手機上使用 Facebook 賬號訪問某個 App,那么對不起,你在這個手機上的所有行為都有可能被 Facebook 關聯到你真實的身份上。在這種能力上,國內的三巨頭排序大概是 T > A >> B。所以最后這家公司的 App 特別流氓甚至超越了數字公司,如果你想幫幫這家公司就多用用他家的地圖或者訂點外賣。

    想要咨詢了解更多IT行內知識 18356059605(微信同號)詳情咨詢 免費咨詢相送哦!

    上下文導航
    相關內容
    全國熱線

    0551-69117050

    咨詢服務熱線:8:00-23:00

    合肥一元教育咨詢有限公司版權所有 如有圖片侵權請及時聯系本站,將及時刪錯或更改

    皖ICP備13012660號-1

    在線咨詢
    電話咨詢
    Tel:0551-69117050
    微信

    掃一掃
    歡迎微信咨詢

    QQ咨詢
    返回頂部