許多公司已經(jīng)在積極使用大數(shù)據(jù),只是它們沒有稱之為大數(shù)據(jù)罷了。雖然“大數(shù)據(jù)”一詞有諸多爭議,可是這項(xiàng)技術(shù)還是變得對公司業(yè)務(wù)來說必不可少。
大數(shù)據(jù)
據(jù)Dresner咨詢服務(wù)公司的一項(xiàng)新調(diào)查顯示,結(jié)果發(fā)現(xiàn),沒有人知道大數(shù)據(jù)到底是啥東西;大概同樣數(shù)量的公司實(shí)際上在用大數(shù)據(jù)處理有意義的任務(wù)。
是不是覺得很吃驚?
你應(yīng)該不會吃驚。畢竟,盡管多年前就有人預(yù)言大數(shù)據(jù),可是大多數(shù)公司仍在努力將小數(shù)據(jù)充分利用起來。
這倒不是說大數(shù)據(jù)并不是很重要,也不是說如今許多公司沒有從數(shù)據(jù)中獲得重大價值。大數(shù)據(jù)很重要,許多公司也在從數(shù)據(jù)切實(shí)獲得好處。但是,想從大數(shù)據(jù)獲得價值,許 多公司首先要變得務(wù)實(shí)。
誰需要大數(shù)據(jù)?
正如Datamation雜志的詹姆斯·馬奎爾(James Maguire)所寫,Dresner咨詢服務(wù)公司并沒有看到大數(shù)據(jù)大范圍采用的現(xiàn)象。
只有17%的公司承認(rèn)如今在使用大數(shù)據(jù),另有47%推遲到未來使用,但何時使用還不確定。如此看來,難怪報告的作者得出結(jié)論:“盡管經(jīng)過了長期的造聲勢和炒作,可是眼下,大數(shù)據(jù)分析技術(shù)的實(shí)際部署還是無法廣泛適用于大多數(shù)企業(yè)組織?!?
大數(shù)據(jù),啥也不是?
答案是否定的。畢竟,報告的調(diào)查對象中59%又聲稱,大數(shù)據(jù)“至關(guān)重要”,盡管明顯沒有用大數(shù)據(jù)來處理任何任務(wù)。顯然這里有某個因素在作祟……
我認(rèn)為,這“某個因素”完全是確定性的。
你不斷使用那個詞……
早在2012年,NewVantage Partners就顛覆了公眾對于大數(shù)據(jù)中的“大”的實(shí)際含義的認(rèn)識。盡管媒體大肆報道PB級數(shù)據(jù)問題,幕后推手基本上是Hadoop及其生態(tài)系統(tǒng)的廠商,但事實(shí)上,大多數(shù)公司并不存在所謂的PB級數(shù)據(jù)問題。
正如這項(xiàng)調(diào)查所發(fā)現(xiàn)的那樣,大多數(shù)公司面臨的主要問題還是數(shù)據(jù)的種類和速度。
市場終于開始心領(lǐng)神會,將越來越多的資金投入到可以更輕松地管理不同類型數(shù)據(jù)的技術(shù)(比如MongoDB等NoSQL數(shù)據(jù)庫和DataStax版本的Cassandra),以及處理流數(shù)據(jù)的技術(shù)(比如Apache Spark)。
與此同時,企業(yè)繼續(xù)求助于更傳統(tǒng)的數(shù)據(jù)基礎(chǔ)設(shè)施,比如甲骨文數(shù)據(jù)基礎(chǔ)設(shè)施。正如DB-Engines在2015年年底盤點(diǎn)中發(fā)現(xiàn)的那樣,就總的人氣而言,甲骨文是去年提升幅度最大的廠商(從發(fā)布崗位、技術(shù)論壇提及率和谷歌搜索等方面來衡量)。
超過風(fēng)頭甚勁的NoSQL,超過云優(yōu)先的亞馬遜,超過其他任何廠商或技術(shù)。
當(dāng)然,甲骨文的這種人氣抬升一方面與大數(shù)據(jù)毫無關(guān)系,而是緣于管理整齊的行列數(shù)據(jù)。但是從NewVantage Partners的調(diào)查數(shù)據(jù)來看,這種比較“小”的數(shù)據(jù)仍是大多數(shù)大數(shù) 據(jù)分析技術(shù)的處理對象。
另外拋開這種結(jié)構(gòu)化數(shù)據(jù),我懷疑許多公司仍沒有認(rèn)為多種多樣、高速度的數(shù)據(jù)是“大數(shù)據(jù)”。這可能是很少有公司聲稱在用大數(shù)據(jù)處理許多任務(wù)的一個原因。正如MySQL數(shù)據(jù)庫工程師賈斯汀·斯旺哈特(Justin Swanhart)所說:“大數(shù)據(jù)毫無意義。你還不如問別人他們想要什么顏色的數(shù)據(jù)庫?!?
簡而言之,大數(shù)據(jù)活蹦亂跳,但是許多公司未必認(rèn)為它是“大數(shù)據(jù)”。
那又如何?
對于正在想自己是不是被大數(shù)據(jù)甩在后頭的企業(yè)來說,現(xiàn)在別再瞎擔(dān)心了。正如Gartner的分析師尼克·霍德克(Nick Heudecker)所說,“大數(shù)據(jù)”已遷移到更熟悉的類別:
先進(jìn)分析和數(shù)據(jù)科學(xué)
商業(yè)智能和分析
企業(yè)信息管理
內(nèi)存中計算技術(shù)
信息基礎(chǔ)設(shè)施
大多數(shù)企業(yè)已經(jīng)在搞充分利用大數(shù)據(jù)的項(xiàng)目,它們只是根本沒有稱之為大數(shù)據(jù)。即使如此,還是有大量工作要做。正如麻省理工學(xué)院斯隆學(xué)院數(shù)字商業(yè)中心的研究員邁克爾·施拉格(Michael Schrage)所說:
“預(yù)測分析最深遠(yuǎn)的影響不是來自從數(shù)量上改進(jìn)預(yù)測的質(zhì)量,而是來自從根本上改變企業(yè)組織考慮問題和機(jī)會的角度?!?
換句話說,許多公司可能已經(jīng)擁有將大數(shù)據(jù)充分利用起來的必要技術(shù)。它們?nèi)鄙俚氖?,渴望從根本上改變將那些?shù)據(jù)充分利用起來的方式。有一群分析員解讀數(shù)據(jù)是一回事,利用那些分析結(jié)果、促動公司業(yè)務(wù)的實(shí)時變化是另一回事。
這不是你從某家廠商所能買到的那種東西。它一定需要在企業(yè)的DNA內(nèi)部發(fā)生變化。既要更準(zhǔn)確地了解大數(shù)據(jù),又要用大數(shù)據(jù)切實(shí)處理一些任務(wù),企業(yè)確實(shí)面臨艱巨的任務(wù)。
原文標(biāo)題: Big data's big problem? Most companies don't realize they're already using it
編輯:apple.lei