采集記錄足夠多的數(shù)據(jù),使工作更加針對化和精準化,這是大數(shù)據(jù)嗎?這不是大數(shù)據(jù)而只是數(shù)據(jù)化。
什么是大數(shù)據(jù)呢?例如洛杉磯警方曾對以往的刑事案件做了統(tǒng)計,通過算法得出了第二天的高概率犯罪地點,然后有針對性的派警察去該處巡邏,從而使得當?shù)氐姆缸铿F(xiàn)象下降20%。這是大數(shù)據(jù)。
再比如,經(jīng)濟學家都認為股票無法預測,而一位劍橋大學畢業(yè)的博士搞了個公司,對有史以來幾乎所有的證券交易的數(shù)據(jù)進行記錄,然后通過算法進行分析。
他對什么國家政策、公司業(yè)績、行業(yè)走向等等一眼都不看,100%地排除主觀意志的,只根據(jù)計算結果來進行投資,最后賺了大錢。這是大數(shù)據(jù)。
大數(shù)據(jù)的精髓并不在于數(shù)據(jù)的精準和數(shù)量,而在于對內(nèi)在規(guī)律的挖掘和對未來趨勢的預測。其思路是:一個結果是有很多原因的,原因作用的強度可能是隨機的,我們對其中作用的機理并不清楚。
我們難以找出規(guī)律性,但知道規(guī)律性就蘊含在結果數(shù)據(jù)之中,如果我們能建設合適的模型,寫出好的算法,就有可能把這個規(guī)律性提煉出來,從而能科學地發(fā)現(xiàn)真相和預測未來。
今天上午在貴州省大數(shù)據(jù)中心看到了大數(shù)據(jù)應用的事例。
金潤建設和鵬潤達這兩家企業(yè)分別投標200多次,一次也沒中過,依然積極地投。投標是要成本的,這兩家公司那里來的動力?
通過大數(shù)據(jù)的知識挖掘技術,發(fā)現(xiàn)了它們總是陪著固定的一家公司一同招標,最后總是那家公司中標。圍標、串標、陪標的秘密被大數(shù)據(jù)挖掘出來了?
數(shù)據(jù)蘊含著無窮的價值,大數(shù)據(jù)就是“鉆石礦”,但必須善于挖掘。