說到大數(shù)據(jù),估計每個人都只聽過這個概念,但是關于它是什么以及如何定義它,并沒有標準的概念。因為在我們看來,很多公司都被稱為大數(shù)據(jù)公司,并且數(shù)百種業(yè)務形式。大數(shù)據(jù)不容易理解,所以建議從大數(shù)據(jù)的特征來理解大數(shù)據(jù),那么大數(shù)據(jù)的四大特征是什么?大數(shù)據(jù)具備數(shù)據(jù)體量巨大、數(shù)據(jù)速度快、數(shù)據(jù)類型繁多和數(shù)據(jù)價值密度低的特征。
大數(shù)據(jù)的四大特征是什么?
1.數(shù)據(jù)體量巨大:表示大數(shù)據(jù)的數(shù)據(jù)體量巨大。
數(shù)據(jù)集合的規(guī)模不斷擴大,已經(jīng)從GB級增加到TB級再增加到PB級,近年來,數(shù)據(jù)量甚至開始以EB和ZB來計數(shù)。
例如,一個中型城市的視頻監(jiān)控信息一天就能達到幾十TB的數(shù)據(jù)量。百度首頁導航每天需要提供的數(shù)據(jù)超過1-5PB,如果將這些數(shù)據(jù)打印出來,會超過5000億張A4紙。圖2展示了每分鐘互聯(lián)網(wǎng)產(chǎn)生的各類數(shù)據(jù)的量。
2.數(shù)據(jù)速度快:表示大數(shù)據(jù)的數(shù)據(jù)產(chǎn)生、處理和分析的速度在持續(xù)加快。
加速的原因是數(shù)據(jù)創(chuàng)建的實時性特點,以及將流數(shù)據(jù)結(jié)合到業(yè)務流程和決策過程中的需求。數(shù)據(jù)處理速度快,處理模式已經(jīng)開始從批處理轉(zhuǎn)向流處理。
業(yè)界對大數(shù)據(jù)的處理能力有一個稱謂——“1秒定律”,也就是說,可以從各種類型的數(shù)據(jù)中快速獲得高價值的信息。大數(shù)據(jù)的快速處理能力充分體現(xiàn)出它與傳統(tǒng)的數(shù)據(jù)處理技術(shù)的本質(zhì)區(qū)別。
3.數(shù)據(jù)類型繁多:表示大數(shù)據(jù)的數(shù)據(jù)類型繁多。
傳統(tǒng)IT產(chǎn)業(yè)產(chǎn)生和處理的數(shù)據(jù)類型較為單一,大部分是結(jié)構(gòu)化數(shù)據(jù)。隨著傳感器、智能設備、社交網(wǎng)絡、物聯(lián)網(wǎng)、移動計算、在線廣告等新的渠道和技術(shù)不斷涌現(xiàn),產(chǎn)生的數(shù)據(jù)類型無以計數(shù)。
現(xiàn)在的數(shù)據(jù)類型不再只是格式化數(shù)據(jù),更多的是半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù),如XML、郵件、博客、即時消息、視頻、照片、點擊流、日志文件等。企業(yè)需要整合、存儲和分析來自復雜的傳統(tǒng)和非傳統(tǒng)信息源的數(shù)據(jù),包括企業(yè)內(nèi)部和外部的數(shù)據(jù)。
4.數(shù)據(jù)價值密度低:表示大數(shù)據(jù)的數(shù)據(jù)價值密度低。
大數(shù)據(jù)由于體量不斷加大,單位數(shù)據(jù)的價值密度在不斷降低,然而數(shù)據(jù)的整體價值在提高。以監(jiān)控視頻為例,在一小時的視頻中,有用的數(shù)據(jù)可能僅僅只有一兩秒,但是卻會非常重要。現(xiàn)在許多專家已經(jīng)將大數(shù)據(jù)等同于黃金和石油,這表示大數(shù)據(jù)當中蘊含了無限的商業(yè)價值。
根據(jù)中商產(chǎn)業(yè)研究院發(fā)布的《2018-2023年中國大數(shù)據(jù)產(chǎn)業(yè)市場前景及投資機會研究報告》顯示,2017年中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模達到4700億元,同比增長30%。隨著大數(shù)據(jù)在各行業(yè)的融合應用不斷深化2018年中國大數(shù)據(jù)市場產(chǎn)值將突破6000億元達到6200億元。
通過對大數(shù)據(jù)進行處理,找出其中潛在的商業(yè)價值,將會產(chǎn)生巨大的商業(yè)利潤。
上述就是關于大數(shù)據(jù)的四大特征是什么的全部內(nèi)容,想了解更多關于大數(shù)據(jù)的信息,請繼續(xù)關注中培偉業(yè)。