關(guān)于大數(shù)據(jù)的四大特點還有三大特征
進入2012年以來,大數(shù)據(jù)(Big株Data)一詞被越來越多的人提及和使用,人們用它來描述和定義信息爆炸時代產(chǎn)生的大數(shù)據(jù),大家從互聯(lián)網(wǎng)進入大數(shù)據(jù)時代,都是透明的存在.各種各樣的數(shù)據(jù)迅速膨脹變大,它決策著企業(yè)的未來發(fā)展,盡管如今企業(yè)可能并不是意識到數(shù)據(jù)爆炸性增長帶來難題的隱患,但隨之時間的推移,人們將會愈來愈意識到數(shù)據(jù)對企業(yè)的重要性.關(guān)于大數(shù)據(jù)的四個特三個特點.
.大數(shù)據(jù)的四個特點
.1、大容量
.例如,IDC最近的報告預(yù)測到2020年,世界數(shù)據(jù)量將擴大50倍.目前,大數(shù)據(jù)的規(guī)模仍然是不斷變化的指標,單一數(shù)據(jù)集的規(guī)模范圍從數(shù)十TB到數(shù)PB不同.簡單來說,存儲1PB數(shù)據(jù)需要2萬臺配備50GB硬盤的PC.此外,各種意想不到的來源可以產(chǎn)生數(shù)據(jù).
.2、多樣性
.
數(shù)據(jù)多樣性的增加主要是由于網(wǎng)絡(luò)日志、社交媒體、網(wǎng)絡(luò)檢索、手機通話記錄、傳感器網(wǎng)絡(luò)等數(shù)據(jù)類型.
.3、高速
.高速描述的是數(shù)據(jù)創(chuàng)建和移動的速度.在高速網(wǎng)絡(luò)時代,通過實現(xiàn)軟件性能優(yōu)化的高速計算機處理器和服務(wù)器,創(chuàng)建實時數(shù)據(jù)流已成為流行趨勢.企業(yè)不僅要知道如何快速創(chuàng)建數(shù)據(jù),還要知道如何快速處理、分析和返回用戶,以滿足他們的實時需求.
.4、易變性
.
大數(shù)據(jù)具有多層結(jié)構(gòu),意味著大數(shù)據(jù)呈現(xiàn)多變形式和類型.與傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)相比,大數(shù)據(jù)具有不規(guī)則和模糊的特性,很難使用傳統(tǒng)的應(yīng)用程序進行分析.傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)隨著時間的推移而具有標準的格式,可以被標準的業(yè)務(wù)智能軟件識別.目前,企業(yè)面臨的挑戰(zhàn)是處理和從各種形式呈現(xiàn)的復(fù)雜數(shù)據(jù)中挖掘價值.
.大數(shù)據(jù)的三個特征
.首要特點是數(shù)據(jù)類型多.包括網(wǎng)絡(luò)日志、音頻、視頻、圖像、地理位置信息等多種數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求.
.第二個特點是數(shù)據(jù)價值密度相對較低.隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無處不在,信息龐大,但價值密度低,如何通過強大的機械算法更快地完成數(shù)據(jù)的價值純化是大數(shù)據(jù)時代必須解決的難題.
.第三個特點是處理速度快,時效性要求高.這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征.
.