| 企服解答
大數(shù)據(jù)指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價(jià)值密度低和處理速度快四大特征。
1、數(shù)據(jù)體量巨大
伴隨著各種隨身設(shè)備、物聯(lián)網(wǎng)和云計(jì)算、云存儲(chǔ)等技術(shù)的發(fā)展,人和物的所有軌跡都可以被記錄,數(shù)據(jù)因此被大量生產(chǎn)出來(lái)。
移動(dòng)互聯(lián)網(wǎng)的核心網(wǎng)絡(luò)節(jié)點(diǎn)是人,不再是網(wǎng)頁(yè),人人都成為數(shù)據(jù)制造者,短信、微博、照片、錄像都是其數(shù)據(jù)產(chǎn)品;數(shù)據(jù)來(lái)自無(wú)數(shù)自動(dòng)化傳感器、自動(dòng)記錄設(shè)施、生產(chǎn)監(jiān)測(cè)、環(huán)境監(jiān)測(cè)、交通監(jiān)測(cè)、安防監(jiān)測(cè)等;來(lái)自自動(dòng)流程記錄,刷卡機(jī)、收款機(jī)、電子不停車收費(fèi)系統(tǒng),互聯(lián)網(wǎng)點(diǎn)擊、電話撥號(hào)等設(shè)施以及各種辦事流程登記等。
大量自動(dòng)或人工產(chǎn)生的數(shù)據(jù)通過(guò)互聯(lián)網(wǎng)聚集到特定地點(diǎn),包括電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)運(yùn)營(yíng)商、政府、銀行、商場(chǎng)、企業(yè)、交通樞紐等機(jī)構(gòu),形成了大數(shù)據(jù)之海。
2、數(shù)據(jù)類型繁多
隨著傳感器、智能設(shè)備以及社交協(xié)作技術(shù)的飛速發(fā)展,組織中的數(shù)據(jù)也變得更加復(fù)雜,因?yàn)樗粌H包含傳統(tǒng)的關(guān)系型數(shù)據(jù),還包含來(lái)自網(wǎng)頁(yè)、互聯(lián)網(wǎng)日志文件(包括點(diǎn)擊流數(shù)據(jù))、搜索索引、社交媒體論壇、電子郵件、文檔、主動(dòng)和被動(dòng)系統(tǒng)的傳感器數(shù)據(jù)等原始、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)格式變得越來(lái)越多樣,涵蓋了文本、音頻、圖片、視頻、模擬信號(hào)等不同的類型;數(shù)據(jù)來(lái)源也越來(lái)越多樣,不僅產(chǎn)生于組織內(nèi)部運(yùn)作的各個(gè)環(huán)節(jié),也來(lái)自于組織外部。
3、價(jià)值密度低
以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒。
4、處理速度快
1秒定律。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及遍布地球各個(gè)角落的各種各樣的傳感器,無(wú)一不是數(shù)據(jù)來(lái)源或者承載的方式。
| 拓展閱讀
今天我們常說(shuō)的大數(shù)據(jù)其實(shí)是在2000年后,因?yàn)樾畔⒔粨Q、信息存儲(chǔ)、信息處理三個(gè)方面能力的大幅增長(zhǎng)而產(chǎn)生的數(shù)據(jù)。
1、信息交換
據(jù)估算,從1986年到2007年這20年間,地球上每天可以通過(guò)既有信息通道交換的信息數(shù)量增長(zhǎng)了約217倍,這些信息的數(shù)字化程度,則從1986年的約20%增長(zhǎng)到2007年的約99.9%。在數(shù)字化信息爆炸式增長(zhǎng)的過(guò)程里,每個(gè)參與信息交換的節(jié)點(diǎn)都可以在短時(shí)間內(nèi)接收并存儲(chǔ)大量數(shù)據(jù)。
2、信息存儲(chǔ)
全球信息存儲(chǔ)能力大約每3年翻一番。從1986年到2007年這20年間,全球信息存儲(chǔ)能力增加了約120倍,所存儲(chǔ)信息的數(shù)字化程度也從1986年的約1%增長(zhǎng)到2007年的約94%。1986年時(shí),即便用上我們所有的信息載體、存儲(chǔ)手段,我們也不過(guò)能存儲(chǔ)全世界所交換信息的大約1%,而2007年這個(gè)數(shù)字已經(jīng)增長(zhǎng)到大約16%。信息存儲(chǔ)能力的增加為我們利用大數(shù)據(jù)提供了近乎無(wú)限的想象空間。
3、信息處理
有了海量的信息獲取能力和信息存儲(chǔ)能力,我們也必須有對(duì)這些信息進(jìn)行整理、加工和分析的能力。谷歌、Facebook等公司在數(shù)據(jù)量逐漸增大的同時(shí),也相應(yīng)建立了靈活、強(qiáng)大的分布式數(shù)據(jù)處理集群。
[免責(zé)聲明]
文章標(biāo)題: 什么是大數(shù)據(jù),大數(shù)據(jù)有什么特點(diǎn)
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)溝通。發(fā)送郵件至36dianping@36kr.com,我們會(huì)在3個(gè)工作日內(nèi)處理。