| 企服解答
大數(shù)據(jù)的定義:大數(shù)據(jù),又稱巨量資料,指的是所涉及的數(shù)據(jù)資料量規(guī)模巨大到無法通過人腦甚至主流軟件工具,在合理時間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
大數(shù)據(jù)的概念:簡單來說,大數(shù)據(jù)就是規(guī)模很大的數(shù)據(jù)。大數(shù)據(jù)的核心價值在于存儲和分析海量數(shù)據(jù);大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握大量數(shù)據(jù)信息,而在于專業(yè)處理這些有意義的數(shù)據(jù)。數(shù)據(jù)主要分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)。
大數(shù)據(jù)定義和概念
1、結(jié)構(gòu)化數(shù)據(jù)
結(jié)構(gòu)化數(shù)據(jù)是具備一定模式或者結(jié)構(gòu)的數(shù)據(jù),這些數(shù)據(jù)在一個記錄文件中以固定的格式存在,比如說我們常常遇見的存儲在數(shù)據(jù)庫中的表格數(shù)據(jù),這些數(shù)據(jù)有統(tǒng)一的固定格式,可以通過固有的鍵值對獲取到相應(yīng)信息。結(jié)構(gòu)化數(shù)據(jù)可以通過關(guān)系型數(shù)據(jù)庫來表示和存儲,但是我認(rèn)為首先要依賴一個數(shù)據(jù)模型,即這個數(shù)據(jù)模型指的是數(shù)據(jù)是怎樣被存儲的。這樣存儲在數(shù)據(jù)庫中的數(shù)據(jù)以二維形式表示:數(shù)據(jù)以行或列為單位,一行或者一列表示一條信息,每一行或每一列數(shù)據(jù)的屬性是相同的。
2、非結(jié)構(gòu)化數(shù)據(jù)
與結(jié)構(gòu)化數(shù)據(jù)相反的是非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)具備模式,非結(jié)構(gòu)化數(shù)據(jù)是指信息沒有一個預(yù)先定義好的數(shù)據(jù)模型來表現(xiàn),所以稱為非結(jié)構(gòu)化數(shù)據(jù)。我們通常遇見的文本型數(shù)據(jù),比如這個文本型數(shù)據(jù)中存儲的是本篇文章的內(nèi)容;比如說文字型數(shù)據(jù),但是數(shù)據(jù)中又有很多像時間、數(shù)字的信息;再比如說圖像、音頻、視頻數(shù)據(jù)。就我知道的圖像數(shù)據(jù)而言,比如說對一個手寫數(shù)字(0-9)灰色圖片來說,如果圖片像素是[公式]的,那么這個圖片會以二進制數(shù)據(jù)0/1通過一個32行32列的矩陣存儲。
3、半結(jié)構(gòu)化數(shù)據(jù)
半結(jié)構(gòu)化數(shù)據(jù)是介于結(jié)構(gòu)化數(shù)據(jù)(如關(guān)系型數(shù)據(jù)庫)和非結(jié)構(gòu)的數(shù)據(jù)(如聲音、圖像文件等)之間的數(shù)據(jù)。它的數(shù)據(jù)是有結(jié)構(gòu)的,但卻不方便模式化。XML和JSON文件是半結(jié)構(gòu)化數(shù)據(jù)的常見形式。由于這種數(shù)據(jù)的文本性質(zhì)及其與某種層次結(jié)構(gòu)的一致性,它比非結(jié)構(gòu)化數(shù)據(jù)更容易處理:因為沒有模式限定,數(shù)據(jù)可以自由流入、更新,在使用的時候模式起作用,構(gòu)建數(shù)據(jù)模式來搜索數(shù)據(jù)。
4、元數(shù)據(jù)
元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),主要指的是描述數(shù)據(jù)屬性的信息。這種類型的數(shù)據(jù)大多是機器生成的,可以附加到數(shù)據(jù)中。
| 拓展閱讀
目前來說,大數(shù)據(jù)在各個行業(yè)領(lǐng)域,都是有應(yīng)用的。
1、物聯(lián)網(wǎng)
物聯(lián)網(wǎng),是互聯(lián)網(wǎng)基礎(chǔ)上的延伸和擴展的網(wǎng)絡(luò),將各種信息傳感設(shè)備與互聯(lián)網(wǎng)結(jié)合起來而形成的一個巨大網(wǎng)絡(luò),實現(xiàn)在任何時間、任何地點,人、機、物的互聯(lián)互通。
2、智慧城市
智慧城市就是運用信息和通信技術(shù)手段感測、分析、整合城市運行核心系統(tǒng)的各項關(guān)鍵信息,從而對包括民生、環(huán)保、公共安全、城市服務(wù)、工商業(yè)活動在內(nèi)的各種需求做出智能響應(yīng)。
3、增強現(xiàn)實(AR)與虛擬現(xiàn)實(VR)
AR增強現(xiàn)實(Augmented Reality)技術(shù)是一種將虛擬信息與真實世界巧妙融合的技術(shù),廣泛運用了多媒體、三維建模、實時跟蹤及注冊、智能交互、傳感等多種技術(shù)手段,將計算機生成的文字、圖像、三維模型、音樂、視頻等虛擬信息模擬仿真后,應(yīng)用到真實世界中,兩種信息互為補充,從而實現(xiàn)對真實世界的“增強”。VR擬現(xiàn)實技術(shù)是一種可以創(chuàng)建和體驗虛擬世界的計算機仿真系統(tǒng),它利用計算機生成一種模擬環(huán)境,是一種多源信息融合的、交互式的三維動態(tài)視景和實體行為的系統(tǒng)仿真使用戶沉浸到該環(huán)境中。
4、區(qū)塊鏈
從科技層面來看,區(qū)塊鏈涉及數(shù)學(xué)、密碼學(xué)、互聯(lián)網(wǎng)和計算機編程等很多科學(xué)技術(shù)問題。從應(yīng)用視角來看,簡單來說,區(qū)塊鏈?zhǔn)且粋€分布式的共享賬本和數(shù)據(jù)庫。區(qū)塊鏈?zhǔn)欠植际綌?shù)據(jù)存儲、點對點傳輸、共識機制、加密算法等計算機技術(shù)的新型應(yīng)用模式。
5、語音識別
語音識別,其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。語音識別是一門交叉學(xué)科,所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
[免責(zé)聲明]
文章標(biāo)題: 大數(shù)據(jù)定義和概念
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點和對其真實性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內(nèi)處理。