| 企服解答
數據分為三類,一種叫結構化數據,一種叫非結構化數據,還有一種叫半結構化數據。
大數據簡單介紹
1、結構化數據
即固定格式和有限長度的數據。例如填的表格數據,姓名:xxx,名族:漢,性別:男。這都叫結構化數據。
2、非結構化數據
現在的非結構數據越來越多,比如網頁,有的網頁很長有的很短;還有就是語音﹑視頻﹑圖片這些都是非結構化數據。
3、半結構化數據
是一些XML或者HTML的格式,沒有從事技術的人可能對這部分數據不太了解,不過沒有關系,我們只需要知道這部分數據是介于結構化和非結構化數據之間的數據,即部分格式化和有限長度的數據,部分沒有格式化和固定長度的數據。
| 拓展閱讀
截止到目前來說,人類社會的數據的產生大致分為三個階段:運營式系統階段、用戶原創內容階段和感知式系統階段。
1、運營式系統階段
可以說是從數據庫的誕生開始的。大型超市銷售系統、銀行交易系統、股市交易系統、醫療系統、企業客戶管理系統等等,這些系統都是建立在數據庫之上的。他們用數據庫保存大量結構化的關鍵信息,用來滿足企業的各個業務需求。這個階段,數據的產生是被動的,只有當業務真正發生時,才會產生新的數據并保存到數據庫中。如股市的交易系統,只有發生一筆交易后,才會有相關記錄生成。
2、用戶原創內容階段
互聯網的出現,使得數據的傳播更加快捷。web1.0時代主要以門戶網站為代表,強調內容的組織和數據的共享,上網用戶本身并不產生。真正的數據爆發產生于以“用戶原創內容”為特征的web2.0時代,如wiki,博客,微博,微信,論壇等等這樣的技術。這個時候,用戶是數據的生成者,尤其當智能手機的普及,更是讓用戶隨時隨地的發微博,傳照片,數據量急劇增長。
3、感知式系統階段
物聯網的發展最終導致了人類社會數據量的第三次飛躍。物聯網中包含了大量的傳感器,如溫度傳感器,濕度傳感器,壓力傳感器,位移傳感器,光電傳感器等,再如視頻監視攝像頭也是物聯網的重要組成部分。物聯網中的這些設備,無時無刻不在產生大量數據。與web2.0時代的人工數據的產生方式相比,物聯網中的數據自動產生方式,將在短時間內生成更密集,更大量的數據,使得人類社會迅速進入“大數據時代”
[免責聲明]
文章標題: 大數據簡單介紹
文章內容為網站編輯整理發布,僅供學習與參考,不代表本網站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發送郵件至36dianping@36kr.com,我們會在3個工作日內處理。