大量、不完全、噪聲、模糊、隨機地挖掘數(shù)據(jù),發(fā)現(xiàn)隱含著對大數(shù)據(jù)有價值、潛在有用信息和知識的過程,也是一個決策支持過程。數(shù)據(jù)挖掘的基礎是人工智能,機器學習,模式學習,統(tǒng)計等。接下來小編就為大家介紹介紹數(shù)據(jù)挖掘的四種基本方法,感興趣的話不妨接著看下去吧!
數(shù)據(jù)挖掘的四種基本方法
(1)分類
分類是找出數(shù)據(jù)庫中的一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項映射到摸個給定的類別中。可以應用到涉及到應用分類、趨勢預測中,如淘寶商鋪將用戶在一段時間內的購買情況劃分成不同的類,根據(jù)情況向用戶推薦關聯(lián)類的商品,從而增加商鋪的銷售量。
(2)回歸分析
回歸分析反映了數(shù)據(jù)庫中數(shù)據(jù)的屬性值的特性,通過函數(shù)表達數(shù)據(jù)映射的關系來發(fā)現(xiàn)屬性值之間的依賴關系。它可以應用到對數(shù)據(jù)序列的預測及相關關系的研究中去。在市場營銷中,回歸分析可以被應用到各個方面。如通過對本季度銷售的回歸分析,對下一季度的銷售趨勢作出預測并做出針對性的營銷改變。
(3)聚類
聚類類似于分類,但與分類的目的不同,是針對數(shù)據(jù)的相似性和差異性將一組數(shù)據(jù)分為幾個類別。屬于同一類別的數(shù)據(jù)間的相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關聯(lián)性很低。
(4)關聯(lián)規(guī)則
關聯(lián)規(guī)則是隱藏在數(shù)據(jù)項之間的關聯(lián)或相互關系,即可以根據(jù)一個數(shù)據(jù)項的出現(xiàn)推導出其他數(shù)據(jù)項的出現(xiàn)。關聯(lián)規(guī)則的挖掘過程主要包括兩個階段:第一階段為從海量原始數(shù)據(jù)中找出所有的高頻項目組;第二極端為從這些高頻項目組產(chǎn)生關聯(lián)規(guī)則。關聯(lián)規(guī)則挖掘技術已經(jīng)被廣泛應用于金融行業(yè)企業(yè)中用以預測客戶的需求,各銀行在自己的ATM機上通過捆綁客戶可能感興趣的信息供用戶了解并獲取相應信息來改善自身的營銷。
數(shù)據(jù)挖掘是一種決策支持過程,它通過高度自動化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,減少風險,做出正確的決策,這對于一個企業(yè)的發(fā)展十分重要。以上就是數(shù)據(jù)挖掘的四種基本方法的全部內容了,相信大家在閱讀過后應該對數(shù)據(jù)挖掘有了基礎的了解了,希望能幫到大家。
[免責聲明]
文章標題: 數(shù)據(jù)挖掘的四種基本方法
文章內容為網(wǎng)站編輯整理發(fā)布,僅供學習與參考,不代表本網(wǎng)站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內處理。