SPSS的模塊按功能劃分可以分為三部分:描述性數據分析、推斷性數據分析、探索性數據分析。今天小編就帶大家詳細看看描述性數據分析,具體包括描述性數據分析是什么以及描述性數據分析常用指標。希望通過今天的介紹可以增加大家對描述性數據分析的了解。
描述性數據分析
最簡單的數據分析形式是描述性分析。描述性分析列出并總結了數據集中每個變量的值。例如,如果調查受訪者對特定問題提供1-10分,描述性分析可能會顯示每個分數的受訪者數量和百分比、平均分數和中位數、模式或最常見分數,以及一些分數,如標準差等。描述性分析可以熟悉數據集并識別數據問題,如未提供任何分數的受訪者或顯示響應為99的數據。
描述性數據分析常用指標1:平均值
總數除以個數,用來判斷一組數據的平均情況,但不能體現出異常值。
描述性數據分析常用指標2:四分位數
用五個數值描述情況,分為最小估計值,上四分位數,中位數,下四分位數,最大估計值。
四分位數能夠反應數據整體情況,能夠很好地判斷異常值,但是不能夠反應數據整體的波動情況。
如何判斷異常值;在最小估值和最大估計值之外的數,我們稱之為異常值。
遇到異常值我們怎么處理?我們總結了以下三種情況
1.錯誤記錄形成的異常值,改正即可,比如男錯寫成女,造成了異常值改正即可。
2.錯誤判斷形成的異常值,對數據結果造成的影響較大,直接刪除。
3.合乎邏輯的異常值可以保留。
描述性數據分析常用指標3:標準差
用來衡量數據波動的大小,離散程度和變異性,能夠反映事物穩定程度的大小。
標準差的案例場景;標準差越小,代表數據越穩定,越大,代表波動情況越大。
球員的標準差越小,代表球員的發展水平更加穩定。
對于股票來說,標準差越大,風險越大,投資需要謹慎。
描述性數據分析常用指標4:標準分
標準分是對數據進行歸一化處理,又叫內分數,標準化值。
如果某個數值的標準分=0,該數值等于標準分本身。大于0,該數值大于平均值,小于0,該數據平均值小于0。
以上就是小編為大家帶來的描述性數據分析是什么以及描述性數據分析的常用指標。希望今天的文章對大家之后的工作有所幫助。關于描述性數據分析,它其實是spss模塊分類下的一部分,除此之外還有推斷性數據分析以及探索性數據分析。
[免責聲明]
文章標題: 描述性數據分析的定義與常用指標
文章內容為網站編輯整理發布,僅供學習與參考,不代表本網站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發送郵件至36dianping@36kr.com,我們會在3個工作日內處理。