起底小紅書數(shù)據(jù)分析邏輯與方法論
某個品牌在小紅書做了一組矩陣號,他們的運(yùn)營團(tuán)隊有一名專職數(shù)據(jù)分析師,這個數(shù)據(jù)分析師由于不知道該怎么做小紅書數(shù)據(jù)分析,于是找我咨詢。
數(shù)據(jù)分析的角色在產(chǎn)品運(yùn)營、營銷的業(yè)務(wù)中很重要,既是集團(tuán)各部門領(lǐng)導(dǎo)進(jìn)行決策的重要依據(jù),也是營銷運(yùn)營大頭兵們尋找業(yè)務(wù)突破的重要方式。
一般一個10人規(guī)模以上的團(tuán)隊,都會專門配備一名數(shù)據(jù)分析師來輔助業(yè)務(wù)。
10人規(guī)模以下的團(tuán)隊,則可能由懂?dāng)?shù)據(jù)分析的運(yùn)營兼任。
數(shù)據(jù)分析的三層境界:
第一層,獲得數(shù)據(jù),整理數(shù)據(jù),匯報數(shù)據(jù)。
第二層,加工數(shù)據(jù),找到問題,呈現(xiàn)問題。
第三層,通過數(shù)據(jù)分析發(fā)現(xiàn)洞察,影響決策。
第一層
處在第一層的數(shù)據(jù)分析師,每天早上第一件事就是去獲取數(shù)據(jù),如果公司有數(shù)據(jù)庫,但是沒有可視化的取數(shù)工具,那就自己寫SQL語句在服務(wù)器上獲取數(shù)據(jù),可能幾個小時過去了才拿到數(shù)據(jù)。如果公司有數(shù)據(jù)庫又有可視化的取數(shù)工具的話,那就根據(jù)要求讓數(shù)據(jù)庫計算出想要的數(shù)據(jù),然后復(fù)制粘貼到excel表格里。
獲取了領(lǐng)導(dǎo)需要的數(shù)據(jù)后,就是整理數(shù)據(jù),放到一個表格里或者PPT里,讓領(lǐng)導(dǎo)查閱了。
由于每天都有新的數(shù)據(jù),這種數(shù)據(jù)分析師每天都要重復(fù)勞動。然后領(lǐng)導(dǎo)遇上要向上回報的時候,就又有更多處理數(shù)據(jù)的任務(wù)需要完成了。這種數(shù)據(jù)分析師的價值是獲取數(shù)據(jù),整理好數(shù)據(jù),從而節(jié)省領(lǐng)導(dǎo)和同事的時間。但這種價值同時也容易被取代呀,結(jié)果就是拼加班,拼手速,拼快捷鍵技巧的熟練程度,拼細(xì)心程度。瘋狂加班不敢抱怨。
第二層
處在第二層的數(shù)據(jù)分析師,會對數(shù)據(jù)進(jìn)行加工,讓領(lǐng)導(dǎo)在眾多數(shù)據(jù)中,能輕松看出關(guān)鍵數(shù)據(jù),找到問題,從而輔助領(lǐng)導(dǎo)做出決策。
比如領(lǐng)導(dǎo)更希望能夠看到某個產(chǎn)品銷量等數(shù)據(jù)的趨勢變化,而第一層的數(shù)據(jù)分析師只會給出每天的銷量數(shù)據(jù)表格。第二層的數(shù)據(jù)分析師能夠用PowerBI等工具生成數(shù)據(jù)趨勢圖,讓領(lǐng)導(dǎo)能夠每天清晰地看到最近的數(shù)據(jù)變化怎么樣,該不該做出策略調(diào)整。能夠做到這一層次,就可以被領(lǐng)導(dǎo)看做優(yōu)秀的助手了,做決策的左膀右臂。
第三層
處在第三層的數(shù)據(jù)分析師,擅長在一堆數(shù)據(jù)中尋找問題,分析問題,設(shè)計出策略來解決問題。
有一個傳說,有個超市通過數(shù)據(jù)分析發(fā)現(xiàn),把啤酒和尿布放在一起,兩者的銷量有顯著提升,原因是帶娃的爸爸會同時購買兩者。雖然這是個傳說,但表達(dá)的意思是通過數(shù)據(jù)分析可以發(fā)現(xiàn)一些營銷洞察,從而通過提出對應(yīng)的策略,來獲得明顯的成績。
之后有空時我會專門寫篇文章講講我如果通過數(shù)據(jù)分析來指導(dǎo)決策,從而獲得出色成績的。
數(shù)據(jù)分析基本的六個步驟:
1、提出分析目的
這一步在很多公司是老板做了,老板給數(shù)據(jù)分析師任務(wù)。比如今天老板說:給我拉張表,看看最近6個月銷售額按天統(tǒng)計的數(shù)據(jù),增長趨勢,分區(qū)域分店鋪的增長情況。比如前天老板說:幫我看看我們的產(chǎn)品,哪些兩兩組合關(guān)聯(lián)度更強(qiáng)。比如上周老板說,最近銷售額數(shù)據(jù)有些拉胯,幫我找找是什么原因。
但更高段位的數(shù)據(jù)分析師,可能會自己尋找分析目的。比如要提高某個業(yè)務(wù)的銷售額,可以想出什么策略。
2、獲取數(shù)據(jù)
Excel表格適用于處理1萬行以內(nèi)的數(shù)據(jù),10萬行以內(nèi)的數(shù)據(jù)處理也馬馬虎虎。
石墨文檔等的在線表格處理幾千條數(shù)據(jù)也還可以。
要處理幾萬行幾十萬行數(shù)據(jù)的話,就要用一些專業(yè)的數(shù)據(jù)處理工具了,例如PowerBI。
要處理幾百萬行到幾億行數(shù)據(jù)的話,就要用一些數(shù)據(jù)庫工具了,例如MySQL,要專門學(xué)下基本的數(shù)據(jù)庫語言。
我們處理小紅書相關(guān)的數(shù)據(jù),Excel表格或者石墨文檔的在線表格就夠了。
少量的數(shù)據(jù)手工錄入可能更快。
有的數(shù)據(jù)量稍微有點(diǎn)大,或者方便使用爬蟲,那就使用爬蟲來搜集數(shù)據(jù)。比如百度搜索搜到的結(jié)果用爬蟲比較方便,比如一些你翻很多頁都不需要輸驗證碼的網(wǎng)頁,比如不需要登錄賬號就可以看到你想要內(nèi)容的網(wǎng)頁,這些都是比較方便用爬蟲的。如果要學(xué)爬蟲,可以帶著這個目的學(xué)學(xué)相關(guān)的Python編程語言。也有一些比較簡單的爬蟲工具,比如八爪魚,比如webscraper。
對于小紅書相關(guān)的數(shù)據(jù),基本還是建議用人工錄入數(shù)據(jù)吧,也就幾百幾千條數(shù)據(jù),很快就搞定了。
3、處理數(shù)據(jù)
獲得了數(shù)據(jù)后,要先處理下數(shù)據(jù),比如,你的數(shù)據(jù)格式是不是對的,有些格式的數(shù)據(jù)不方便你后面的計算,排序等操作,有些數(shù)據(jù)格式可能還不統(tǒng)一,有些數(shù)據(jù)可能漏了,有些數(shù)據(jù)可能錯誤了。這些問題如果可能影響之后的分析結(jié)果,那就要提前處理。
4、分析數(shù)據(jù)
這是最考驗人的一步了,怎樣的分析產(chǎn)生怎樣令人信服的結(jié)論。在得出正確結(jié)論以前,我們不一定知道該用什么分析方法,也并不知道該采用怎樣的分析思路。
得出結(jié)果后回頭看,你可能覺得,好簡單啊,可是在這個過程中,卻好難啊。就像我們中學(xué)時代解數(shù)學(xué)大題一樣。
5、讓數(shù)據(jù)可視化
分析完成后,不僅要自己能看懂,能看清楚,還要讓領(lǐng)導(dǎo)和同事們能看懂能看清楚,那就常常需要運(yùn)用可視化了。讓分析結(jié)果更簡單更直觀地呈現(xiàn)出來。
最簡單最常見的數(shù)據(jù)可視化方式就是柱狀圖、餅圖、折線圖、散點(diǎn)圖等幾種圖表。
6、得出可執(zhí)行結(jié)論
數(shù)據(jù)分析時為了得出結(jié)論,統(tǒng)一大家的意見,然后促進(jìn)大家產(chǎn)生對應(yīng)的行動。
如果大家認(rèn)識不到位,不認(rèn)可某個決策,那么執(zhí)行就可能產(chǎn)生抵觸,甚至唱反調(diào)。
所以數(shù)據(jù)分析時一種說服的方式,通過數(shù)據(jù)讓大家心服口服,從而推動業(yè)務(wù)的發(fā)展。
在小紅書相關(guān)的數(shù)據(jù)分析中,分析任務(wù)主要集中在以下幾個方面:
自有賬號分析,對標(biāo)分析,非自有賬號分析。
自有賬號分析
作為一個小紅書團(tuán)隊的數(shù)據(jù)分析師,重點(diǎn)自然是分析自家的賬號。你可能負(fù)責(zé)的只有一個賬號,也可能要負(fù)責(zé)多個賬號。要維護(hù)的數(shù)據(jù)量不過100-2000條而已,所以最快的獲取數(shù)據(jù)的方法還是手工錄入數(shù)據(jù)到excel表格中。
因為小紅書賬號的數(shù)據(jù)查看途徑主要就兩個,一個是電腦端登錄創(chuàng)作服務(wù)平臺https://creator.xiaohongshu.com/,一個是手機(jī)端在創(chuàng)作中心查看。
電腦端數(shù)據(jù)顯示維度更少,但是可以查看每篇筆記最近30天的流量趨勢圖。
小紅書的數(shù)據(jù)不是一行行排列的,這就沒法直接復(fù)制粘貼到表格中了,平臺有防爬蟲策略,也就不好用爬蟲軟件整理到表格中了,主要數(shù)據(jù)都在手機(jī)端才能看到,這就更麻煩了。
所以,老老實實手工整理這些數(shù)據(jù)吧。
用表單收集原始數(shù)據(jù),第一張表單,錄入每篇筆記的數(shù)據(jù),至少包含的字段:賬號名、標(biāo)題、閱讀量、點(diǎn)贊量、收藏量、評論量、分享數(shù)、漲粉量、人均觀看時長、點(diǎn)擊率、點(diǎn)擊率評價、5s完播率(視頻內(nèi)容的指標(biāo))、完播率評價(視頻內(nèi)容的指標(biāo))、內(nèi)容豐富度、內(nèi)容豐富度評價、首頁推薦占比、搜索占比、個人主頁占比、關(guān)注頁面占比、其他來源占比、女性觀眾占比、年齡分布(根據(jù)需要看是統(tǒng)計1-2個年齡段還是所有5個年齡段)、城市分布(根據(jù)需要看是統(tǒng)計排名前1-3的城市還是前10城市)、觀眾興趣(根據(jù)需要看是統(tǒng)計排名前1-3的興趣還是前10興趣)。
第二張表單,錄入賬號基本數(shù)據(jù),至少包含的字段:每日觀看數(shù)、近7日觀看數(shù)、近7日觀看總時長、近7日點(diǎn)贊數(shù)、近7日收藏數(shù)、近7日評論數(shù)、近7日筆記漲粉、近7日主頁訪客、近7日筆記分享數(shù)、近7日觀看排名百分位、近7日互動排名百分位、近7日漲粉排名百分位、近7日推薦流量占比、近7日搜索流量占比、近7日個人主頁流量占比、近7日關(guān)注頁面流量占比、近7日其他來源流量占比、近7日新增粉絲數(shù)、近7日流失粉絲數(shù)、女性粉絲比例、年齡分布比例、城市分布比例、觀眾興趣分布比例。
筆記搜索閱讀量:通過搜索結(jié)果點(diǎn)擊該筆記的閱讀量,筆記搜索閱讀量=筆記閱讀量×搜索占比。由于我們無法看到搜索結(jié)果點(diǎn)擊率,所以就只好看筆記搜索閱讀量了,搜索閱讀量越高,說明該筆記在搜索結(jié)果中越有優(yōu)勢。如果要布局搜索結(jié)果,就需要研究這類搜索閱讀量高的筆記,來優(yōu)化團(tuán)隊創(chuàng)作方向。
筆記推薦閱讀量:通過首頁推薦點(diǎn)擊該筆記的閱讀量,筆記推薦閱讀量=筆記閱讀量×首頁推薦占比
筆記推薦曝光量:該條筆記在首頁推薦獲得的曝光量,筆記推薦曝光量=筆記閱讀量/點(diǎn)擊率。推薦量高說明該筆記更受系統(tǒng)認(rèn)可。可以找到推薦量相關(guān)的關(guān)聯(lián)因素,從而給團(tuán)隊指引優(yōu)化方向。
同城閱讀量:該條筆記的同城用戶閱讀量,同城閱讀量=筆記閱讀量×同城比例,有些業(yè)務(wù)有很強(qiáng)的同城屬性,非同城的流量意義不大,所以需要看同城閱讀量。
互動率:互動率=(點(diǎn)贊數(shù)+收藏數(shù)+評論數(shù))/閱讀量,互動率被普遍認(rèn)為是一種評價筆記是否值得推薦的指標(biāo),互動率高的筆記更容易被推薦。高互動率的筆記可以用來總結(jié)增加互動率的經(jīng)驗,從而提高以后筆記的表現(xiàn)。
漲粉率:漲粉率=漲粉數(shù)/閱讀量,漲粉率越高表明這個筆記的內(nèi)容更容易吸引讀者關(guān)注。高漲粉率的筆記可以考慮作為置頂帖,也可以考慮投放薯條用來漲粉。
做小紅書常常會陷入流量焦慮,為什么最近流量明顯下滑,為什么流量一直上不來。
這時就需要數(shù)據(jù)分析師來告訴大家為什么會這樣,以及該做出怎樣的改變。
看流量的分布是否有變化,主要的流量變化集中在哪里。
根據(jù)看前面計算的一些指標(biāo),生成折線圖,通常就能比較明顯看出問題所在,常常是由于最近的筆記推薦流量明顯下滑導(dǎo)致的。
接下來就看,哪些數(shù)據(jù)發(fā)生了變化,比如興趣分布,性別分布,城市分布,點(diǎn)擊率。可能是筆記對應(yīng)的目標(biāo)人群發(fā)生了變化,也可能是這個筆記本身不夠吸引人點(diǎn)擊率不高,或者這個筆記寫得并不夠好,導(dǎo)致互動率低。
找到了原因所在,就可以尋找解決方案了。
通過數(shù)據(jù)分析指引怎么獲得更多的成交額
先梳理出該業(yè)務(wù)的成交路徑,例如某醫(yī)美機(jī)構(gòu)的路徑是,筆記閱讀——主頁流量——私信——引導(dǎo)到微信私域——成交。
那么就要監(jiān)測:7天閱讀量、7天主頁訪問量、7天私信數(shù)、7天加微信數(shù)、7天成交數(shù)(額)
然后就可以算出每7天的主頁訪問率、按閱讀量的私信率、按主頁訪問量的私信率、私信加微信率、成交率。
然后就可以定位問題了,比如有時雖然閱讀量升高了,但是銷售額降低,通過定位發(fā)現(xiàn)是最近的按閱讀量的私信率明顯降低了,然后發(fā)現(xiàn)按主頁訪問量的私信率降低得不那么明顯,那么問題就在于閱讀量引導(dǎo)到主頁訪問的這一步出了問題,那么接下來就應(yīng)該出引導(dǎo)到主頁訪問的策略,從筆記的文案到評論區(qū)引導(dǎo),都需要進(jìn)行迭代。
對標(biāo)分析
對標(biāo)分析主要是分析一批對標(biāo)賬號和一批對標(biāo)內(nèi)容。
對標(biāo)分析這個我們有專門的文章研究過。
對標(biāo)賬號不只是對標(biāo)直接的競品,還可以包括在某些角度有競爭關(guān)系的賬號,還可以包括興趣點(diǎn),目標(biāo)人群,內(nèi)容風(fēng)格等高度重合的賬號。
對標(biāo)分析的主要價值在于為內(nèi)容創(chuàng)作和運(yùn)營動作優(yōu)化提供借鑒。
在電商領(lǐng)域常會做競品數(shù)據(jù)分析,但是內(nèi)容領(lǐng)域,由于通常和你搶奪流量的賬號眾多且并不僅僅來自你的直接競爭對手,并且缺乏專門的數(shù)據(jù)。所以并不會每周做對標(biāo)賬號的數(shù)據(jù)分析,注重自己的內(nèi)容就好了。
非自有賬號分析
如果需要找博主做推廣,這時需要評估這些博主的數(shù)據(jù)。
單純看粉絲數(shù)的方式容易誤差很大。
如果能建立不錯的數(shù)據(jù)分析模型,就能夠比較方便篩選博主,以及給出對應(yīng)的合適定價。
與廣告效果相關(guān)性最強(qiáng)的數(shù)據(jù)是轉(zhuǎn)化率,這個數(shù)據(jù)需要經(jīng)過多次測試逐漸精確。同一個博主發(fā)的內(nèi)容,即使閱讀量相同,不同的文案,轉(zhuǎn)化率也可能相差幾倍。
除了轉(zhuǎn)化率,相關(guān)性比較高的數(shù)據(jù)就是閱讀量。一篇筆記的閱讀量越高,我們認(rèn)為通常就帶來了越高的銷量。但是不同類型的內(nèi)容,轉(zhuǎn)化率相差其實不小,幾倍甚至十?dāng)?shù)倍的轉(zhuǎn)化率差異。有的筆記屬于高點(diǎn)擊率低轉(zhuǎn)化率類型,有的筆記屬于低點(diǎn)擊率高轉(zhuǎn)化率類型。
兩種解決方式,第一種是通過數(shù)據(jù)分析經(jīng)驗的不斷積累,我們可以將筆記分為幾種類型,同類型的筆記進(jìn)行比較,這樣同類型筆記的轉(zhuǎn)化率至少不會相差太遠(yuǎn)。這種解決方式需要不斷的數(shù)據(jù)分析研究,有一定難度。
第二種是通過多個合作案例不但積累,測出平均數(shù)據(jù),這種方式可以一定程度減小誤差,操作也簡單。
由于博主并不一定想讓你看到真實閱讀量,或者在初步篩選的過程中不方便調(diào)查閱讀量。所以一般流行的策略是統(tǒng)計點(diǎn)贊量。不過有些類型的筆記點(diǎn)贊率能夠達(dá)到10%-20%,有些類型的筆記點(diǎn)贊率連0.1%都不到。以及有些博主的筆記點(diǎn)贊主要來自少數(shù)忠實粉絲或者互贊買贊行為。
50贊以下的筆記容易通過互贊買贊等行為造假,所以存在數(shù)據(jù)造假的可能。不過在初步篩選中這個并不重要。
按照千贊標(biāo)準(zhǔn)來評估爆文的方式也并不可靠。有些筆記1000贊對應(yīng)的閱讀量才1w左右,有些筆記10w閱讀量才100個贊。
所以,在建立合作前的篩選賬號階段,我們起碼要統(tǒng)計以下數(shù)據(jù):昵稱、粉絲數(shù)、總贊藏數(shù)、置頂帖標(biāo)題、置頂帖點(diǎn)贊量、最近10篇或最近2個月內(nèi)容平均點(diǎn)贊量、最近2個月最低點(diǎn)贊量、30%分位作品點(diǎn)贊量、作品風(fēng)格、作品內(nèi)容形式。
最低點(diǎn)贊量是用于估算來自粉絲的流量。當(dāng)幾乎沒有被系統(tǒng)推薦時,作品的點(diǎn)贊量就處于洼地,這時的點(diǎn)贊幾乎都來自于粉絲。
30%分位作品點(diǎn)贊量可以用來預(yù)測你的投放能夠拿到的較樂觀結(jié)果是怎樣的。
基礎(chǔ)預(yù)測公式可以參考如下,之后再根據(jù)實際執(zhí)行的數(shù)據(jù)調(diào)整優(yōu)化。
預(yù)期閱讀量=預(yù)期點(diǎn)贊量/3%
預(yù)期銷量=預(yù)期閱讀量×預(yù)期轉(zhuǎn)化率(1%)
預(yù)期產(chǎn)出=預(yù)期銷量×售價
這樣就可以初步估算出這個博主帶來的預(yù)期產(chǎn)出會是多少,然后決定廣告費(fèi)最多可以給多少。注意預(yù)期產(chǎn)出的計算建議根據(jù)實際經(jīng)驗反復(fù)測算,我們給出的初始數(shù)據(jù)僅供缺少數(shù)據(jù)的情況下參考。前期建議先做保守估計,就是預(yù)期產(chǎn)出降低5-10倍。
本文來自微信公眾號“鳥哥筆記”(ID:niaoge8),作者:江流,36氪經(jīng)授權(quán)發(fā)布。
