數(shù)據(jù)分析近年來(lái)越來(lái)越火,其實(shí)學(xué)習(xí)SQL或PythonHadoopHivesparkFlink之類的只是操縱數(shù)據(jù)的工具,最終目的是希望量化業(yè)務(wù),并幫助企業(yè)實(shí)現(xiàn)成長(zhǎng),所以多和產(chǎn)品市場(chǎng)的同學(xué)交流業(yè)務(wù)是很有必要的,只關(guān)注于具體做什么是沒(méi)有必要的。接下來(lái)就由小編為您介紹大數(shù)據(jù)和數(shù)據(jù)分析,數(shù)據(jù)分析是做什么的。
大數(shù)據(jù)和數(shù)據(jù)分析
通常稱為“運(yùn)行數(shù)據(jù)”。leader需要季度/月/周的一組數(shù)據(jù),寫出一段或N段SQL來(lái)運(yùn)行數(shù)據(jù)。通常是臨時(shí)的需求,但是當(dāng)發(fā)現(xiàn)悄悄演變?yōu)槌R?guī)需求時(shí),最好將SP(存儲(chǔ)過(guò)程)直接封裝起來(lái)……每一次運(yùn)行都很方便省事。這一工作內(nèi)容需要以下技能要點(diǎn):數(shù)據(jù)庫(kù),SQL
這是一個(gè)耗時(shí)和麻煩的部分。先期的工作是基礎(chǔ)數(shù)據(jù)的處理清洗,基礎(chǔ)匯總聚合,然后設(shè)計(jì)監(jiān)測(cè)指標(biāo),指標(biāo)設(shè)計(jì)不僅僅是數(shù)學(xué)分析,更需要跑業(yè)務(wù)需求方去了解,畢竟最終目的是要讓別人用,提升效率,不是為了凸顯模型高估。有了所有所需的數(shù)據(jù)之后,就開(kāi)始建立商業(yè)模型(數(shù)學(xué)模型),整個(gè)建模過(guò)程也是對(duì)數(shù)據(jù)反復(fù)探索的過(guò)程,在一定數(shù)據(jù)量的情況下,初始建模應(yīng)用起來(lái)一定會(huì)出現(xiàn)那種問(wèn)題balabala煩死人…以后調(diào)整優(yōu)化的過(guò)程。技術(shù)要點(diǎn):SQL,excel,R語(yǔ)言,數(shù)理統(tǒng)計(jì),數(shù)據(jù)挖掘,商業(yè)知識(shí)。
完成商業(yè)模式之后,得到指標(biāo)結(jié)果。將資料放入數(shù)據(jù)庫(kù)。下一步需要去尋找開(kāi)發(fā)幫助您創(chuàng)建可視化站點(diǎn)。身為數(shù)據(jù)分析員我最了解這個(gè)項(xiàng)目邏輯流程,核心算法,業(yè)務(wù)應(yīng)用。尋找開(kāi)發(fā)幫助您制作可視化站點(diǎn):曲線圖啊柱狀圖啊餅圖啊,balabala讓別人一眼就可以看到指標(biāo)的總體狀況。技能點(diǎn):邏輯思考、過(guò)程規(guī)劃、數(shù)據(jù)可視化、一定的開(kāi)發(fā)知識(shí)(便利和發(fā)展交流)、表達(dá)能力和表達(dá)能力。
收集業(yè)務(wù)部門的反饋,不斷與他們進(jìn)行郵件溝通,不斷優(yōu)化模型、數(shù)據(jù)表。并向業(yè)務(wù)部提供某些特殊需要的分析評(píng)估報(bào)告(臨時(shí)需求)。技巧點(diǎn):邏輯思考、表達(dá)能力。(5)個(gè)人學(xué)習(xí):有時(shí)會(huì)遇到等候別人工作進(jìn)度的情況,比如別人的上一批數(shù)據(jù)沒(méi)有出來(lái),你根本就無(wú)能為力。那么你可以上網(wǎng)或者讀書來(lái)獲取知識(shí)。數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)挖掘博大精深,如何能很好的應(yīng)用,產(chǎn)生最高性價(jià)比更是一門學(xué)問(wèn)啦。更多的理解并沒(méi)有什么壞處。
與大數(shù)據(jù)相關(guān)的“大數(shù)據(jù)”已不再是個(gè)人工作的內(nèi)容,而是一個(gè)整體的工作內(nèi)容。特別是要讓那些了解hadoop和spark的人負(fù)責(zé)在上面運(yùn)行數(shù)據(jù),并編寫最終的實(shí)現(xiàn)代碼。在我們的團(tuán)隊(duì)中,大概有數(shù)據(jù)分析師、數(shù)據(jù)工程師(半個(gè)產(chǎn)品經(jīng)理),有三人兼三人,有人只愛(ài)專精。技能點(diǎn):沒(méi)有特定的法則,團(tuán)隊(duì)協(xié)作加分。
其實(shí)我們國(guó)家目前還沒(méi)有真正數(shù)據(jù)科學(xué)家,這個(gè)職位在國(guó)內(nèi)被炒得太稀有了:既會(huì)線性代數(shù)統(tǒng)計(jì),又會(huì)數(shù)據(jù)挖掘,玩得了R和SAS模型,寫的是Javapythonscala,當(dāng)?shù)昧薙QL型數(shù)據(jù)庫(kù)DBA,又能玩NoSQLhadoopspark,懂業(yè)務(wù),懂技術(shù),善溝通,有商業(yè)頭腦等,踏實(shí)做好數(shù)據(jù)分析就不錯(cuò)了,以上就是小編為您介紹的大數(shù)據(jù)和數(shù)據(jù)分析,數(shù)據(jù)分析是做什么的。
[免責(zé)聲明]
文章標(biāo)題: 大數(shù)據(jù)和數(shù)據(jù)分析,數(shù)據(jù)分析是做什么的
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)溝通。發(fā)送郵件至36dianping@36kr.com,我們會(huì)在3個(gè)工作日內(nèi)處理。