01 新增用戶(hù)
如果大家看過(guò)咱們系列的第一篇文章:《數(shù)據(jù)掃盲(1):我們常說(shuō)的DAU、MAU是啥?》應(yīng)該是知道這樣一句話:
對(duì)數(shù)據(jù)基本功的扎實(shí)了解,是溝通的橋梁!
這句話是貫穿我們數(shù)據(jù)掃盲系列始終的,跟著新增用戶(hù)我們舉一個(gè)場(chǎng)景,大家可以再次深度感受一下這句話。
我們的運(yùn)營(yíng)同學(xué)為了推廣app,去找渠道商進(jìn)行合作,涉及到結(jié)算錢(qián)的時(shí)候,商量以新增用戶(hù)為指標(biāo)進(jìn)行結(jié)算,但是對(duì)于新增用戶(hù)的具體定義,大家發(fā)生了爭(zhēng)執(zhí):
面對(duì)這樣的場(chǎng)景,我們很難去說(shuō)對(duì)錯(cuò),我們更關(guān)心的是彼此間對(duì)于數(shù)據(jù)指標(biāo)如何達(dá)成共識(shí)!
我們把新增用戶(hù)進(jìn)行說(shuō)文解字般的拆解,新增=新+增。接下來(lái)我們需要明確兩個(gè)問(wèn)題:
Q1:什么是增?在哪個(gè)節(jié)點(diǎn)為增?
A1:一般來(lái)說(shuō),在用戶(hù)與產(chǎn)品發(fā)生關(guān)系之前,往往會(huì)經(jīng)歷如下圖所示路徑:
用戶(hù)通過(guò)不同的渠道銜接進(jìn)入到渠道頁(yè)(例如某度廣告頁(yè),某企鵝廣告頁(yè));用戶(hù)在渠道頁(yè)面點(diǎn)擊下載或者通過(guò)渠道頁(yè)進(jìn)入到應(yīng)用商店下載;安裝,啟動(dòng)應(yīng)用,來(lái)到應(yīng)用首頁(yè);觸發(fā)相應(yīng)的激活行為(不同業(yè)務(wù)激活行為不同,例如注冊(cè)成功、購(gòu)買(mǎi)商品、亦或是觀看一次視頻等等)。
理論上不同的節(jié)點(diǎn),都是可以作為一次新增,這里呢,我總結(jié)一下不同節(jié)點(diǎn)作為新增的優(yōu)劣勢(shì),以及適合的場(chǎng)景。
大家就可以根據(jù)表中總結(jié)的,結(jié)合自己公司業(yè)務(wù)選擇適合自己的節(jié)點(diǎn)。
Q2:怎么判斷是否為新?
A2:這個(gè)問(wèn)題是由一個(gè)實(shí)例引入的,假設(shè)我們以安裝啟動(dòng)這個(gè)節(jié)點(diǎn)作為增,一個(gè)用戶(hù)下載了某app并安裝啟動(dòng),裝了兩天卸載了,又重新安裝啟動(dòng),此時(shí)他是否算作新增用戶(hù)?這里,我們一般有兩種判斷方法:
以賬號(hào)作為判斷基準(zhǔn),和后臺(tái)已有的賬號(hào)進(jìn)行比對(duì),看以前是否存在此賬號(hào)。
本文提到的留存都是指的新增用戶(hù)的留存,下不贅述。
首先我們來(lái)看一下友盟平臺(tái)對(duì)于留存是怎么下定義的。
宋老濕還是給大家引入一個(gè)案例,來(lái)幫助大家理解定義。
案例還是一款悲催的app,上線第一天新增了100名用戶(hù),之后就再也沒(méi)有獲取新增用戶(hù)。下面給出其上線七日的日活表:
我們由表可以得出MAU=100,這點(diǎn)如果有疑問(wèn),請(qǐng)查看數(shù)據(jù)掃盲系列文章一《再也不怕別人問(wèn)我DAU和MAU呢~ 數(shù)據(jù)掃盲系列(1)》。
問(wèn)題:如何計(jì)算新增用戶(hù)七日日留存?
這里給出兩個(gè)算法。
算法一:(第七天留存用戶(hù)數(shù)/第一天新增用戶(hù)數(shù))*100%
算法二:(第二天~第七天去重后的留存用戶(hù)數(shù)/第一天新增用戶(hù)數(shù))*100%
根據(jù)留存的定義,“某段時(shí)間內(nèi)的新增用戶(hù),經(jīng)過(guò)一段時(shí)間后,仍繼續(xù)使用應(yīng)用的,為留存用戶(hù)”。從中可以提煉出留存用戶(hù)是某段時(shí)間新增用戶(hù)的子集。
就本題而言,上線第一天新增了用戶(hù)100人且之后再?zèng)]有新增用戶(hù),所以第一天之后幾天的活躍用戶(hù)都是第一天新增用戶(hù)的子集,即第X日留存用戶(hù)數(shù)=第X日活躍用戶(hù)數(shù),第一天的新增用戶(hù)=第一天的活躍用戶(hù)。
但是,如果沒(méi)有“第一天新增100人后再無(wú)新增用戶(hù)”的前提,則第X日留存用戶(hù)數(shù)≠第X日活躍用戶(hù)數(shù),準(zhǔn)確表述應(yīng)為第X日留存用戶(hù)數(shù)=第X日來(lái)自于第一天新增用戶(hù)中的活躍用戶(hù)。
這里有一點(diǎn)繞,我舉一小例子幫助大家理解一下。
(假設(shè)5月份新增用戶(hù)200,這200人在6月份啟動(dòng)過(guò)應(yīng)用的有100人,7月份啟動(dòng)過(guò)應(yīng)用的有80人,則6月份留存用戶(hù)為100人,7月份留存用戶(hù)為80人。)
那么采用哪一個(gè)算法呢?
如果您有心記得,宋老濕反復(fù)強(qiáng)調(diào)過(guò):數(shù)據(jù)分析一定是基于業(yè)務(wù)的,是有目的(即留存用戶(hù)這個(gè)數(shù)據(jù)指標(biāo)的意義)。
目的一般來(lái)說(shuō),留存的計(jì)算與分析有以下目的:
此處我們以區(qū)分渠道質(zhì)量來(lái)做講解:
假設(shè)某app有兩個(gè)獲客渠道A和B,且都是1月1日上線,當(dāng)日新增用戶(hù)100名之后再無(wú)新增用戶(hù)。已知兩個(gè)渠道1月1日~1月7日每日的活躍用戶(hù)的數(shù)量,用算法一【(第七天留存用戶(hù)數(shù)/第一天新增用戶(hù)數(shù))*100%】計(jì)算分別得到兩個(gè)七日留存率。
這里可能會(huì)有一些朋友會(huì)覺(jué)得,用算法一計(jì)算忽略了2日到6日的用戶(hù)數(shù)據(jù),這樣計(jì)算得到數(shù)據(jù)不準(zhǔn)確。其實(shí)不是這樣的,我們獲取了兩個(gè)數(shù)據(jù)是為了進(jìn)行數(shù)據(jù)對(duì)比,從對(duì)比中洞察業(yè)務(wù)爆破點(diǎn)。因?yàn)闊o(wú)論是渠道A還是渠道B,我們都只使用第一天和第七天的數(shù)據(jù),同時(shí)忽略了2日到6日的數(shù)據(jù),忽略的信息是一致的。
因?yàn)閱我挥绊懸蛩叵嗤?,所以采用算法一?jì)算進(jìn)行對(duì)比是相對(duì)公平合理的。
當(dāng)然,即使這樣,可能還會(huì)有一些朋友會(huì)問(wèn)那有什么辦法不忽略2日到6日的數(shù)據(jù)呢?
【第二天~第七天去重后的留存用戶(hù)數(shù)/第一天新增用戶(hù)數(shù))*100%】這種計(jì)算方式就是把2日到6日之間的活躍用戶(hù)計(jì)算在內(nèi),但是這樣的計(jì)算方法是否適合用來(lái)評(píng)估渠道質(zhì)量呢?
我們可以看下下圖是關(guān)于渠道A和B七天日活用戶(hù)的折線圖,我們嚴(yán)格按照算法二計(jì)算會(huì)得出渠道A留存率高于渠道B,實(shí)際上我們由圖可以看出渠道B的活躍用戶(hù)曲線更接近于自然平緩下降,同時(shí)第七日的活躍用戶(hù)也高于渠道A。綜合來(lái)說(shuō)渠道B的用戶(hù)質(zhì)量是高于渠道A。
所以用算法二來(lái)計(jì)算留存評(píng)估渠道質(zhì)量是不ok的,究其原因,恰恰是引入第二日和第六日的數(shù)據(jù),反而影響了結(jié)果的判斷。
通過(guò)以上的案例,大家應(yīng)該理解了兩者的區(qū)別。
算法一我們可以稱(chēng)之為七日日留存,算法二為七日內(nèi)留存。
當(dāng)然,存在既有合理性,算法二并不是沒(méi)有適用場(chǎng)景,針對(duì)一些用特定使用周期的app就更適合,例如某app是專(zhuān)注于周末轟趴,活躍用戶(hù)大部分聚集在周六和周日,我們?nèi)绻ビ?jì)算工作日(周一至周五)任一天的新增用戶(hù)七日日留存,會(huì)發(fā)現(xiàn)明顯偏低于周末。
針對(duì)這種情況,我們只看第七天的日留存顯然不能反應(yīng)真實(shí)情況,反之,關(guān)心七日內(nèi)的留存就更為真實(shí)可靠。
那么,宋老濕還是以友盟數(shù)據(jù)平臺(tái)一組七日留存的表格,大家可以嘗試看下友盟采用的是算法一還是算法二。
有些朋友可能有些摸不到頭腦,有些朋友直覺(jué)可能覺(jué)得友盟用的是算法一。實(shí)際上,友盟平臺(tái)計(jì)算方法和算法一很相似但有些許不同。我們暫且稱(chēng)之為算法三。
(第七天的留存用戶(hù)數(shù)/第0天的新增用戶(hù))*100%。
這個(gè)第0天其實(shí)指的就是計(jì)算留存的當(dāng)日,和算法一中的第一天指的是同一天。如上圖所示,如果計(jì)算2018—08—01的七日日留存,則算法一中的第1天和算法三中的第0天都是指的08-01的新增用戶(hù)數(shù)339人。再仔細(xì)看上圖會(huì)發(fā)現(xiàn),友盟統(tǒng)計(jì)時(shí)采用1天后,2天后對(duì)應(yīng)就是算法一中的第二天與第三天。
那么友盟為什么采用算法三,這樣計(jì)算有什么好處嗎?希望大家動(dòng)腦子想一下。
(這里給一個(gè)提示:和一周七天有關(guān)聯(lián))。
揭曉答案:這是因?yàn)椴捎盟惴ㄈ覀兛梢砸?guī)避星期對(duì)數(shù)據(jù)的干擾。
舉一個(gè)例子,2018-08-01是星期三,采用算法一的第七天則是08-07星期二,算法三則是七天后08-08星期三,這樣同時(shí)用星期三的數(shù)據(jù),就可以合理規(guī)避今日是周幾對(duì)數(shù)據(jù)的干擾。
那么我們一共講了三種算法,每種算法都有其存在的意義,具體的要根據(jù)自己公司業(yè)務(wù)進(jìn)行選擇,保證公司內(nèi)部采用同一種標(biāo)準(zhǔn)即可。
這里,宋老濕給大家做一個(gè)表格進(jìn)行總結(jié),大家可以保存圖片備用。
基于此,新增或和留存咱們是聊得差不多了。大家應(yīng)該會(huì)有種毛塞頓開(kāi)的感覺(jué)。
作者:宋老濕
來(lái)源:產(chǎn)品經(jīng)理吐槽喵
136 0806 8886【加微信請(qǐng)注明來(lái)意】
四川省成都市高新區(qū)天府三街1599號(hào)(天府三街與南華路交匯處)