隨著(zhe)數據積累(lèi)得越來越(yuè)多,數據獲取成本不斷(duàn)降低,人們開始走向另一個(gè)危險的極端,那就是任何事情都要看數據,任何決定(dìng)都去依賴(lài)數據。這種風(fēng)氣培養出了越來越多的“數據呆”。作為一個數據分析師,我(wǒ)是非常反對“唯數據論”的(de)。為什麽呢?讓我詳(xiáng)細(xì)地來說一說。
數據庫並(bìng)不能(néng)記錄一切
你覺得,通過(guò)數據庫中的記錄,你能夠充分了解你的業(yè)務嗎?答案是否定的(de)。說(shuō)白了,數據庫隻(zhī)是記錄(lù)了發生在業務鏈條上的(de)行為,但行為的結果並不代表業(yè)務的全(quán)部。舉個例子,通(tōng)過(guò)用戶的使用行為數(shù)據,我(wǒ)們就能知道用戶的體驗嗎?答案是不能,我們隻是根據用戶的“行為結(jié)果”去(qù)猜測他使用體驗的好壞。真正的用戶感覺,在他們的心理(lǐ),許多時候,不會通過(guò)既定的使用路徑和產品功能提現出來。
那麽,數據庫不能記錄的信息,怎麽獲取呢?答案其實很簡單,通過外部(bù)手(shǒu)段,創造條件去獲取。概括為“調查”和“實驗”兩個(gè)詞。比(bǐ)如(rú)用戶體驗不能量化的問題,直接問不就好了?調查分為訪談和問卷調查(chá)兩個方式,每種方式都需要落地成可量化的結果(guǒ)。問卷調查建議規律性地(dì)長期進行,連續收集的數據在時間(jiān)維度上可比,價值(zhí)遠遠大於單次的問卷調查。實驗的(de)方式在第四章中有所(suǒ)論述,它正是一種創造數據(jù)的手段。通過(guò)實驗組和對照組(zǔ),創造出一個對比的條件,進而量化(huà)出差異,最終形(xíng)成可靠的判斷。
不可能分離多重因素影響
我們在運營當中最容易犯的錯誤就是試(shì)圖用一個“宏觀指標”的(de)變化來評估某個細節動作(策略的改變、產品(pǐn)的改變或者活動的改變)的影響。做這件事情好比買彩票,幸運的時候,某個運營動作(zuò)對業務的影響非常大,那麽從指標中能(néng)反映出(chū)來。但絕大多數時(shí)候,不管是策略(luè)的變更(gèng)還是產品的改進,對業務全局的影響都是有限的,宏觀指標(往往是KPI)的變化並不敏感。真正要做的是就事論事,根據具體的行動,去定義一個信(xìn)度和效度(dù)高(gāo)的指標(biāo)。
另一個角度,業務指標的變動往往是多種運營動(dòng)作(zuò)共同施加的結果,這種影響並不能簡簡單單的分解為“A+B+C+…”或者“A*B*C*…”。有些因素疊加可能相互放大影響,有些則可能(néng)相互抑製,宏觀指標隻是(shì)這眾多影響的結果,內部的(de)影響機製是(shì)黑箱。極(jí)端點說,不可能將每個因素的影響都分離(lí)出來。
那麽怎麽辦呢?怎樣(yàng)能衡量具體某個運(yùn)營動作帶來的影響呢?答案(àn)就是實驗,也隻有(yǒu)實驗。就是通常所講的AB測試。實驗中,運營動作施予對象必須分為實驗組和對照組,實驗組(zǔ)和對照組唯一的不同,就是實驗組被施予了運營動作,而對照組沒有。隻有這樣,觀察實驗組(zǔ)與對照組的指標差(chà)異(方差分析或者DID),我們才有可能去量化某個運營動作的影響。
數據不(bú)能替代邏輯(jí)推理
一個邏(luó)輯混(hún)亂的(de)人,給(gěi)他再多的數據,也不會得出正確的結(jié)論。能否形成正(zhèng)確的判斷和合理的決策,很大程(chéng)度(dù)上並(bìng)不是數據的多少,數據足夠(信息充(chōng)分)就(jiù)可以了。很多時候,我們真正要鍛煉(liàn)的是自己的分析問題的能(néng)力,或(huò)者(zhě)說邏輯思維能(néng)力。尤其是在“根據數(shù)據變化查找問(wèn)題”這樣的場景中。
要對這一點有深刻(kè)的理解,希望大家讀我的《數(shù)據驅(qū)動決策的13種思維方式》。你是不是一個明智的決策者,並不在於你手頭有多少的數據,而在於你能否從數(shù)據中正確(què)地解讀(dú)信息。需要提醒各位的是,當數據(jù)達(dá)到一定的量後,數據越多,往往數據質(zhì)量(liàng)越差,你犯(fàn)錯(cuò)的可(kě)能性(xìng)越大。你是否記起了本書第一章最後部分,數據圖中指標數量與混淆概率的關係了?
預測(cè)的根基(jī)未必牢固
數據分析工(gōng)作,很大一部分是為了“預測”。所有預測模型的“根基”都是“通過過去(qù)發生的事來預(yù)知將來的事”。說(shuō)得更玄乎一(yī)點,就是“曆史是會重演的”。但這個基(jī)本邏輯靠得住嗎?
從(cóng)我的個人經曆來(lái)說,許多時(shí)候是靠不住的。這也是(shì)我在工作中很少進行預測型建模的原因。在我(wǒ)所處的互聯網行(háng)業,業務變化非常快。一個“政策”的(de)決定,往往造成各項業(yè)務數據的巨變。經常是“一(yī)夜回(huí)到解放前”或(huò)者“一(yī)晚跨入新時(shí)代”。在這種背景下(xià),重要(yào)的不是去對某個指標進行預測,而是理解業務背後最根本的商業邏輯(商業模式)。若一個商業邏輯被證明是有效(xiào)的,那麽(me)它在相當長的一段時間內(nèi)不會變化,那麽你就能獲(huò)得一些“定(dìng)性”的預測能力,這就足夠了。
大多(duō)數(shù)人會因數據而變傻
為什麽這麽說呢?在我的工作經曆中,大多(duō)數的管理(lǐ)層,都會因為數(shù)據資源的豐富而或多或少地放棄思考。放棄思考意(yì)味著變傻,難道不是嗎?許多人,自身因為長期業務經驗(yàn)的積累,其實是有很好的直覺的。而現在,卻被(bèi)一個不熟(shú)悉業務,隻會從數據(jù)庫中做些統(tǒng)計的所謂數據(jù)分析師牽著(zhe)鼻子走。實在是“可歌可泣”。許多(duō)人過分地依賴數據統計了。這個現象是值得警覺的。
曾經有一位(wèi)學者告訴我,數據分析使人短視甚至盲目。開始我不(bú)以為意,但之後越來越(yuè)覺得這話有道理。為什麽呢?現實情況是,許多(duō)人有(yǒu)了數據資(zī)源後(hòu),放棄了最基本的商業思考,不斷地去統計(jì)數據,不斷地去提(tí)“幫我查一下這個數字,幫我看一下那(nà)個數字”這樣的需求。失去了思考的深度,非常危險。
我覺(jiào)得,真正的(de)數(shù)據分析(業務分析),應該有很高的(de)門檻。這個門檻並不來自於分析方法的應用,而來自於對業務的理解。隻(zhī)有對(duì)業務有深刻的理解,才能將分析方法(fǎ)用(yòng)對地(dì)方,才能正確地(dì)解讀信息,獲得結論。
所以,許多深耕在業務中的管理者,不需要因為數據資源的爆(bào)炸而驚慌失措,真正有(yǒu)價(jià)值的東西在(zài)你們經驗裏,隻需要有一個量化的出口,你才是那個將數據價值發揮到最大的人。
那麽問題來了,如何做到不(bú)因數據而變(biàn)傻呢?我沒有答案。我認(rèn)為在(zài)未來,不應該(gāi)有(yǒu)數據分析(xī)師這個職業,而應該是所有決策者都懂得“分析數據(jù)”。這(zhè)實際上是寫作本書最深層的一個目的。當所有決(jué)策者都能正確地獲取(qǔ)數據、合適地(dì)應用分析方法,得出可靠(kào)的(de)結論時,我們的(de)商(shāng)業將進入一個新的階段,商業智能才真(zhēn)正落(luò)地。
最後,我還是想強調(diào),任何人在應用(yòng)數據(jù)前,都要記(jì)住這(zhè)樣一句(jù)話:“對業務的理解和思考,永遠高於分析技術的選擇”。