FacebookTwitterLineHatena

文 | 傅一平

源 | 與數據同行

對於任何一個在數據領域摸爬滾打的人來講,取數往往是其數據生涯的開始,通過取數我們了解了公司的業務、系統和數據,沒有經歷過取數肯定是不完整的數據人生,這也是企業很多數據分析師,數據探勘師職業生涯的起點。

但你會發現,企業內有人通過取數升級成數據分析師、數據探勘師,亦或投奔業務,而很多人則一直在取數,搗騰著那一分三畝的數據,很勤奮但沒有進步,為什麼?

同樣是取數的新人,往往3個月後就會體現出巨大的差距,這在企業內見得很多了,為什麼?

自己做過長達4年的取數,教訓和經驗很多,隨著科室新人增多,建模的建模,變現的變現,取數則是其干成事的一門基本功。

筆者一直想對於自己的取數得失做個總結,看看是否於團隊的新人有益,道理早點知道,受益終生, 直到最近讀了《刻意練習》這本書,才讓我找到了答案,為什麼同樣是取數的人,差異是如此巨大。

取數雖然技術門檻不高,但要取好數就如任何一門職業一樣,非常不易,新人的取數如果養成刻意練習的習慣,則可以超過99%的人,當然其實任何職業都一樣。

數據分析|取數也能成為大師,只要你刻意練習

讓我們看看一個新人到達企業後學習取數的一般方式:

你首先會進入一個數據分析團隊,然後團長會給你安排一位同事做你的導師,你的導師首先會讓你準備一些取數的裝備,因此,你申請了系統賬號和取數平台賬號,被授權了數據訪問許可權,然後你具備了取數的環境。

你決心開始學習,但你不知道取數的第一件事到底是什麼,因此,你得從導師那裡了解到取數需要具備哪些基本技能,比如SQL,如果你SQL不會,你還得自學一下,假如不同平台SQL寫法不同,你還得從導師那裡拿到一些樣本專項學習,取數的工具如果不會用,你還得再補習一下,或者導師可能手把手教你一遍。

關於SQL學習,推薦兩篇文章:

零基礎快速自學SQL,1天足矣—附最全SQL學習資源和練習題!

20條Tips:高性能SQL查詢,優化取數速度方案

然後,導師給了你很多以前的取數需求和程式碼,你會去理解需求中的業務概念,這些業務概念與數據是怎麼個對應關係,從程式碼中你知道了如何從取數平台中獲取這些數據,當然還涉及一系列匯入匯出的工作,最後,你終於知道如何端到端的去完成一個取數。

你似乎掌握了基本的取數技能了,但你發現,你對於一個新取數需求仍然完全無從知道如何下手,然後,你一遍一遍的進行實戰演練,團隊也會給你一些新的需求讓你嘗試做做看,隨著練習的深入,你開始對於SQL的寫法很熟悉了,比如你知道了創建一張新表比更新數據表效率似乎更高一點,你對於某類業務的取數似乎形成了一定的解決套路,比如假如取數涉及費用和用戶,只需要從用戶寬表去取就可以了,隨著積累的增多,你逐步駕輕就熟了,你已經可以獨立完成團隊給你分派的取數任務了,那也就是說,你已經在傳統意義上「學會了」取數。

隨著取數閱歷的增多,你的所有取數動作都是自動完成了,你的表現也逐步被業務人員接受,不需要太多的思考,到這個時候,即使你對自己的取數水平並不是徹底滿意,但你的進步是實實在在的,你已經掌握了容易的技能。

數據分析|取數也能成為大師,只要你刻意練習

的確,一個努力的取數新人,在6個月到1年時間都能達到這個水平。

但你很快便會發現,你依然有一些弱點,不論你多麼經常的取數,這些弱點總是暴露出來,比如突然要取一個從來沒見過的指標,你從現有的表中根本沒見過這個指標,然後你還得去找團長,團長告訴你這個指標現有的表中沒有,得找到這個表的源頭去取,然而你根本不知道源頭的表在哪裡,那個對你來說是黑箱子,團長只得手把手教你找到了那張表。

這次取數比以前長很多,頗費周折,雖然你會感到一點挫折,但不管怎樣,由於問題解決了,而且這並不經常發生,而且你永遠不知道業務人員什麼時候再有類似的需求,因此,你沒有必要形成針對此類問題解決的套路,當3個月以後再面對這種問題,你總是以前一種的方式去應對。

類似的問題很多,人家覺得你取數慢,你不會去想怎麼提升,大多歸因於時間緊、系統慢唄,業務部門有抱怨,你不會思考自己的問題,大多歸因於人家不講理唄,數據出得晚了,也就抱怨一下倉庫太垃圾,維護不給力,如此總總。

這個時候,你被其他的人拉開了差距,團長也不自覺的調低了對你的期待值,而你自己卻不知道。

在我們學習任何一項技能時,我們全都遵循很大程度上相同的模式,首先,一般性地了解我們想做些什麼,從導師、書籍或網站上獲得一些指導,然後開始練習,直到我們達到可接受的水平,接下來,讓這種技能變成自動的、自然而然的,這種方式並沒有錯,我們工作或生活中所做的事情,很多只需要我們達到中等水平便可以了。

但在這裡,你要理解一件非常重要的事情,一旦你已經達到了這種令你滿意的技能水平,而且能做到自然而然地表現出你的水平,你就已經不再進步了,人們通常錯誤地理解這種現象,因為他們自以為,這種形式化的練習,如果不停地做下去,自己一定能夠更擅長、也許進步較為緩慢,但最終還是會更出色。

人們認為,開了20多年車的老司機,一定會比只開了5年車的司機更擅長開車,教了20多年書的老師,一定會比只教了5年書的老師能力更強。

但是,現實並不是這樣的,研究表明,一般而言,一旦某個人的表現達到了可接受的水平,並且可以做自動化,那麼,再多練習幾年,也不會有進步,甚至如果沒有特意提高,這些自動化能力會緩慢的退化。

恰好最近筆者去理了一次發,感觸頗深。

因為小區的理髮店要等很長時間,因此筆者破天荒的到了一家很貴但不需要等待的理髮店,理了史上最貴的一次頭,300元人民幣,而一般小區只要25元,給我理髮的是20歲出頭的小夥子,以前小區的是40-50歲的大叔了,但這次的確理的很好,筆者臉比較圓,頭髮也不多,因此小夥子通過適當改變我的髮型讓我顯得不那麼胖,而且頭型表面均勻而自然,不像小區理的那樣,有點雜草叢生的樣子。

然後我問了老闆情況,他說他們這裡的都是專業的理髮師,還分了很多檔次,有41,61,128,237的,而且這些理髮師都非常年輕。

取數也是這樣,作為一項基本的生產任務,大多必然是枯燥和技術含量不高的,有太多的取數人員沉溺其中,做著重複的工作而沒有進步,有人會說這是公司的任務,多枯燥也得完成,但筆者想談的是取數進步的階梯,取數能否進步其實跟工種沒有關係,只跟自己的練習方式有關,即使拋開自己的成長因素,更強大的取數能力對於公司也是百利而無一害。

那麼如何提升取數能力從而成為大師呢?

《刻意練習》這本書提到刻意練習是我們知道的最有效和最強大的練習形式,對於刻意練習原則的運用,是為任何行業或領域策劃和設計訓練方法的最佳方式,刻意練習大致包含以下一些特徵,這裡筆者結合取數也談一談。

1、刻意練習包含得到良好定義的特定目標

刻意練習包含得到良好定義的特定目標,通常還包括目標表現的某些方面;它並非指向某些模糊的總體改進。一旦設定了總體目標,導師或教練將制訂一個計劃,以便實現一系列微小的改變,最後將這些改變累積起來,構成之前期望的更大的變化,改進目標表現的某些方面,使得從業者能夠看到他的表現已經通過練習得到了提高。

我們假想音樂學生如果確定了類似下面這樣的練習目標,可能會比他漫無目的的練習要成功的多:「連續三次,不犯任何錯誤,以適當的速度彈奏完曲子。」如果不制定這樣一個目標,就沒有辦法判斷練習是不是成功了。

你要練習取數的速度,首先要練習業務理解能力,你可以把所有的歷史取數需求做個分析,將所有指標分門別類,針對每類指標,歸納總結從哪類表中可以快速的獲取,你可以一天設置一個業務目標,攻克一類業務的取數方式。

筆者以前取數從市場取到財務再到客服再到政企,花了巨大的代價在實踐中去熟悉每類業務的取數套路,自己已經覺得不錯了,但如果當時遵循上述目標原則,取數的速度肯定會更快。

2、刻意練習發生在人們的舒適區之外

刻意練習要求持續不斷地嘗試那些剛好超出他當前能力範圍的事物。因此,它需要人們付出近乎最大限度的努力,一般來講,這並不令人心情愉快。

比如原來你取數習慣於串列跑腳本,現在要提速,因此你得改變原來寫程式碼的方式,換成並行的邏輯,換成並行意味著可能這次取數要花更多的時間和代價,你本能是不願意的。

比如你負責為市場部取數,如果駕輕就熟了,就有必要為自己製造點麻煩,可以申請去為政企部、財務部、客服部等更多的部門去服務,在一個全新的陌生領域可以更好的提升自己的技能。

聽一些互聯網公司的取數人員講,每天只能倒騰自己那一塊數據,取得都煩了,感覺沒意思,沒意思就意味著沒有挑戰,意味著大腦其實很舒服,這對於數據人員的職業生涯是個危險的信號。

數據分析|取數也能成為大師,只要你刻意練習

3、刻意練習是有意而為的

也就是說,它需要人們完全的關注和有意識的行動,簡單地遵照導師或教練的指示去做,還不夠,學生必須緊跟他的練習的特定目標,以便能做出適當的調整,控制練習。

很多新人取數有個問題,就是太乖了,導師說一句,他動一下,完全不敢越雷池半步,這個時候,導師的瓶頸就是你的瓶頸,這樣取數水平很難青出於藍而勝於藍。

記得以前筆者剛進公司的時候,取數是基於PLDEV這個軟體的,經常程式碼貼上去就直接跑了,但後來發現作業多了管理就混亂了,而且一步小心就關掉了頁面,規模化效率怎麼也提不上去,筆者那時就提出搞一個作業管理工具,能夠7*24不間斷的跑,但這類超越現狀的刻意提升的工作還是少了。

4、刻意練習包含反饋以及為應對那些反饋而進行調整的努力

在練習過程的早期,大量的反饋來自導師或教練,他們將監測學生的進步、指出存在的問題,並且提供解決這些問題的方法。隨著時間的推移,學生必須學會自己監測自己、自己發現錯誤,並做出相應調整。

大多企業對於新人是沒有那麼好的即時反饋機制的,一般取數新人在能端到端完成一個取數後,企業安排的導師就很少關注新人的成長了,因為自己也是這麼過來的。

這是有問題的,我們似乎過於相信新人的自我更新能力了,有時候新人甚至不知道自己哪裡不知道,比如新人過於痴迷於數據倉庫模型,以為這就是數據的全部,卻全然不知道源系統數據的學習更為重要,解決取數問題光知道what,how是不夠的,還需要知道why,這就需要導師給予新人更多的,及時的反饋,讓取數新人發日報並且給予及時反饋是必須的,但即使這一點也很難做到。

5、刻意練習既產生有效的心理表徵,又依靠有效的心理表徵

首先要理解下心理表徵是什麼,因為這是刻意練習的核心概念,心理表徵是一種與我們大腦正在思考的某個物體、某個觀點、某些信息或者其他任何事物相對應的心理結構,或具體或抽象。

這裡舉個例子你就明白了。

很多國際象棋大師具備下盲棋的能力,在對弈中,對國際象棋大師來講,對手每下出一步棋,只有短短几秒鐘的時間來研究棋盤,因此,他們將準確地記住大多數棋子在棋盤上的位置,而且能夠近乎完美地重新確定棋盤上最重要的區域,相反,剛剛開始下國際象棋的人,只能記住幾個棋子的位置,沒有能力去重新配備棋盤上的棋子,難道國際象棋大師的記憶力更好?

實驗表明,國際象棋大師對於有套路的棋盤,經過5分鐘的研究,能夠記住大約2/3棋子的位置,但新手卻只能記住大約4個棋子,而當他們全都看到隨意擺放棋子的棋盤時,新手的表現某種程度上還是差一些,只能準確說出2個棋子的位置,這是意料之中的事情。不過,令人驚訝的是,無論是水平中等的棋手還是優秀的大師,在記住棋盤上隨便亂擺的棋子的位置方面,並不比新手表現得優秀。

任何一位真心想提高國際象棋水平的人,通常會花無數個小時的時間來研究大師下過的棋局,也就是我們說的「打譜」。深入分析棋子的位置,預測下一步招法,如果猜錯了,回頭再想一想自己到底漏算了什麼,多年的訓練,使得國際象棋棋手只需看一眼,就能辨別出棋子的規律,不僅是它們的位置,而且包括它們之間的相互關係。

國際象棋大師處理和解釋棋子位置的方式,就是心理表徵的一個例子。這是他們「看到」棋盤的方式,而且,新手與大師相比,儘管看到的是同一個棋盤,理解卻全然不同。當他們在心理上觀察棋盤上的局勢時,問他們看到了什麼,大師不會說他們看到的棋盤上的實際棋子,不會只按照某種對棋子位置進行「照相式記憶」的方式來理解棋盤上的局勢,這些是「低級」的表徵,相反,他們的描述模糊得多,通常會說出一些「攻擊線路」以及「運子」之類的術語,這種表徵的關鍵在於,它們使得棋手能將棋盤上棋子的位置進行編碼,而且,編碼方式比只是簡單地記住棋子到底位於哪個方格之中有效得多。

又如開車時必須考慮諸多不同的因素,如速度和動量,其他車輛的位置和速度,路況和能見度,腳是必須放在油門踏板上還是剎車踏板上,用多大的力度踩踏板,以及打方向盤的時候該打多猛等等,對於任何較為複雜的活動,我們都得在腦海中記住更多的信息,但它們超出了短時記憶的極限,因此,我們總是在自己甚至還不知道的情況下,就創建了這樣那樣的心理表徵。事實上,沒有心理表徵,我們連走路(太多的肌肉運動需要協調)、說話(同樣要協調肌肉的運動,再加上要理解所說的話的含義)都做不到,根本無法生活下去。因此,每個人都擁有並使用心理表徵。

幾乎在每一個行業或領域,傑出表現的標誌是能在一系列事物中找出規律,這些事物,在無法創建高效心理表徵的人們看來,可能是隨機或令人困惑的,換句話講,傑出人物能夠看到「一片森林」,而其他所有人,卻只看見「一棵樹」。

心理表徵的形成依賴於三個F,專註(focus)、反饋(feedback)以及糾正(fix it)。將技能分解成一些組成部分,以便反覆地練習,並且有效地分析、確定你的不足之處,然後想出辦法來解決它們。

取數技能可以分解成業務理解、數據理解、系統理解、業務與數據映射、人際溝通、程式碼編寫、工具使用、輸入輸出等組成部分,只有針對每個環節進行反覆的練習及有效分析,針對不足之處進行專項提升,才能建立起強大的心理表徵能力。

接到一個取數需求,新人看到的是一堆文字描述,取數大師看到的是從業務術語表達出來的業務種類,每個業務種類對應的數據類別體系,每個數據類別體系能支撐的指標體系,不僅如此,大師還能一下看出這個需求有哪個點是某個數據類別體系不能單獨支撐的,必須基於數據類別的交叉關聯才能支撐,甚至更深一層,這個需求不是由當前的數據類別體系支撐的,必須映射到源系統的數據類別,層層深入。

在幾秒中之內,取數大師就能判別這個需求能否支撐,有哪個點是存在歧義的,需要業務人員進一步澄清的,這個需求的支撐的難度如何,大概要花多少時間等等,取數大師甚至能夠猜到業務人員的真實意圖是什麼,從而可以為業務人員提出更好的取數建議。

胸有成竹這句成語就是強大心理表徵能力的體現,提高水平與改進心理表徵是相輔相成的,兩者不可偏廢,隨著水平的提升,表徵也變得更加詳盡和有效,反過來使得人們可能實現更大程度的改進。

6、刻意練習對於大腦的物理改變有科學的依據

如果你是一名健身愛好者,通過反覆練習,可以讓你的身體帶來顯而易見的變化,但如果你要挑戰自己的心理能力,比如精通取數,要觀察你的大腦因這些挑戰而發生的改變並不容易,因為它會逐步地適應你強加給它的日益提高的要求,艱苦地訓練一天後,你的大腦皮層並不會酸痛,你的腦袋也不會真的變大,不必由於以前的帽子現在戴不下了,而出去重新買頂新帽子,你不用在額頭上訓練出六塊肌肉來。由於大腦中的任何變化你無法親眼看見,所以你很容易以為,這些訓練真的不會給你帶來太大的變化。

不過,這是錯誤的。越來越多的證據表明,大腦的結構與運行都會為了應對各種不同的心理訓練而改變,而且,很大程度上像你的肌肉和心血管系統響應體育鍛煉那樣,你的大腦會由於刻意反覆的練習而發生物理的改變,你的大腦會改變某些神經元的用途,以幫助完成那件任務,大腦走出舒適區後,則更容易改變大腦結構。

這為刻意練習帶來大腦改變提供了科學上的解釋,但令筆者感到意外的是,所謂的天生才華,比如莫扎特傳奇、自閉症奇才等,都是刻意練習帶來的結果,有大量的研究表明了這一點,沒有所謂的基因優勢,即使有,也僅僅是開始之初有了興趣而已。

7、刻意練習的限制

但刻意練習要發揮出極致,卻也有其特定要求,取數要採取刻意練習的方法提升水平難度不小。

有目的的刻意練習意味著需要能方便的區分好和差,這對於能直接競爭比拼好壞的行業或領域比較方便,包括音樂表演、芭蕾舞蹈、國際象棋以及體育競技等,但針對企業經理、教師、工程師、數據分析師、諮詢師等等,並沒有成形的方法套路,能夠有客觀的標準來評價卓越的績效。

比如取數其實是數據人員的職業中間狀態,各行業對於取數人員的定位基本是螺絲釘的角色,取數大師最終都走向了數據探勘師、數據分析師等崗位,誰都沒有留下取數這類小專業刻意練習需要掌握的套路和知識,比如市面上從來沒有關於取數技巧的書,而諸如鋼琴、滑冰、象棋等領域,受益於數十年甚至數據百年穩定進步的行業或領域,每一代人都將他們從上一代人那裡學到的經驗和技能傳承下來, 他們的訓練方法令人驚訝的一致。

但刻意練習作為一種行之有效的學習方法論,你依然可以運用刻意練習的原則,讓自己成為企業中的取數大師,而且一旦掌握了刻意練習的方法,將使自己的人生充滿各種可能。

喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!

熱門文章推薦

立即試用,可獲取更多 報表範本和案例

免費試用