【Google Data Analytics Certificate】筆記:Case Study

來到 Google Data Analytics Professional Certificate 的最後一個單元:Case Study。基本上這個章節就是丟給你題目,讓你依照課程給予的架構去做問題拆解、資料處理與分析,最後做出視覺化圖表並分享你的洞見。

說實話,這單元我做的不是很好,除了很多環節尚不熟悉以外,對於題目的理解也沒有到很透徹。我是觀摩了很多前輩們的分析後才得出自己的一點脈絡,做起來其實相當挫折。不過,成長的過程並訂伴隨痛苦,正是因為我實際投入了,我才知道自己還差地遠,後續也會繼續透過相關的數據分析課程來增進我的能力。

在這篇文章,我會先介紹課程提供的題目背景,接著和大家分享我的 Case Study 文件以及分析過程的心得,最後附上一些學習小建議!

題目背景一覽

在單元初教案會給我們兩個選擇,分別是「做教案提供的題目」以及「自己找喜歡的主題做分析」,我會在後面把這兩類講的詳細一點。

教案提供的題目

由於在實務上,當我們要去面試「Data Analyst」的職位時,面試方多半會指派一個簡單的情境題,讓應聘者回去做簡單的 Case Study,再回來跟他們說明你的洞見、思考脈絡以及如何分析等等。為了讓我們適應這個模式,教案會以企業的角度出發,提供接近於實務的題目。

題目一、How does a bike-share navigate speedy success?

這個題目的背景是一間共享單車的企業,想針對定價策略的不同對於消費者的接受度為何、它們可以如何做出調整與優化?不過,因為我並沒有選這一題,所以對於題意的了解上並不是很透徹,我這裡分享教案提供的 Case 說明給大家,有興趣的人可以參考:

文件連結:點此

題目二、How can a wellness company play it smart?

這個題目的背景則是一間做 身體狀況監測 app 的一間企業,希望透過分析同質性產品的使用者在不同情境下的行為與使用率,藉此調整自家公司的產品功能。這題會提供外部的資料庫,讓我們可以針對裏頭的資料去做資料清洗、整理與分析。下方為該題的 Case 說明,我稍後也會解釋我的分析過程給大家:

文件連結:點此

找自己喜歡的主題做分析

這條路是提供給有「想做的主題」的學生,像是想分析自己的學習效率、睡眠品質等等,教案會提供一份完整的分析指南,讓我們即使是自己做分析,也能依照完整的架構去練習。下方我一樣提供教案的文件,有興趣的人可以稍作參考:

文件連結:點此

Case Study 過程分享

接下來的這個章節,我會和大家分享我做 Case 的脈絡與最終結果,有興趣的人也可以先看這份完整的報告,抑或是跟著文章一步步了解~

Step 1、Ask

這部分因題目當中有多位利害關係人、不同功能的產品以及希望達成的目標,因此,我根據教案提供的框架,在第一步,寫下了一些幫助我釐清議題核心的問題:

  • 我們要解決甚麼問題?
    • 分析那些非本公司產品使用者在使用同質性 app 的行為
    • 挑選公司的一個產品做為主要的洞見提供對象
  • 我的洞見可以如何影響公司的商業決策?
    • 利用外部提供的資料庫(fitbit)去分析使用者趨勢和習慣,藉此改善公司的產品功能,創造更大的價值。
  • 利害關係人盤點
    • Urška Sršen: Bellabeat’s cofounder and Chief Creative Officer
    • Sando Mur: Mathematician and Bellabeat’s cofounder; key member of the Bellabeat executive team

Step 2、Prepare

在這個部分,教案建議我們先檢視該資料庫的品質、是否符合統計意義和資料的時效性,為的是讓我們確保這筆資料是有價值的,而不要等分析完後才發現做了白工。於是,我列下了幾個比較關鍵的檢核點:

主要還是把來源、時間段、數據的內容和是否有統計意義去做檢視,連結提供的資料庫上都有完整的說明,所以這部分也不會太過困難。

Step 3、Process

這部分我是用 BigQuery 做資料的合併、篩選和計算,因為這個資料庫當中有約莫 15 個檔案,其中某些檔案還有高達百萬筆的資料,用 Excel 或 Spreadsheet 的話會跑到天昏地暗,於是 SQL 成了我的第一選擇。

個人經驗談

這部分需要花上非常多的時間,因為我們對這些數據都還不夠了解,更別提迅速找出可以互相比較的指標。我在這階段光是把資料匯入 BigQuery、一個一個看裡面的內容與了解該資料的涵義,就花了我兩到三天的時間,中間真的一度萌生「還是跳過算了」的想法。

這裡真的要請大家保持耐心,去多嘗試 SQL 的功能,包含 JOIN、GROUP BY 等等,真的不用到太深,只要多交叉比對、根據同一位使用者的數據做計算、找出資料與資料間的關係,你便可以從中得到許多靈感,這對接下來的分析階段都大有助益。

題外話,其實我 SQL 學的也不是很好,所以很多合併資料庫的時候會出現問題,這也是我實際做過之後才發現的,理論和實務真的有差,你以為你會了,但其實還差地遠。

Step 4、Analyze and Share

因為這只是書面的 Case Study,我就將兩個階段合併在一起。在整理好資料並對內容有基礎的認識之後,我便開始著手進行脈絡的發現與視覺化呈現,基本上是在 BigQuery 把資料整理好,之後透過下載到 Speeadsheet 的功能來換個地方執行視覺化。

這部分沒有使用 Tableau 除了還不太會用以外,也有時間考量的問題,畢竟這門課是訂閱制,我希望能盡早完成,然後別被繼續扣錢 XD

以下是我做出來的一些圖表和說明:

  • I use SQL to combine some data, and find the pattern that there are 54.5% users only use app to track their sleeping period, not many users use it to do the activities and weight tracking.
  • We can also see the data in dailyActivity, most of users only do the lightlyActivity act, so it seems that there are so many users didn’t use the tracking app thoroughly.
  • But we can find some patterns indicate that excercise more can help users burn their Calories, help them lower the BMI number.

基本上就是找出使用者的類型,然後根據他們在 app 上表現出來的健康表現,告訴公司可以如何吸引那些潛在的用戶來多使用我們的產品(強調健康之類的)

Step 5、Conclusion

最後當然還是要提出建議,不過因為這筆資料對使用者特徵的部分較少著墨,因此我比較多是告訴對方可以如何利用我發現的洞見來吸引使用者使用更多功能,以增加黏著度與價值,下方一共兩點:

  • We should encourage those who only use the sleep tracking function to use the activity and weight tracking part, shoe them the positive relationship between health and excericise.
  • And then, cause we found sleepness is such a huge problem, there are so many people use this service, so we should develpe more relative solution about this problem in our app, that will attract many users to use our product.

心得與學習小建議

作為整個課程的最後一單元,Case Study 讓我真正的將一些技巧和方法論用在上面,也正是實際使用過之後,我才知道有那些地方我還不夠熟悉。說實話,我做的 Case Study 真的不怎麼樣,粗糙到我看了都有點不忍,特別是在看過其他大神用 R 做的完整分析後,人外有天的感覺格外強烈。

不過,如果你和我一樣,在上這門課之前對數據分析幾乎是一片空白的話,我還是會建議你用自己的方式好好的做完這份功課。碰到問題就在網路上找答案,用手邊有的資源去完成你的分析,哪怕和其他人的有差距,但至少這東西你有努力嘗試過,這已經相當足夠。

要花多少時間?

這個分析一樣花了我一個多禮拜,主要是在理解題意、找出脈絡和資料清洗上花費較多時間,後續的分析部分因為我沒有用 R 或 Tableau,所以速度上快很多,這部分就取決於你有多少時間跟心力,再決定要做到何種程度。

課程後面一樣會有一些簡單的作品集製作、面試與履歷教學等等,修完課時真的頗有成就感。我之後會再寫一篇針對這整個課程的整理和心得分享,大家敬請期待!

收到更多巫師札記的內容

總算在今年做出新嘗試啦!目前還是試營運版本的電子報!每個月我至少會寄出一篇關於我當月文章的摘要與重點整理,你可以針對有興趣的主題來閱讀!除此之外,我也會不定期的寫信分享近期的學習點和心得,也希望透過電子報來和大家有更緊密的互動!

只要訂閱巫師札記電子報,我就會免費寄出一份關於「如何提升閱讀效率」的電子書,幫助大家更有系統的吸收與學習書上的知識。日後也會持續分享有意義的內容,請大家多多支持!