又來到資種的課程分享啦!有點久沒上課了,感覺好新鮮哈哈哈!
今天要帶來的分享內容是第七堂課 - 如何透過資料洞察問題與擬定解方
簡單來說,這就是在教我們如何透過各種資料去擬定最終的決策,不過這堂課作為開頭,主要著重在告訴我們資料分析需要注意的一些要點和如果想做這類型的工作應該要具備什麼樣的能力~
這次來替我們授課的講師是來自台大工商管理系的 郭耀仁 老師,那他平時除了擔任兼任講師以外,也有在線上開設關於資料科學、數據分析的相關課程,本身也有著相當豐富的業界經驗!
在開場時講師就透過三個句子來告訴我們關於資料分析的幾個重要原則:
1. 雙城奇謀,商業導向與資料導向分析之間的灰色地帶(兩邊看分析的角度不同)
同樣的一筆數據,在不同觀點的人眼中就會有不同的解讀,當然,沒有哪一方是絕對正確或錯誤,最好的解方式找出這兩者之間的平衡,也就是句子裡所說的灰色地帶。
2. 唯一的童話故事,有一個泛用的分析框架可以套用在所有的專案中。
這個我想也相當容易理解,如果真的有一種框架能運用在所有的事情上的話,那麼這個世界上就不會有那麼多問題了,我們不要抱有這類不切實際的幻想,要針對每次不同的情形做相對應的調整,這才是我們人之所以會思考的原因。
3. 山羊過橋,無論商業導向或資料導向,總要有一方讓步。
他的意思就是說,當今天存在兩個不同的看法時,如果雙方都堅持己見,是沒辦法達成共識的。這時,一定要有一方先釋出善意,讓對方能順水推舟的進行調解,最終才能達到雙贏的局面。這和山羊過橋的寓言故事有著異曲同工之妙!
在這之後講師基本上都是再說一些關於如何拆解問題,以及相關的邏輯思考方式,這部分我們在 TUV 專案裡就有學到許多,也在我先前的分享裡有提過,我這邊就先不多家贅述~
講師也提及了一些較為困難的數據分析模型和方法,像是 Gartner 分析遞增模型、資料科學金字塔 等等,但這部分由於實在是有些難懂,我在回去看了一些文章之後仍然也些一頭霧水,這邊略過不提,等到哪一天我想通了再回來和大家分享!
最後是整堂課我認為比較值得聽得一個部分,那就是如何成為資料分析師?
講師提供了六個階段來建議大家可以透過什麼方式來充實自己,成為一個合格的資料分析師!
第零站:和電腦變成好朋友
我們都知道寫程式是理解統計知識與機器學習理論不可或缺的工具與手段,因此學習的起點必須從程式設計起步,但是在開始寫程式之前我們應該跟電腦變成好朋友!學習操作終端機、文字編輯器還有 Git/GitHub,工欲善其事,必先利其器,如果我們連自己的電腦都不熟悉,談何程式語言?
第一站:使用 SQL 查詢資料
講師和其他的程式語言入門書籍推薦的不太一樣,比起大家都稱讚的 Python,他反而會推薦從 SQL 開始,原因是 SQL 作為由資料庫中查詢資料的語言,與人類語言的相似度高、語法單純並且是即戰力的工具,CP 值很高。這也是我覺得相當新鮮的一個地方,剛好最近資訊種子這邊也要開始 run 數據專案,趁機把 SQL 給學起來吧!
第二站:使用視覺化軟體作探索性分析
懂得如何使用 SQL 之後,可以跟試算表、視覺化軟體搭配開始進行探索性分析,就現階段來說, Tableau 與 PowerBI 是現在最普遍的視覺化軟體,而這兩個都有免費的版本可供個人電腦使用。不過就我個人經驗,免費版的似乎功用有限,不然其實我先前也對這個蠻有興趣的,只是好想沒辦法透過免錢手段自學呢…
第三站:學習 Python 程式設計
如果想要勝任工程導向的資料科學團隊職缺,必須學會一個在專案的各個應用都能介接、並且能夠自己整併清理資料的程式語言,在 2022 年首選是 Python 程式語言。這個也是毫不意外啦!作為功能最廣、最好上手的程式語言,現在就連商科的學生都必須要會幾手 Python 才篹有能力… 我現在也正在努力當中!
第四站:機器學習應用
先使用第三方套件實作 Kaggle 專案,至於為何所引用的函數與類別能夠完成機器學習應用,則留待後續在研讀理論後融會貫通。關於機器學習,我先前是有接觸過 Pythom 相關的一些像是決策樹、sklearn 等計器學習的模型,但說實話,如果沒有人引導,或是時做專案的經驗的話,靠自學真的需要相當大的毅力和天賦,希望我日後也能走到那一步吧…
第五站:學習 R 程式設計
機器學習理論會牽涉到程式設計與統計理論,特別是條件機率與機率分配等部分,學習統計理論最好的程式語言是 R 語言,如果在前兩個步驟已經掌握 Python 程式設計以及第三方套件 NumPy、Pandas,在 R 語言的學習進展將會非常快速,我們會發現兩者在面對資料的處理邏輯上其實有異曲同工之妙。
好啦!以上就是這次的課程重點整理,但說句老實話,這堂課真滴無聊,而且明明說好是為了輔助我們執行接下來的數據專案(這我日後再出一個系列來告訴大家),所以安排的數據分析相關課程,但今天的內容其實讓我有些不解,我們想學的是如何去處理這些數據,也就是方法論,像是如何用程式去跑圖表、excel 分析等等,而不是去聽那些前期拆解的部分(這之前學過了),而且講師是到最後跟我們閒聊時才說,他根本不知道今天來要上課的原因是甚麼,還以為是當教學校裡的學生,我直接..
虧我還特地上來上課,廢了一個下午,不過還是多少有得到一些啟發啦!關於自學程式的方向上,但我真的覺得這跟數據專案沒啥關係,不管了,繼續加油吧!後面有時間的話我也趕緊把數據專案跟職涯體驗計畫的文產出來跟大家分享!