allen1228 发表于 2020-1-10 11:13:16

SOA-PA-19 June

本帖最后由 allen1228 于 2020-1-10 11:15 编辑


剛考完Jun, 2019的Predictive Analytics (PA) (預測分析),趁著記憶猶新來分享一些考試心得。1. 考試介紹:PA是SOA2018年改革後完全新增的科目,考試時間5小時15分鐘,考試要求使用R進行商業個案的資料分析,並同時撰寫一份報告。在考PA之前,需要先通過SRM、或者舊有VEE-Applied Statistics才能報名。報名後,SOA會開通線上學習模組 (e-Learning Module),並且開通後11個月內可以報名PA的考試。也就是說,可以選擇報名未來一年內兩次考試的其中一次 (6月或12月),但只能報名一次!!! (劃重點) 考第二次PA的話是原價!!!等於Module是送的,只要考一次就要付一次完整的價錢。2. 準備資料:(依主觀認為的重要程度排序)- e-Learning Module- May, 2019公佈的HospitalReadmissions Sample- Dec, 2018考古題- An Introductionto Statistical Learning, with Applications in R (2013)- R for Everyone(2017)- 其它Syllabus提及的資料簡單來說,e-Learning Module給了一個全盤概覽,明確SOA希望考生掌握的知識點,並以類似投影片一張一張的方式詳述整個PA的來龍去脈。不過如果各位像我一樣不容易在投影片中抓重點的話,那就可以搭配An Introduction to Statistical Learning, with Applications in R以及Rfor Everyone兩本原文書相對應的章節一起看。此外,An Introduction to Statistical Learning, with Applications in R每個章節後面的Code寫的很棒,如果時間充裕也建議一起看。考題部分,Module以及Syllabus中提供共約4、5份的Sample,其中我優先看May, 2019 Hospital與Dec, 2018真題。因為May, 2019 Hospital跟真實考試的框架最像 (逐個Task問答模式)、Dec, 2018則是唯一一份的考古題,答案中寫了很多SOA希望考生回答到的點。整體準備時間花了8週 (四月中才把PA打開),但事後來看,對沒基礎的人,將時間拉長到16週會比較適當。3. e-LearningModule介紹:開通後共會出現9個Modules,分述如下:(註:以下的重要性是 ”對於備考PA” 的重要性)Module 1: 預測分析會用到的工具 (重要性:中)- 如何安裝R與RStudio- 基本的R指令- 寫R代碼的風格Module 2: 定義商業問題 (重要性:低)- 如何將模糊、敘述性的商業問題轉換為可以用統計、預測分析來解決的問題Module 3: 數據視覺化(重要性:中)- 如何用ggplot2畫圖Module 4: 數據型態與數據探勘 (重要性:中)- 數據的各種型態- 如何處理missingvalue- univariate,bivariate的數據探勘Module 5: 數據清洗(重要性:中)- 識別outlier- 如何處理數據的非線性關係- 數據使用的規範Module 6: 廣義線性模型 (重要性:高)- 線性模型與廣義線性模型- 解釋結果與選擇最適合的模型- 正規化法(Ridge, Lasso, Elastic Net) 控制回歸- 偏差和變異之權衡 (Bias-Variance Tradeoff)Module 7: 決策樹(重要性:高)- 回歸樹與分類樹- bagging, randomforest, boosting增加精確度- 調整參數(Hyperparameter tuning)Module 8: 集群分析與主成份分析 (重要性:高)- 主成份分析- k-means集群分析- 階層集群分析 (hierarchical clustering)Module 9: 報告的溝通與傳達 (重要性:高)- 如何以有效率且適當的組織架構來撰寫報告4. 考場實戰:這次PA的主題是預測交通工具事故的分值高低 (高分代表該事故嚴重、頻率高)。題目給了大概十多個變量,包含一天的時段、天氣、路的特徵 (十字路口、高速公路)、路面材質…等。跟Dec, 2018最大的不同是以前不給太多指引,過去整份報告是由考生自己發揮。但我猜SOA評卷者因為看到了太多種答題形式、且很不容易抓到給分的點,因此這次改用一個一個Task問答的方式,明確告訴考生Step 1該做什麼、Step 2該做什麼……。整體而言對於考生是相對容易的。前面10個task每一步都有關連,一個步驟一個步驟做下來,畫了很多圖找relationship,用到了GLM、PCA、Ridge Lasso Regularized Regression,並於最後一個task寫Executive Summary。相似度部分,我覺得跟Hospital Readmission框架算蠻像的,R Code量給的也很充足,只要根據自己選擇的變量狀況改寫一些部分。最大的難點我認為有兩個:整體時間掌握與寫到SOA要的點。5小時15分鐘寫11道題,相當於每30分鐘就要做完一題,亦即,30分鐘內要讀該題 + 寫該題的Code + 寫該題的Report,重複這件事情11次。(考試期間可以去洗手間,但是時間不會因此而暫停)另外對於母語非英文的考生,在限制的時間內寫出精煉扼要的報告也是一大挑戰!考試環境方面,鍵盤會鎖住使用Alt + Tab來切換視窗,因此如果跟我一樣是個快捷鍵重度使用者,建議先看Syllabus上SOA把哪些快捷鍵禁止掉。此外,聽過一些考友反映考場的鍵盤不是很好打、電腦跑R非常卡 ,這些問題我自己沒有遇到,但建議如果可以,還是盡量選大城市的考場,機器設備上會比較沒有疑慮。畢竟這科金額那麼高、總不會希望出現非預期的狀況。

小冰 发表于 2020-1-25 12:48:02

赞~马了六月考

humingxue124 发表于 2020-2-5 10:35:34

小冰 发表于 2020-1-25 12:48
赞~马了六月考

可以约一起准备嘛????

小冰 发表于 2020-2-5 13:01:09

humingxue124 发表于 2020-2-5 10:35
可以约一起准备嘛????

一起一起
页: [1]
查看完整版本: SOA-PA-19 June