精算屋-熊猫论坛

精算屋熊猫论坛

本论坛旨在为精算师及未来精算师提供交流平台.
在这里我们提倡平等,开放,互助,创新
或许你还不是精算师,来到这里,你已经成为了我们的一员.

人气 2286

SOA-PA-19 June [复制链接]

allen1228 2020-1-10 11:13:16
本帖最后由 allen1228 于 2020-1-10 11:15 编辑


剛考完Jun, 2019Predictive Analytics (PA) (預測分析)
趁著記憶猶新來分享一些考試心得。
1. 考試介紹:
PASOA2018年改革後完全新增的科目,
考試時間5小時15分鐘,
考試要求使用R進行商業個案的資料分析,
並同時撰寫一份報告。
在考PA之前,需要先通過SRM、或者舊有VEE-Applied Statistics才能報名。
報名後,SOA會開通線上學習模組 (e-Learning Module)
並且開通後11個月內可以報名PA的考試。
也就是說,可以選擇報名未來一年內兩次考試的其中一次 (6月或12)
但只能報名一次!!! (劃重點) 考第二次PA的話是原價!!!
等於Module是送的,只要考一次就要付一次完整的價錢。
2. 準備資料:(依主觀認為的重要程度排序)
- e-Learning Module
- May, 2019公佈的HospitalReadmissions Sample
- Dec, 2018考古題
- An Introductionto Statistical Learning, with Applications in R (2013)
- R for Everyone(2017)
- 其它Syllabus提及的資料
簡單來說,e-Learning Module給了一個全盤概覽,
明確SOA希望考生掌握的知識點,
並以類似投影片一張一張的方式詳述整個PA的來龍去脈。
不過如果各位像我一樣不容易在投影片中抓重點的話,
那就可以搭配An Introduction to Statistical Learning, with Applications in R以及Rfor Everyone兩本原文書相對應的章節一起看。
此外,An Introduction to Statistical Learning, with Applications in R每個章節後面的Code寫的很棒,
如果時間充裕也建議一起看。
考題部分,Module以及Syllabus中提供共約45份的Sample
其中我優先看May, 2019 HospitalDec, 2018真題。
因為May, 2019 Hospital跟真實考試的框架最像 (逐個Task問答模式)
Dec, 2018則是唯一一份的考古題,答案中寫了很多SOA希望考生回答到的點。
整體準備時間花了8 (四月中才把PA打開)
但事後來看,對沒基礎的人,將時間拉長到16週會比較適當。
3. e-LearningModule介紹:
開通後共會出現9Modules,分述如下:
(註:以下的重要性是 ”對於備考PA 的重要性)
Module 1: 預測分析會用到的工具 (重要性:中)
- 如何安裝RRStudio
- 基本的R指令
- R代碼的風格
Module 2: 定義商業問題 (重要性:低)
- 如何將模糊、敘述性的商業問題轉換為可以用統計、預測分析來解決的問題
Module 3: 數據視覺化(重要性:中)
- 如何用ggplot2畫圖
Module 4: 數據型態與數據探勘 (重要性:中)
- 數據的各種型態
- 如何處理missingvalue
- univariate,bivariate的數據探勘
Module 5: 數據清洗(重要性:中)
- 識別outlier
- 如何處理數據的非線性關係
- 數據使用的規範
Module 6: 廣義線性模型 (重要性:高)
- 線性模型與廣義線性模型
- 解釋結果與選擇最適合的模型
- 正規化法(Ridge, Lasso, Elastic Net) 控制回歸
- 偏差和變異之權衡 (Bias-Variance Tradeoff)
Module 7: 決策樹(重要性:高)
- 回歸樹與分類樹
- bagging, randomforest, boosting增加精確度
- 調整參數(Hyperparameter tuning)
Module 8: 集群分析與主成份分析 (重要性:高)
- 主成份分析
- k-means集群分析
- 階層集群分析 (hierarchical clustering)
Module 9: 報告的溝通與傳達 (重要性:高)
- 如何以有效率且適當的組織架構來撰寫報告
4. 考場實戰:
這次PA的主題是預測交通工具事故的分值高低 (高分代表該事故嚴重、頻率高)
題目給了大概十多個變量,包含一天的時段、天氣、路的特徵 (十字路口、高速公路)、路面材質…等。
Dec, 2018最大的不同是以前不給太多指引,過去整份報告是由考生自己發揮。
但我猜SOA評卷者因為看到了太多種答題形式、且很不容易抓到給分的點,
因此這次改用一個一個Task問答的方式,
明確告訴考生Step 1該做什麼、Step 2該做什麼……。
整體而言對於考生是相對容易的。
前面10task每一步都有關連,一個步驟一個步驟做下來,
畫了很多圖找relationship
用到了GLMPCARidge Lasso Regularized Regression
並於最後一個taskExecutive Summary
相似度部分,我覺得跟Hospital Readmission框架算蠻像的,
R Code量給的也很充足,只要根據自己選擇的變量狀況改寫一些部分。
最大的難點我認為有兩個:整體時間掌握與寫到SOA要的點。
5小時15分鐘寫11道題,相當於每30分鐘就要做完一題,
亦即,30分鐘內要讀該題 + 寫該題的Code + 寫該題的Report,重複這件事情11次。
(考試期間可以去洗手間,但是時間不會因此而暫停)
另外對於母語非英文的考生,在限制的時間內寫出精煉扼要的報告也是一大挑戰!
考試環境方面,鍵盤會鎖住使用Alt + Tab來切換視窗,
因此如果跟我一樣是個快捷鍵重度使用者,建議先看SyllabusSOA把哪些快捷鍵禁止掉。
此外,聽過一些考友反映考場的鍵盤不是很好打、電腦跑R非常卡
這些問題我自己沒有遇到,但建議如果可以,還是盡量選大城市的考場,
機器設備上會比較沒有疑慮。
畢竟這科金額那麼高、總不會希望出現非預期的狀況。


Noodles
回复

使用道具 举报

小冰 2020-1-25 12:48:02 来自手机
赞~马了六月考
回复 支持 反对

使用道具 举报

humingxue124 2020-2-5 10:35:34
小冰 发表于 2020-1-25 12:48
赞~马了六月考

可以约一起准备嘛????
回复 支持 反对

使用道具 举报

小冰 2020-2-5 13:01:09 来自手机
humingxue124 发表于 2020-2-5 10:35
可以约一起准备嘛????

一起一起
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|精算屋

GMT+8, 2024-4-29 12:02 , Processed in 0.120942 second(s), 23 queries .

Powered by Discuz! X3.4  © 2001-2017 Comsenz Inc.