iT邦幫忙

2021 iThome 鐵人賽

DAY 18
0

在前面的MLOps在金融產業:常見案例與工作流程文章當中,曾經提到,在金融業當中的MLOps可帶來的規範文件、常見工作流程。

今天將針對提供安全的機器學習環境來討論:

在金融產業,機器學習環境的安全性至關重要,特別是各種資料的授權。在開發過程當中必須關注到:未經授權的訪問、權限提升和資料洩露等等。以下四點是設置安全的機器學習環境時的常見註意事項:
(1)計算和網路隔離
(2)身份驗證和授權
(3)資料加密
(4)可審計性

計算和網路隔離

管理良好且安全的機器學習工作流程來自於建立私有且隔離的計算和網路環境。必須確保在開發的過程當中,是在內部的私有環境下開發,外部人員不能輕易拜訪開發的環境。

以Amazon SageMaker舉例,當中的Jupyter notebook、用來跑訓練跟預測的機器、模型託管等服務,都可以透過設定的VPC去拜訪。並且可以透過網路接口的控制來確保安全性。像是可以透過安全組(security group),相當於虛擬防火牆,用於管制入站和出站流量、限制可拜訪的IP來源,設定讓拜訪者透過HTTP或HTTPS訪問等等。

SageMaker與其他的AWS服務之間也有VPC的終端節點,透過終端節點的策略設置,可以進一步的設置特定支援的訪問。比如說訓練模型跟模型託管的時候會使用到的EC2跟S3服務,這些偷可以在VPC裡面溝通。透過這個方式可以管制誰能夠拜訪開發環境,以及讓開發環境在安全性高的狀況下設置。透過下圖你可以了解大概的觀念。


*圖片來源:Machine Learning Best Practices in Financial Services

相關主題的延伸閱讀:

身份驗證和授權

承接著私有的網路環境設置之後,下一步則是要確保:只有經過授權的用戶才可以訪問該服務。AWS Identity and Access Management (IAM) 的設置可以完成這一項任務,例如:訪問SageMaker開發環境、訪問S3資料儲存、可否透過RESTful方式呼叫等等。這些授權包含:誰,能夠對什麼服務,內部的哪些資源,進行什麼操作(新增、刪除、拜訪、修改)。

對於開發環境的設置,建議讓每個資料科學家只能拜訪自己的SageMaker Jupyter notebook 所置放的機器,並且禁止使用者對該機器根目錄的拜訪,這個訪問也受到IAM的管理。或是透過pre-signed url來存取該Jupyter notebook,在限定的時間內透過這個連結拜訪該筆記本。

雖然每個公司都有不同組織架構、身份授權和訪問要求,但是仍然應該根據 IAM 最佳實踐以設定。透過授予最低權限訪問權限,以及設定特定使用服務的行為,來配置權限。

另一個常見的配製方法,則是透過AWS Config搭配基於角色的訪問控制 (RBAC)來設置IAM。RBAC是在金融業當中常見的一種配製方法,確保只有授權者才能訪問所需的系統,並根據該授權者所擁有的角色,設置不同的使用服務策略。這個設置同時也需要與團隊成員名單符合,確保不再維護這個專案的人員不應該擁有相關資源的使用權限。

資料加密

由於機器學習的開發可能包含敏感數據和知識產權,因此安全 ML 環境的第三個考慮因素是資料的加密。資料的加密,例如當資料儲存在S3以及Amazon EBS的時候,透過客戶管理的客戶密鑰 (CMK)進行加密。並讓S3的儲存預設為加密儲存。

在各服務中傳輸的資料,也都需要支援TLS 1.2以上的版本加密。例如分散式的模型運算的資料運輸,可以啟用容器間流量加密,這過程會增加整個訓練流程的執行時間,但是資料的加密仍然是安全性系統當中重要的一環。

可審計性

管理良好且安全的 ML 環境的第四個考慮因素是擁有強大且透明的追蹤與審計。記錄對資料和模型的所有訪問和更改,包含模型架構配置或超參數的更改。

AWS CloudTrail 是一項服務,可以記錄、持續監控和保留與 AWS 基礎設施中的操作相關活動。CloudTrail 記錄每個 AWS API 調用並提供帳戶活動的事件歷史記錄,讓你可以方便的查找。另外AWS CloudTrail還提供識別淺在的安全威脅事件,或者異常事件的檢測。並且跟Amazon CloudWatch整合,可以有更大的彈性設置要監管的相關活動。

延伸閱讀:

結語

透過這四個步驟,以及相關的服務配置,結合這些服務達到整個系統的開發、部署、使用監管。能夠提升ML專案的安全性。

Reference
[1]. Machine Learning Best Practices in Financial Services


上一篇
MLOps在金融產業:常見案例與工作流程
下一篇
MLOps在金融產業:看懂金融審計如何導入ML專案(附所需文件清單)
系列文
談MLOps - 模型、專案架構、產品化及維運29
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言