iT邦幫忙

2023 iThome 鐵人賽

DAY 24
0
AI & Data

Airflow 是什麼? 能吃嗎 ? 數據水管工的超級蘑菇系列 第 24

[Day24] 用 Amazon AWS 架設 Airflow 的方法

  • 分享至 

  • xImage
  •  

Amazon AWS 是什麼

Amazon Web Services (AWS) 是全球領先的雲端服務提供商,市占率目前第一,提供許多彈性、擴展性高且可靠的雲端運算服務,包括虛擬伺服器(EC2)、儲存(S3)、資料庫(RDS)、人工智慧、機器學習、物聯網(IoT)等,幫助許多公司節省成本並提高效能(相對於GCP,真的是省很多😂),而且 AWS 支援各種業務需求,提供靈活的計費方式,只需支付實際使用的資源。

方法一:Amazon MWAA

Amazon Managed Workflows for Apache Airflow (MWAA) 是用於執行和管理 Apache Airflow 工作流程,簡化了 Apache Airflow 的操作和管理,讓工程師專注在開發而無需擔心基礎設施,提供了可擴展的計算和存儲資源,也能自動擴展以應對工作負載變化,並提供安全性和監控功能,以確保工作流程的穩定運行。同時,它還與其他 AWS 服務整合,可輕鬆擴展和豐富工作流程的功能。總之,Amazon MWAA 是一個方便且可靠的解決方案,用於管理和運行 Apache Airflow 工作流程。

https://ithelp.ithome.com.tw/upload/images/20231009/20135427VYdHb0IQBd.png

Amazon MWAA 用到哪些服務

Amazon Managed Workflows for Apache Airflow (MWAA) 有許多相關的 AWS 服務來實現其功能和性能。以下是 Amazon MWAA 常用的一些 AWS 服務和組件:

  • Amazon S3(簡單儲存服務):用於存儲工作流程程式碼、數據和日誌等文件。
  • Amazon RDS(關聯式資料庫服務):可選擇用於存儲 Airflow 元數據和任何工作流程中需要的元數據。
  • Amazon CloudWatch:用於監控和記錄工作流程的運行狀態,以便進行性能優化和故障排除。
  • Amazon VPC(虛擬私有雲):用於建立私有網路環境,以確保工作流程的安全性和隔離。
  • Amazon IAM(身份和訪問管理服務):用於管理 AWS 資源的訪問權限,確保只有授權的人員可以訪問 MWAA 資源。
  • Amazon ECR(容器映像存儲庫):用於存儲和管理 Docker 容器映像,如果您在工作流程中使用容器化任務。
  • AWS Secrets Manager:用於管理敏感數據和密碼,例如數據庫密碼和 API 密鑰。
  • Amazon CloudTrail:用於記錄和監控對 MWAA 和相關 AWS 資源的 API 活動。
  • AWS CloudFormation:用於定義和部署 MWAA 環境的基礎設施,以基於代碼方式管理環境。
  • Amazon EKS(Kubernetes服務):如果您使用 Kubernetes 管理容器,則可以將 MWAA 連接到 EKS 集群。

這些 AWS 服務協同工作,使 Amazon MWAA 成為一個可靠的、全面管理的 Apache Airflow 解決方案,用於管理和執行工作流程。根據您的具體需求,可能會使用不同的組合服務。

最基本的也必須使用 Amazon S3Amazon VPCAWS CloudFormation 這些服務,想當然這些也不算在一年的免費服務額度當中/images/emoticon/emoticon02.gif,目前測試最低的資源,一天也需要 300 元台幣(無痛安裝,但錢包會痛)

AWS(Amazon Web Services)免費方案(Free Tier)

AWS(Amazon Web Services)免費方案(Free Tier)是 AWS 提供的一個免費試用計劃,讓新用戶和開發者有機會體驗AWS雲端服務的功能,並開始建立和運行應用程序,而無需支付初期費用,包括Amazon EC2虛擬機器、Amazon S3儲存空間、Amazon RDS資料庫、Lambda函數等,通常期限為一年。但是要注意,有些服務的免費層級限制和條款可能會有所不同,因此使用前應詳細閱讀AWS文檔。
AWS(Amazon Web Services)免費方案(Free Tier)

方法二:Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)是 AWS 提供的多功能且可擴展的雲端服務。使用者可以快速啟動、管理和執行虛擬伺服器,滿足各種計算需求。EC2 優點是靈活性高,讓使用者能夠根據需求輕鬆調整虛擬機器的數量,無需長期承諾或固定硬體成本。具有多種實例類型,針對不同的計算和儲存需求進行優化,EC2提供了預先配置的虛擬機器映像、強大的安全性、網路控制功能(透過虛擬私有雲,VPC)和自動化選項。使用者可以根據需要自訂實例規格,並選擇各種價格模型以滿足其特定需求。

FAQ

Q: 那和 airflow 有什麼關係?

A: Amazon EC2 就像是一台電腦,可以直接架 airflow 在上面


Q: 那要架 airflow 在 EC2 上面有需要開其他 AWS 服務嗎?

A: 非必要,可以直接在 EC2 裡面 run 所有我們之前 local 做的事,但是如果要用 S3、RDS 作為 DB 也都沒問題,都是 AWS 一家人,相互支援都很好


Q: 這樣要多少錢?

A: 如果是用 AWS 免費方案是有機會免費的,可以選擇比較少的資源使用


Q: 所以要怎麼做?

A: 之後就會有詳細的步驟說明了~


上一篇
[Day23] Airflow牙起來-Debug 和 Testing (2)
下一篇
[Day25] Amazon AWS MWAA 無痛部署 Airflow (1)
系列文
Airflow 是什麼? 能吃嗎 ? 數據水管工的超級蘑菇30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言