S3簡單的說就是一個aws提供的雲端儲存服務和空間,可用來做資料備份、log收集、檔案上傳和檔案下載等功用。而使用者可透過設定,針對資料去設定權限,限制存取,提供的data security功能。
S3底下可建很多bucket,使用者可以將檔案上傳到指定的bucket,每個檔案在S3會被當作一個object,檔案只能上傳到bucket那一層,無法上傳到S3那一層。
如果想要在S3去查詢和分析存放的資料(像是log),可以使用S3 Select和Athena,用SQL語法就可以輕鬆查詢object內容。但要注意的是,可以被查詢的資料都要是有格式化的內容,像是CSV或JSON。
S3 Select存取的方式較為簡易,只要選取object,就可以使用S3 Select查詢,缺點是無法一次查詢多個object,而且也只能用簡單的Select指令,最多也只能存取40 MB的資料,如果要查詢bucket底下的所有object,或存取size比較大的object,或許Athena是比較好的選擇(後面會有一天介紹如何使用Athena查詢S3的資料)。