【AWS】AWS Athena 實作 (二) 讀取Csv

06 1月, 2020

【AWS】AWS Athena 實作 (二) 讀取Csv





AWS Athena 讀取csv筆記

由於Athena 底層也是presto,所以實作presto後
會更加理解Athena 





至於Ahena創建資料庫的流程方式,參考如下:
【AWS】AWS Athena 實作 (一) 讀取Json


  (一)創建csv資料
將csv資料丟到指定的bucket


(二)創建資料表
創建好資料庫(參閱之前)後,就要創建資料表,
資料表的創建sql指令如下:
create external table testTable (
device_id int,
mem_id string,
event string,
data string,
ser_id string,
timestamp string
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
LOCATION 's3://xxxxxxxxxxxxx/xxxx/'
TBLPROPERTIES ('skip.header.line.count'='1')
;
view raw aws athena csv hosted with ❤ by GitHub
其中有一行 skip.header.line.count'='1
是用來跳掉csv第一行的欄位定義

(三)測試讀取

SELECT * FROM "testdatabase"."testTable" LIMIT 100; 

張貼留言