使用BigQuery的第一步,原則上就是開始把資料丟上BigQuery... 在Google Cloud Platform中有許多產品已經支援直接upload到BigQuery中,可以參考 官方網站 的說明... 這邊介紹的是如何將現成的JSON data匯入到BigQuery中(因為CSV相對簡單許多,這邊不贅述CSV的載入),使用到的工具是gsutil,建議可使用Cloud Platform整合版本的(這邊可以 下載 ) Sample Schema (1 record only) BigQuery原則上吃csv與json兩種格式,其中json格式與標準的json有些許不同,他強調的是 NEWLINE_DELIMITED_JSON,也就是說,每筆row之間是使用斷行隔開,而且每筆row就是獨立的一筆json資料欄... 但有別於csv,json格式的檔案是允許內部再有子階層的資料型態,以本範例為例,items為新的一個json array,可想像成RDBMS中的detail table資料... { "transaction_time": "2013-10-20T14:32:22", "transaction_id": 50124, "total_spending": 300, "coupon_discount": 20, "items": [ { "name": "xt920", "category": "mobile", "quantity": 10, "spending": 320 }, { "name": "xt920b", ...