雲計算

阿里雲 MaxCompute 2020-10 月刊

【10月新功能發佈】

1、MaxCompute 支持 sort by 不帶 distribute by

MaxCompute 支持 sort by 不帶 distribute by,提供數據重排的解決方案,提高SQL執行的過濾性能。

適用客戶
開發者

發佈功能
MaxCompute 支持不帶 distribute by 的sort by,提供數據重排的解決方案,提高謂詞下推的過濾性能。當 sort by 語句前沒有 distribute by 時能夠增加存儲壓縮率,同時讀取的時候如果有過濾,能夠利用這個信息減少真正從磁盤讀取的數據量,提高後面進行的全局排序的效率。

查看文檔 >>

2、SEMI JOIN 支持 MAPJOIN Hint

SEMI JOIN 支持 MAPJOIN Hint,提高 LEFT SEMI/ANTI JOIN的性能,為數據傾斜問題提供解決方案。

適用客戶
開發者,分析師

發佈功能
當一個大表和一個或多個小表JOIN時,用戶可以在 SELECT 語句中顯式指定 MAPJOIN Hint 以提升查詢性能。目前 MAPJOIN Hint 進一步支持 LEFT SEMI JOIN 和 LEFT ANTI JOIN, 可以提高 SEMI JOIN 的性能,同時也為數據傾斜問題提供解決方案。

查看文檔 >>

3、OSS 外部表 CSV/TSV 文件支持 GBK 編碼格式

OSS 外部表 CSV/TSV 文件支持 GBK 編碼格式。

適用客戶
開發者

發佈功能
OSS 外部表 odps.text.option.encoding 原先支持三種格式:UTF-8/UTF-16/US-ASCII,在新版本中增加了對GBK編碼格式的支持。

查看文檔 >>

4、批量 Drop Partition 支持條件篩選

使用條件表達式匹配選中的分區進行批量刪除,滿足用戶希望一次刪除符合某個規則的一個或多個分區的需求。

適用客戶
開發者、數據倉庫管理員

發佈功能
支持條件篩選方式刪除分區。如果用戶希望一次性刪除符合某個規則條件的一個或多個分區,可以使條件表達式匹配選中的分區進行批量刪除。

查看文檔 >>

5、MaxCompute 新增支持更多內置函數

新增 WIDTH_BUCKET 函數,時間函數 year/quarter/month 等對 DateTime 輸入數據類型的支持。

適用客戶
開發者、數據分析師

發佈功能
WIDTH_BUCKET函數:獲取某個字段值落入的分組編號,設定分組範圍的最小值和最大值,以及分組個數,構建指定個數的大小相同的分組,返回字段值落入的分組編號。
時間函數 year/quarter/month/day/hour/minute/second 增加對DateTime輸入數據類型的支持 - 增加如下內建函數接口:
• INT year(datetime date)
• INT quarter(datetime date)
• INT month(datetime date)
• INT day(datetime date)
• INT hour(datetime date)
• INT minute(datetime date)
• INT second(datetime date)

查看文檔 >> 查看文檔 >>

6、MaxCompute 寫表支持Zorder by語句

增加 SQL DML的 zorder by 語句,支持把數據相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。

適用客戶
開發者、數據分析師

發佈功能
增加 SQL DML 的 zorder by 語句,支持DML語句的方式把數據相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。

查看文檔 >>

閱讀往期月刊 >>
MaxCompute 產品官網 >>
免費下載《SaaS模式雲數據倉庫手冊》>>

更多關於大數據計算產品技術交流,可掃碼加入 “MaxCompute開發者社區” 釘釘群
123.jpg

Leave a Reply

Your email address will not be published. Required fields are marked *