開發與維運

阿里雲機器學習平臺PAI使用簡明教程(一)

操作

數據準備


1、DataStudio中創建數據表

_

  • SQL腳本
CREATE TABLE `lm_test_input` (
    `value` bigint,
    `output1` bigint
) ;

2、數據導入

目前支持多種方式將數據導入到表,如果是大數據量導入,請使用tunnel客戶端工具導入數據到表中。本示例使用的數據量較少,直接通過SQL腳本的方式導入數據。

  • SQL腳本
INSERT into table lm_test_input values (1,2);

INSERT into table lm_test_input values (2,4);

INSERT into table lm_test_input values (3,6);

INSERT into table lm_test_input values (4,8);

INSERT into table lm_test_input values (5,10);

select * from lm_test_input; --查看導入的數據

3、數據表
_


模型搭建與訓練


1、新建空表實驗

_

2、拖入組件“源/目標的”讀數據表模塊,配置:
_

3、拖入組件“工具”SQL腳本模塊,用於讀入數據:
_

4、拖入組件“數據預處理”拆分模塊,用於將原數據集拆分為訓練集和測試集:
_

5、拖入組件“機器學習”線性迴歸模塊,分別指定特徵及標籤,用於訓練模型:
_

6、拖入組件“機器學習”預測模塊,用於預測測試集的情況:
_

7、整個流程:
_

8、點擊運行按鈕運行整個模型,當然也可以點擊到具體的模塊選擇運行到此處,還可以分別查詢各個模塊的運行結果:

_

9、運行的結果:

_


模型的部署與調用

機器學習模型在線部署功能可以將您的模型一鍵部署為Restful API,您可以通過HTTP請求的方式進行調用。

1、部署模型

注意: 模型正常運行後才能部署,並不是搭建的實驗都能生成模型,普通的數值處理不能生成模型,常見的可以生成模型算法包括:GBDT二分類、線性支持向量機、邏輯迴歸二分類、邏輯迴歸多分類、隨機森林、KMeans、線性迴歸、GBDT迴歸(GBDT迴歸算法不支持int型數據格式輸入,所以在部署前請注意GBDT算法輸入應為Double型)、Tensorflow等。

_

2、Rest調用的參數
_

3、在線調試

_

4、程序調用(value:100)

實例Demo下載地址

_

5、監控

_

6、目前直接測試API功能默認分配的是二級域名,二級域名僅供測試使用,有每天1000次的訪問限制。如果您有更大需求,請在分組管理界面單擊綁定域名,對該API所在的分組進行域名綁定。具體參考模型在線部署使用說明


更多參考

什麼是阿里雲機器學習

機器學習

Leave a Reply

Your email address will not be published. Required fields are marked *