阿里的數(shù)加平臺最近推出了機器學習數(shù)據(jù)實驗室,由因而基于ODPS創(chuàng)建,運算方面絲絕不是問題,繼承了ODPS的大數(shù)據(jù)計算能力。
算法方面,常見的2分類、多分類、線性回歸、聚類、圖計算等都有提供,純圖形的操作方式也很簡單。
計費方式同ODPS差不多,按IO和計算量計費,起步門坎很低。
有興趣可以玩1玩:https://data.aliyun.com/product/learn
老碼農(nóng)玩了1段時間,覺得唯1的遺憾就是數(shù)據(jù)處理方式提供的比較少,不過在這方面R倒是個不錯的補充,阿里云也提供了RODPS這個R包供使用。這里簡單描寫下使用步驟。
1、使用R進行數(shù)據(jù)處理之前,先需要對ODPS項目中的大數(shù)據(jù)做抽樣。這個阿里云機器學習實驗室提供了分層、隨機、加權(quán)幾種抽樣方式。
2、將抽樣數(shù)據(jù)寫到ODPS項目中,在R中使用RODPS連接并獲得數(shù)據(jù),存儲到data frame中。
3、接下來用R針對樣本做處理,如特點選擇,統(tǒng)計檢驗等。最后把處理結(jié)果輸出報表,或同步到ODPS項目中,使用阿里云提供的在線報表生成報表。