日本搞逼视频_黄色一级片免费在线观看_色99久久_性明星video另类hd_欧美77_综合在线视频

國內(nèi)最全I(xiàn)T社區(qū)平臺 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當(dāng)前位置:首頁 > php開源 > 綜合技術(shù) > 大數(shù)據(jù)處理之道 (MATLAB 篇<三>)

大數(shù)據(jù)處理之道 (MATLAB 篇<三>)

來源:程序員人生   發(fā)布時間:2015-03-02 08:47:56 閱讀次數(shù):4582次

1:起因

(1)最近1直在處理大數(shù)據(jù),從MB ----> GB的變化,是1次質(zhì)的奔騰,相應(yīng)的工具也在變 從widows到linux,從單機單核 到 hadoop多節(jié)點的計算

(2)問題來了,面對海量的數(shù)據(jù),如何從中發(fā)掘?qū)嵱玫男畔⒒虬l(fā)現(xiàn)潛伏的現(xiàn)象,可視化工具多是必不可少的 ;

(3)可視化工具可以說百度1大篇,可是作為研究者的我們,程序猿的我們可能更希望能夠抽象出1種數(shù)學(xué)模型,對現(xiàn)實的現(xiàn)象進(jìn)行非常好的描寫和刻畫

(4)Python(數(shù)據(jù)清洗和處理) + MATLAB(模型分析) 或 c++/java/hadoop(數(shù)據(jù)清洗和處理) + MATLAB(模型分析

(5)先前的1篇博文可以參考   c++ fstream + string 處理大數(shù)據(jù)  和 大數(shù)據(jù)處理之道 (MATLAB 篇(2))

(6)程序猿鄙視學(xué)習(xí)MATLAB的人,是由于對MATLAB的理解不夠深入,MATLAB是matrix&laboratory兩個詞的組合,意為矩陣工廠(矩陣實驗室);說起處理矩陣(其實就是數(shù)值型的數(shù)組嘛)計算問題那是數(shù)一數(shù)二的快,簡便。MATLAB可以進(jìn)行矩陣運算、繪制函數(shù)和數(shù)據(jù)、實現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等。

2:MATLAB學(xué)習(xí)(遍歷文件夾,矩陣的重新組合,pca)

(1)  save(tofilename, 'ANS', '-ASCII')   保存結(jié)果ANS矩陣到制定路徑tofilename中

(2)num2str(num)  將數(shù)字轉(zhuǎn)化為string型;

(3)strcat(rootpath,num2str(i),'*.csv')  字符串拼接函數(shù) 用于絕對路徑的生成

(4)[coef,score,latent,t2] = princomp(data); 主要成份分析法,latent是貢獻(xiàn)率排序的(從大到小),score是生成的新數(shù)據(jù),根據(jù)貢獻(xiàn)率排序的

3:PCA講授

(1)特點抽取是指將高緯度的特點經(jīng)過某個函數(shù)映照至低緯度作為新的特點。經(jīng)常使用的特點抽取方法就是PCA

(2)當(dāng)貢獻(xiàn)率累加至95%(當(dāng)要求不是特別嚴(yán)格時,85%以上也能夠),以后的維數(shù)會不再顯示;所以根據(jù)貢獻(xiàn)率(例如前兩位已到達(dá)95%),那末最后可以降至2維,便可以只選取SCORE的前兩列來表示原始數(shù)據(jù)。

(3)PCA算法步驟:
設(shè)有m條n維數(shù)據(jù)。
1)將原始數(shù)據(jù)按列組成n行m列矩陣X
2)將X的每行(代表1個屬性字段)進(jìn)行零均值化,即減去這1行的均值
3)求出協(xié)方差矩陣C=frac{1}{m}XX^mathsf{T}
4)求出協(xié)方差矩陣的特點值及對應(yīng)的特點向量
5)將特點向量按對應(yīng)特點值大小從上到下按行排列成矩陣,取前k行組成矩陣P
6)Y=PX即為降維到k維后的數(shù)據(jù)

4:程序(注釋比較詳細(xì))

clc; clear all; close all; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% for i=1:7 %源文件夾路徑 rootpath = 'G:zyp_thanksmetro_test esultMergeODByDay_6'; %輸前途徑 torootpath = 'G:zyp_thanksmetro_test esultMergeODByDay_6_zhengyu'; %源文件夾路徑(獲得指定類型的文件) path = strcat(rootpath,num2str(i),'*.csv'); %輸前途徑 topath = strcat(torootpath,num2str(i),''); %創(chuàng)建輸出文件夾 mkdir(topath); dirs=dir(path); % 替換成你想要的路徑。讀取某個目錄的指定類型文件列表,返回結(jié)構(gòu)數(shù)組。 dataDir=strcat(rootpath,num2str(i),'');%數(shù)據(jù)目錄 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% dircell=struct2cell(dirs)'; % 結(jié)構(gòu)體(struct)轉(zhuǎn)換成元胞類型(cell),轉(zhuǎn)置1下是讓文件名按列排列。 filenames=dircell(:,1); % 第1列是文件名 [m n] = size(filenames); for i=1:m strfilename = [dataDir filenames{i}]; tofilename = [topath filenames{i}]; %fprintf('文件%d:%s ',i,strfilename); X = load(strfilename); %A,B是獲得的不需要改變的數(shù)據(jù),下面作為合并用的 A = X(:,1:2); B = X(:,6:7); %獲得3維向量,用作pca變換 data = X(:,3:5); %pca [coef,score,latent,t2] = princomp(data); newdata = score(:,1:2);%前 2列 ANS = [A newdata B]; save(tofilename, 'ANS', '-ASCII') end end

生活不易,碼農(nóng)辛苦
如果您覺得本網(wǎng)站對您的學(xué)習(xí)有所幫助,可以手機掃描二維碼進(jìn)行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關(guān)閉
程序員人生
主站蜘蛛池模板: 亚洲精品观看 | 国产精品国产三级国产aⅴ入口 | 国产精品一区一区 | 国内外成人在线视频 | 国产精品久久久久久久久久 | 国产一区导航 | 色www永久免费视频首页在线 | 在线免费国产视频 | 亚洲www啪成人一区二区麻豆 | 不用播放器看av | 青青草久草 | 91精品国产综合久久久亚洲 | 亚洲一区二区久久久 | 国产精品99久久久久久www | 日韩成人影片 | 日韩不卡一区二区 | 亚洲一区二区精品在线 | 成人一级毛片 | 特级a做爰全过程片 | 成人国产精品 | 国产超碰在线 | 丝袜 亚洲 另类 欧美 综合 | 天堂网2017 | 久久小视频 | 久久久久久久久久久久久女国产乱 | 日本一区二区三区在线观看视频 | 国产精品99久久久久久www | 精品视频网站 | 精品久久久久久综合日本 | 久久精品99国产精品酒店日本 | 蜜乳视频 | 日本久久精品视频 | 精品福利影院 | 国产一区二区视频在线 | 日韩色网 | 亚洲天堂第一页 | 国产一二三区不卡 | 免费a级毛片永久免费 | 自拍第一页 | 国产视频一区二区三区四区 | 国产三区四区 |