《關(guān)于舉辦“Python和R數(shù)據(jù)挖掘技術(shù)— 基于Python和R語(yǔ)言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)”培訓(xùn)的通知》課程詳情
點(diǎn)擊下載課大綱及報(bào)名表
各有關(guān)單位:
中國(guó)科學(xué)院計(jì)算技術(shù)研究所是國(guó)家專門(mén)的計(jì)算技術(shù)研究機(jī)構(gòu),同時(shí)也是中國(guó)信息化建設(shè)的重要支撐單位,中科院計(jì)算所培訓(xùn)中心是致力于高端IT類人才培養(yǎng)及企業(yè)內(nèi)訓(xùn)的專業(yè)培訓(xùn)機(jī)構(gòu)。中心憑借科學(xué)院的強(qiáng)大師資力量,在總結(jié)多年大型軟件開(kāi)發(fā)和組織經(jīng)驗(yàn)的基礎(chǔ)上,自主研發(fā)出一整套課程體系,其目的是希望能夠切實(shí)幫助中國(guó)軟件企業(yè)培養(yǎng)高級(jí)軟件技術(shù)人才,提升整體研發(fā)能力,迄今為止已先后為國(guó)家培養(yǎng)了數(shù)萬(wàn)名計(jì)算機(jī)專業(yè)人員,并先后為數(shù)千家大型國(guó)內(nèi)外企業(yè)進(jìn)行過(guò)專門(mén)的定制培訓(xùn)服務(wù)。
隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)切實(shí)地迎來(lái)了一個(gè)大數(shù)據(jù)的時(shí)代。如何對(duì)海量數(shù)據(jù)進(jìn)行挖掘和分析,已經(jīng)成為一個(gè)非常重要且緊迫的需求。
R是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具,也是GNU的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件。R包括一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲(chǔ)和處理系統(tǒng),數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大),完整連貫的統(tǒng)計(jì)分析工具,優(yōu)秀的統(tǒng)計(jì)制圖功能。
Python是一個(gè)數(shù)據(jù)分析和圖形顯示的程序設(shè)計(jì)環(huán)境,用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境。Python有簡(jiǎn)便而強(qiáng)大的編程語(yǔ)言:可操縱數(shù)據(jù)的輸入和輸入,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。
本培訓(xùn)將對(duì)基于Python和R語(yǔ)言進(jìn)行數(shù)據(jù)處理、數(shù)據(jù)探索的基本方法,利用R語(yǔ)言實(shí)現(xiàn)模型選擇、Logistic回歸及決策樹(shù)算法,以及貝葉斯算法及支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等算法原理及實(shí)現(xiàn)進(jìn)行講解。具體事宜通知如下:
證書(shū)
培訓(xùn)結(jié)束,頒發(fā)中科院計(jì)算所職業(yè)培訓(xùn)中心“Python和R數(shù)據(jù)挖掘技術(shù)-基于Python和R語(yǔ)言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)”結(jié)業(yè)證書(shū)。
培訓(xùn)對(duì)象
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開(kāi)發(fā)人員。
2,牽涉到數(shù)據(jù)挖掘和統(tǒng)計(jì)分析的數(shù)據(jù)中心運(yùn)行、規(guī)劃、設(shè)計(jì)負(fù)責(zé)人。
3,政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)和互聯(lián)網(wǎng)等大數(shù)據(jù)來(lái)源單位的負(fù)責(zé)人。
4,高校、科研院所牽涉到數(shù)據(jù)挖掘與統(tǒng)計(jì)分析處理的項(xiàng)目負(fù)責(zé)人。
學(xué)員基礎(chǔ)
1,對(duì)IT系統(tǒng)設(shè)計(jì)有一定的理論與實(shí)踐經(jīng)驗(yàn)。
2,對(duì)數(shù)據(jù)挖掘和數(shù)據(jù)處理方法有一定的基礎(chǔ)知識(shí)。
3,對(duì)Hadoop/Spark等大數(shù)據(jù)技術(shù)有一定的了解。
培訓(xùn)內(nèi)容
第一講 數(shù)據(jù)挖掘,Python和R簡(jiǎn)介
1.1 數(shù)據(jù)挖掘
1.2 Python語(yǔ)言
1.3 R語(yǔ)言
1.4 Iris數(shù)據(jù)集
1.5 Bodyfat數(shù)據(jù)集
第二講 數(shù)據(jù)的導(dǎo)入與導(dǎo)出
2.1 R數(shù)據(jù)的保存與加載
2.2 CSV文件的導(dǎo)入與導(dǎo)出
2.3 通過(guò)ODBC從數(shù)據(jù)庫(kù)中讀取數(shù)據(jù)
2.4 從Excel中導(dǎo)入與導(dǎo)出數(shù)據(jù)
2.5 Python的數(shù)據(jù)操作
第三講 數(shù)據(jù)可視化展現(xiàn)
3.1 查看數(shù)據(jù)
3.2 單個(gè)變量展現(xiàn)
3.3 多個(gè)變量展現(xiàn)
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹(shù)與隨機(jī)森林
4.1 使用party包構(gòu)建決策樹(shù)
4.2 使用rpart包構(gòu)建決策樹(shù)
4.3 隨機(jī)森林
4.4 Python中的決策樹(shù)實(shí)現(xiàn)
4.5 Python決策樹(shù)實(shí)例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實(shí)現(xiàn)
5.6 Python回歸實(shí)例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實(shí)現(xiàn)
6.6 Python聚類實(shí)例
第七講 離群點(diǎn)檢測(cè)
7.1 單變量的離群點(diǎn)檢測(cè)
7.2 局部離群點(diǎn)因子檢測(cè)
7.3 用聚類方法進(jìn)行離群點(diǎn)檢測(cè)
7.4 時(shí)間序列數(shù)據(jù)的離群點(diǎn)檢測(cè)
7.5 Python中的孤立點(diǎn)實(shí)例
第八講 時(shí)間序列分析
8.1 R中的時(shí)間序列數(shù)據(jù)
8.2 時(shí)間序列分解
8.3 時(shí)間序列預(yù)測(cè)
8.4 時(shí)間序列聚類
8.5 時(shí)間序列分類
8.6 Python中的時(shí)間序列實(shí)例
第九講 關(guān)聯(lián)規(guī)則
9.1 關(guān)聯(lián)規(guī)則的基本概念
9.2 Titanic數(shù)據(jù)集
9.3 關(guān)聯(lián)規(guī)則挖掘
9.4 消除冗余
9.5 解釋規(guī)則
9.6 關(guān)聯(lián)規(guī)則的可視化
9.7 Python中的關(guān)聯(lián)規(guī)則實(shí)例
第十講 社交網(wǎng)絡(luò)分析
10.1 詞項(xiàng)網(wǎng)絡(luò)
10.2 推文網(wǎng)絡(luò)
10.3 雙模式網(wǎng)絡(luò)
10.4 Python中的社交網(wǎng)絡(luò)分析實(shí)例
《關(guān)于舉辦“Python和R數(shù)據(jù)挖掘技術(shù)— 基于Python和R語(yǔ)言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)”培訓(xùn)的通知》課程目的
1, 全面了解Python和R語(yǔ)言數(shù)據(jù)挖掘的相關(guān)知識(shí)。
2,學(xué)習(xí)Python和R的數(shù)據(jù)挖掘核心技術(shù)方法以及應(yīng)用特征。
3,深入使用Python和R在數(shù)據(jù)挖掘和分析中的使用。
《關(guān)于舉辦“Python和R數(shù)據(jù)挖掘技術(shù)— 基于Python和R語(yǔ)言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)”培訓(xùn)的通知》所屬分類
市場(chǎng)營(yíng)銷
《關(guān)于舉辦“Python和R數(shù)據(jù)挖掘技術(shù)— 基于Python和R語(yǔ)言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)”培訓(xùn)的通知》所屬專題
excel培訓(xùn)、
營(yíng)銷數(shù)據(jù)分析、
分析銷售數(shù)據(jù)、
《關(guān)于舉辦“Python和R數(shù)據(jù)挖掘技術(shù)— 基于Python和R語(yǔ)言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)”培訓(xùn)的通知》授課培訓(xùn)師簡(jiǎn)介
楊老師
楊老師 主要研究網(wǎng)絡(luò)信息分析以及云計(jì)算相關(guān)技術(shù),長(zhǎng)期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開(kāi)發(fā)工作,主持和參與了多個(gè)國(guó)家和省部級(jí)基金項(xiàng)目,具有豐富的工程實(shí)踐及軟件研發(fā)經(jīng)驗(yàn)。