《數(shù)據(jù)挖掘技術(shù)落地實踐》課程詳情
點擊下載課大綱及報名表
課程簡介
數(shù)據(jù)挖掘和機器學(xué)習(xí)是屬于大數(shù)據(jù)的核心技術(shù)之一,以科學(xué)嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)依據(jù)幫助企業(yè)做分析決策,同時其高深的理論門檻也阻擋了廣大工程師的學(xué)習(xí)上手,在大數(shù)據(jù)時代,如何進(jìn)行基于海量數(shù)據(jù)在成百上千的機器進(jìn)行分布式數(shù)據(jù)挖掘更是需要解決的難題,本課程從實戰(zhàn)角度出發(fā),基于企業(yè)實際需求,深入淺出的講解數(shù)據(jù)挖掘最常用的算法和企業(yè)場景,讓工程師通俗易懂的掌握,并且進(jìn)行編程落地實踐培訓(xùn),讓抽象的算法公式完全落地工程化為企業(yè)所用。
課程大綱
一、大數(shù)據(jù)分析挖掘技術(shù)介紹
1、map/reduce
2、mahout數(shù)據(jù)挖掘
3、sql on hadoop
4、spark生態(tài)體系
5、R語言
6、MPI并行計算
7、GPU并行計算(深度學(xué)習(xí))
8、fourinone并行計算
二、常用機器學(xué)習(xí)算法原理
1、決策樹
2、隨機森林
3、協(xié)同過濾推薦算法
4、樸素貝葉斯算法
5、k-means聚類算法
6、pagerank算法
7、邏輯回歸
三、大數(shù)據(jù)挖掘業(yè)務(wù)場景和生產(chǎn)平臺
1、互聯(lián)網(wǎng)金融業(yè)務(wù)
2、銀行客戶需求業(yè)務(wù)
3、大數(shù)據(jù)分析生產(chǎn)平臺
四、編程實踐
1、迭代類機器學(xué)習(xí)編程入門-求圓周率
2、pagerank的并行化實現(xiàn)(*)
3、邏輯回歸算法的java實現(xiàn)(*)
4、決策樹c45,id3的java實現(xiàn)
5、隨機森林和全樹并行化實現(xiàn)
6、訓(xùn)練數(shù)據(jù)和結(jié)果模擬器
7、模型結(jié)果規(guī)則化處理
課程對象
初中級基礎(chǔ)的工程師,數(shù)據(jù)分析/挖掘/大數(shù)據(jù)技術(shù)人員,企業(yè)數(shù)據(jù)建模/決策人員等等
《數(shù)據(jù)挖掘技術(shù)落地實踐》所屬分類
研發(fā)項目
《數(shù)據(jù)挖掘技術(shù)落地實踐》所屬專題
excel培訓(xùn)、
《數(shù)據(jù)挖掘技術(shù)落地實踐》授課培訓(xùn)師簡介
木巖
(現(xiàn)為知名企業(yè)中間件首席架構(gòu)師)
擅長領(lǐng)域
研發(fā)管理
職業(yè)背景
現(xiàn)任某知名IT企業(yè)中間件首席架構(gòu)師,前淘寶高級專家。先后在淘寶交易、淘寶中間件、集團核心系統(tǒng)、阿里金融等部門工作。曾任金蝶總體架構(gòu)部SOA架構(gòu)師,負(fù)責(zé)設(shè)計ESB。曾艱苦創(chuàng)業(yè),編寫和銷售財務(wù)軟件。
在Java技術(shù)領(lǐng)域從業(yè)十多年,撰寫過多款開源軟件,其中,淘寶分布式技術(shù)框架Fourinone為其代表作。他擁有軟件著作權(quán)的代表作有:BS系列軟件(包括財務(wù)進(jìn)銷存、OA產(chǎn)品、CRM等)、FMS視頻會議、Flash網(wǎng)站生成軟件(華軍可下載),所有軟件作品均貢獻(xiàn)99%代碼。
作品:
CoolHash數(shù)據(jù)庫引擎
出版書籍:《大規(guī)模分布式系統(tǒng)架構(gòu)與設(shè)計實戰(zhàn)》