- 課程詳情
- 上課校區(qū)(1)
關(guān)于舉辦“Python和R數(shù)據(jù)挖掘技術(shù)-基于Python和R語言的數(shù)據(jù)挖掘和統(tǒng)計分析技術(shù)”培訓(xùn)的通知
各有關(guān)單位:
中國科學(xué)院計算技術(shù)研究所是國家專門的計算技術(shù)研究機構(gòu),同時也是中國信息化建設(shè)的重要支撐單位,中科院計算所培訓(xùn)中心是致力于高端IT類人才培養(yǎng)及企業(yè)內(nèi)訓(xùn)的專業(yè)培訓(xùn)機構(gòu)。中心憑借科學(xué)院的強大師資力量,在總結(jié)多年大型軟件開發(fā)和組織經(jīng)驗的基礎(chǔ)上,自主研發(fā)出一整套課程體系,其目的是希望能夠切實幫助中國軟件企業(yè)培養(yǎng)高級軟件技術(shù)人才,提升整體研發(fā)能力,迄今為止已先后為國家培養(yǎng)了數(shù)萬名計算機專業(yè)人員,并先后為數(shù)千家大型國內(nèi)外企業(yè)進行過專門的定制培訓(xùn)服務(wù)。
隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)切實地迎來了一個大數(shù)據(jù)的時代。如何對海量數(shù)據(jù)進行挖掘和分析,已經(jīng)成為一個非常重要且緊迫的需求。
R是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具,也是GNU的一個自由、免費、源代碼開放的軟件。R包括一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲和處理系統(tǒng),數(shù)組運算工具(其向量、矩陣運算方面功能尤其強大),完整連貫的統(tǒng)計分析工具,優(yōu)秀的統(tǒng)計制圖功能。
Python是一個數(shù)據(jù)分析和圖形顯示的程序設(shè)計環(huán)境,用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。Python有簡便而強大的編程語言:可操縱數(shù)據(jù)的輸入和輸入,可實現(xiàn)分支、循環(huán),用戶可自定義功能。
本培訓(xùn)將對基于Python和R語言進行數(shù)據(jù)處理、數(shù)據(jù)探索的基本方法,利用R語言實現(xiàn)模型選擇、Logistic回歸及決策樹算法,以及貝葉斯算法及支持向量機、神經(jīng)網(wǎng)絡(luò)等算法原理及實現(xiàn)進行講解。具體事宜通知如下:
一、培訓(xùn)對象
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員。
2,牽涉到數(shù)據(jù)挖掘和統(tǒng)計分析的數(shù)據(jù)中心運行、規(guī)劃、設(shè)計負責人。
3,政府機關(guān),金融保險、移動和互聯(lián)網(wǎng)等大數(shù)據(jù)來源單位的負責人。
4,高校、科研院所牽涉到數(shù)據(jù)挖掘與統(tǒng)計分析處理的項目負責人。
1,對IT系統(tǒng)設(shè)計有一定的理論與實踐經(jīng)驗。
2,對數(shù)據(jù)挖掘和數(shù)據(jù)處理方法有一定的基礎(chǔ)知識。
3,對Hadoop/Spark等大數(shù)據(jù)技術(shù)有一定的了解。
三、師資
由業(yè)界知名大數(shù)據(jù)專家親自授課:
楊老師 主要研究網(wǎng)絡(luò)信息分析以及云計算相關(guān)技術(shù),長期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發(fā)經(jīng)驗。
四、培訓(xùn)內(nèi)容
第一講 數(shù)據(jù)挖掘,Python和R簡介
1.1數(shù)據(jù)挖掘
1.*****on語言
1.3 R語言
1.4 Iris數(shù)據(jù)集
1.5 Bodyfat數(shù)據(jù)集
第二講 數(shù)據(jù)的導(dǎo)入與導(dǎo)出
2.1 R數(shù)據(jù)的保存與加載
2.2 CSV文件的導(dǎo)入與導(dǎo)出
2.3 通過ODBC從數(shù)據(jù)庫中讀取數(shù)據(jù)
2.4 從Excel中導(dǎo)入與導(dǎo)出數(shù)據(jù)
2.5 Python的數(shù)據(jù)操作
第三講 數(shù)據(jù)可視化展現(xiàn)
3.1 查看數(shù)據(jù)
3.2 單個變量展現(xiàn)
3.3 多個變量展現(xiàn)
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機森林
4.1 使用party包構(gòu)建決策樹
4.2 使用rpart包構(gòu)建決策樹
4.3 隨機森林
4.4 Python中的決策樹實現(xiàn)
4.5 Python決策樹實例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實現(xiàn)
5.6 Python回歸實例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實現(xiàn)
6.6 Python聚類實例
第七講 離群點檢測
7.1 單變量的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數(shù)據(jù)的離群點檢測
7.5 Python中的孤立點實例
第八講 時間序列分析
8.1 R中的時間序列數(shù)據(jù)
8.2 時間序列分解
8.3 時間序列預(yù)測
8.4 時間序列聚類
8.5 時間序列分類
8.6 Python中的時間序列實例
第九講 關(guān)聯(lián)規(guī)則
9.1 關(guān)聯(lián)規(guī)則的基本概念
9.2 Titanic數(shù)據(jù)集
9.3 關(guān)聯(lián)規(guī)則挖掘
9.4 消除冗余
9.5 解釋規(guī)則
9.6 關(guān)聯(lián)規(guī)則的可視化
9.7 Python中的關(guān)聯(lián)規(guī)則實例
第十講 社交網(wǎng)絡(luò)分析
10.1 詞項網(wǎng)絡(luò)
10.2 推文網(wǎng)絡(luò)
10.3 雙模式網(wǎng)絡(luò)
10.4 Python中的社交網(wǎng)絡(luò)分析實例
五、培訓(xùn)目標
1, 全面了解Python和R語言數(shù)據(jù)挖掘的相關(guān)知識。
2,學(xué)習(xí)Python和R的數(shù)據(jù)挖掘核心技術(shù)方法以及應(yīng)用特征。
3,深入使用Python和R在數(shù)據(jù)挖掘和分析中的使用。
六、時間、地點
時間: 2018年4月10日-4月12日 地點:北京
2018年5月16日-5月18日 地點:上海
七、證書
培訓(xùn)結(jié)束,頒發(fā)中科院計算所職業(yè)培訓(xùn)中心“Python和R數(shù)據(jù)挖掘技術(shù)-基于Python和R語言的數(shù)據(jù)挖掘和統(tǒng)計分析技術(shù)”結(jié)業(yè)證書。
八、費用
培訓(xùn)費:5800元/人(含教材、證書、午餐、學(xué)習(xí)用具)。住宿協(xié)助安排,費用自理。
-
海淀校區(qū)
地址:中關(guān)村958樓
電話:400-029-0976 轉(zhuǎn) **** 查看號碼
關(guān)于我們 詳情
中科院計算所培訓(xùn)學(xué)校(北京市海淀區(qū)中科院計算所職業(yè)技能培訓(xùn)學(xué)校)成立于1987年,是計算所根據(jù)國家普及計算機知識,培養(yǎng)專業(yè)計算機人才而創(chuàng)建的。培訓(xùn)中心依托中國科學(xué)院強大的技術(shù)背景,歷經(jīng)二十年的發(fā)展,為全國各企事業(yè)單位、部隊、院校等累計培養(yǎng)了近十七萬人次的計算機專業(yè)人才,并為多家企業(yè)提供了高質(zhì)量的咨詢服務(wù),現(xiàn)已形成企業(yè)內(nèi)訓(xùn)、高端公開課、GJB5000A/CMMI培訓(xùn)與咨詢、企業(yè)全方位咨詢服務(wù)四大業(yè)務(wù)模塊,在業(yè)界具有良好信譽。“科學(xué)、高效、權(quán)威、品質(zhì)”是北京市海淀區(qū)中科院計算所職業(yè)技能培訓(xùn)學(xué)校的經(jīng)營宗旨,面向企業(yè)人是其明確的市場定位。中科院計算所針對企業(yè)的信息化建設(shè)具有悠久的歷史,其IT技術(shù)培訓(xùn)是一個長期積累、與時俱進的過程。1987年,我國的信息化建設(shè)十分滯后,計算機相關(guān)設(shè)備僅見于政府、部隊和部分大型國內(nèi)企業(yè),專業(yè)技術(shù)急待普及,中科院計算所適時創(chuàng)建了培訓(xùn)中心,從計算機的基本概念、原理和維護到Windows、unix、linux應(yīng)用到Oracle、DB2、數(shù)據(jù)倉庫、J2EE、.net,再到現(xiàn)在高端企業(yè)級需求分析、架構(gòu)設(shè)計、系統(tǒng)設(shè)計及咨詢、云計算、海量數(shù)據(jù),始終與國際較前沿的IT技術(shù)接軌。25年,培訓(xùn)中心的服務(wù)廣泛應(yīng)用于全國各地電信、通信、電力、石化、金融、教育、部隊、交通、醫(yī)藥、服務(wù)等各行各業(yè),為我國的信息化建設(shè)做出了卓越的貢獻,成為中國IT精英權(quán)威培訓(xùn)咨詢機構(gòu)。北京市海淀區(qū)中科院計算所職業(yè)技能培訓(xùn)學(xué)校擁有一批具有多年豐富實際開發(fā)與教學(xué)經(jīng)驗兼?zhèn)涞膬?yōu)秀專職教師隊伍、咨詢專家,有一支活躍于軟件行業(yè)的研發(fā)團隊。中心憑借強大的師資力量,把握當今世界較前沿的開發(fā)技術(shù),在總結(jié)多年大型軟件開發(fā)和組織經(jīng)驗的基礎(chǔ)上,自主研發(fā)出百門課程體系,滿足企業(yè)各層次的培訓(xùn)需求,其目的是希望通過有經(jīng)驗高水平教師的講授來真正解決企業(yè)信息化建設(shè)中的問題,切實幫助中國軟件企業(yè)培養(yǎng)高級軟件技術(shù)人才,提升企業(yè)的整體研發(fā)能力。授課教師從思想、方法和技術(shù)三個層面系統(tǒng)討論企業(yè)信息化建設(shè)及大型軟件設(shè)計理論和方法,并且通過一些精心選擇的案例,揉合教師的大型項目經(jīng)驗,以項目過程中的問題帶動原理的描述,理論和實際相結(jié)合,重點講清問題,從而使學(xué)員在企業(yè)信息化建設(shè)項目中發(fā)揮更大的作用。面對千變?nèi)f化的IT技術(shù),北京市海淀區(qū)中科院計算所職業(yè)技能培訓(xùn)學(xué)校不僅傳授給學(xué)員當今IT潮流較核心的前沿技術(shù)和解決問題的方法,同時也為學(xué)員提供后續(xù)技術(shù)支持,更指導(dǎo)學(xué)員如何把握技術(shù)動態(tài)的方法和考慮問題、潛心學(xué)習(xí)的思維方式,旨在為國內(nèi)外各企事業(yè)單位培養(yǎng)實用型、潛力型IT高端管理、創(chuàng)新人才,實現(xiàn)“與企業(yè)共發(fā)展,同攜手開創(chuàng)未來”的美好愿景。我們承諾:充分的資源共享、完善的管理模式和立足潮頭的前沿技術(shù),必將使您在更廣的領(lǐng)域享受到更佳的培訓(xùn)服務(wù)!為了明天,我們一起努力