你的位置: 首頁 > 公開課首頁 > 互聯網/語言 > 課程詳情

details

大數據前沿技術分析與應用

暫無評價   
  • 開課時間:2017年03月24日 09:00 周五 已結束
  • 結束時間:2017年03月26日 17:00
  • 開課地點:北京市
  • 授課講師: 楊老師
  • 課程編號:331276
  • 課程分類:互聯網/語言
  •  
  • 收藏 人氣:751
你實際購買的價格
付款時最多可用0淘幣抵扣0元現金
購買成功后,系統會給用戶帳號返回的現金券
淘課價格
5700
可用淘幣
0
返現金券
待定

你還可以: 收藏

培訓受眾:

1,系統架構師、系統分析師、高級程序員、資深開發人員。

2,牽涉到數據挖掘和統計分析的數據中心運行、規劃、設計負責人。

3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。

4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。

課程收益:

1、全面了解大數據前沿技術的相關知識。

2、學習大數據前沿技術平臺、方法以及應用特征。

3、學習使用大數據挖掘和分析中的使用。

4、了解Hadoop、Spark等技術的融合使用。

培訓頒發證書:

培訓結束,頒發培訓中心“大數據前沿技術分析與應用”結業證書。

課程大綱:

從2008年Natural正式定義“大數據”開始,以Hadoop為代表的大數據處理和分析工具,以其可伸縮性、健壯性、計算性能和成本上具有無可替代的優勢,事實上已成為當前互聯網企業主流數據分析平臺。大數據相關技術最近幾年出現了井噴的趨勢,眾多技術紛紛出現,典型的系統包括Hadoop、Spark、Flume、Scribe、Kafka、Storm、Mahout、MLlib、Docker等,涵蓋網絡數據爬取、日志采集、分布式消息訂閱、大數據分析挖掘等方面,涉及離線批處理、實時處理、流式處理等多種處理方式。這些技術來源于國外不同的著名大公司和科研院校(例如Storm源自Twitter,Spark源自UC Berkley),且大都以開源方式公開,用于解決不同的應用需求,涉及面廣,技術要求高,交叉知識范圍廣,知識內容更新頻繁,要理清其中的關系,從中發現最適合本機構的技術,成為了目前各機構技術專家的一個難點。

面對如此眾多的新技術,為協助各機構研究人員對大數據前沿技術有一個深入了解,解決廣大系統設計人員深入研究與開發大數據技術的需要,中科院計算所培訓中心特舉辦“大數據前沿技術分析與應用”培訓班,具體事宜通知如下:

?

一、培訓對象

1,系統架構師、系統分析師、高級程序員、資深開發人員。

2,牽涉到數據挖掘和統計分析的數據中心運行、規劃、設計負責人。

3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。

4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。

?

二、師資

由業界知名分式存儲專家親自授課:

楊老師 主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。

?

三、培訓內容

第一講 大數據技術基礎

? 1)大數據應用需求及潛在價值分析

? 2)大數據與數據庫解決方案的對比

? 3)國內外主流的大數據解決方案

? 4)開源的大數據生態系統平臺剖析

? 5)大數據下的技術選型與架構設計

第二講 批處理大數據平臺Hadoop

? 1)Hadoop及其運行架構

? 2)HDFS分布式文件系統

? 3)MapReduce計算模型

? 4)HBase大表管理技術

? 5)Hadoop平臺使用和實操

第三講 實時大數據平臺Spark

1) Spark實時處理技術

2) 彈性分布式數據集RDD

? 3)Spark分布式計算框架

? 4)Spark的BDAS生態系統

? 5)Spark平臺使用和實操

第四講 流式大數據平臺Storm

? 1)流式大數據處理架構

? 2)Storm在企業應用介紹

? 3)Storm拓撲及流分組

? 4)Spout和Bolt詳解

? 5)分布式DPRC和Trident

6)Storm平臺使用和實操

第五講 Python網絡爬蟲

? 1)網絡爬蟲基礎

? 2)urllib和urllib2庫的用法

? 3)Python 正則表達式

? 4)Beautiful Soup使用

? 5)用Scrapy采集示例實操

第六講 大數據日志采集工具Flume

? 1)日志采集及Scribe介紹

2)Flume-NG數據流模型

? 3)Flume平臺架構

? 4)Flume集群部署配置

? 5)Flume應用案例實操

第七講 分布式消息訂閱工具Kafka

? 1)Kafka應用介紹

? 2)Kafka平臺架構

? 3)Kafka集群部署與配置

? 4)Kafka應用案例實操

第八講 NoSQL云數據處理工具

?? 1)NoSQL技術及云數據庫介紹

?? 2)HBase列數據存儲及處理機制

?? 3)HBase高并發讀/寫實現及案例

?? 4)MongoDB文檔數據存儲及處理

?? 5)MongoDB操作實現及案例

第九講 大數據中的SQL工具

?? 1)大數據中的類SQL工具

?? 2) Hive設計目標和數據模型

?? 3) Hive關鍵性技術和案例

?? 4) SparkSQL設計目標和數據模型

?? 5) SparkSQL關鍵性技術和案例

第十講 大數據分析挖掘工具

? 1)大數據挖掘及知識模型的發現

? 2)大數據挖掘工具Mahout和MLlib

? 3)推薦方法及MLlib電影推薦案例

? 4)分類方法及Mahout新聞分類案例

? 5)聚類方法及K-Means聚類案例

第十一講 資源虛擬化工具Docker

? 1)虛擬化和容器技術

? 2)LXC和Docker的發展

? 3)Docker架構及特性

? 4)鏡像、容器和倉庫

? 5)Docker的執行及其案例實操

第十二講 大數據技術展望

? 1)大數據分析技術展望

? 2)大數據平臺的發展展望

? 3)大數據挖掘的應用展望

?

四、培訓時間、地點

2017年4月17日-4月19日 ?????????上海

2017年5月24日-5月26日?????????北京

?

五、培訓目標

1、全面了解大數據前沿技術的相關知識。

2、學習大數據前沿技術平臺、方法以及應用特征。

3、學習使用大數據挖掘和分析中的使用。

4、了解Hadoop、Spark等技術的融合使用。

?

六、證 書

培訓結束,頒發培訓中心“大數據前沿技術分析與應用”結業證書。

?

七、費 用

培訓費:5800元/人(含教材、證書、午餐、學習用具等)。住宿協助安排,費用自理。

本課程名稱: 大數據前沿技術分析與應用

查看更多:互聯網/語言公開課

大數據前沿技術 相關的最新課程
講師動態評分 與同行相比

授課內容與課綱相符00%

講師授課水平00%

服務態度00%

日日好好在线观看-日日啪 日日碰 嗷嗷啪