cda

全國校區

您的位置:首頁 > 課程列表 > CDA大數據分析師周末班

CDA大數據分析師周末班

CDA大數據分析師周末班

難度系數:

課程系列:Level Ⅱ


周期: 8周

9800

立即報名 花唄分期 體驗課程

CDA大數據分析師周末班

 姓名:

 電話:

 郵箱:

   備注:

邀請碼:

提交信息
  • WHAT 課程簡介

    CDA大數據分析師課程以大數據分析技術為主線,以大數據分析師為培養目標,從數據分析基礎、linux操作系統入門知識學起,系統介紹Hadoop、HDFS、MapReduce、Hive和Hbase等理論知識和基于Spark平臺的大數據分析和機器學習應用,詳細演示Hadoop三種模式的安裝配置,以案例的形式,講解基于PySpark技術的回歸、分類和聚類分析等大數據分析場景和案例。課程的重點是培養學員基于Hadoop架構的大數據分析實操能力,從零開始學習hadoop搭建,掌握Spark,手把手帶練,8周成為行業急需的大數據分析人才,學完即可滿足CDA LEVEL II大數據分析師考試知識考核需求。講解案例包括但不限于金融大數據分析、氣象大數據分析、Web海量日志大數據分析、智慧高速大數據分析等。
  • WHY 學習目標

    掌握使用Hadoop架構應用于大數據分析
    掌握使用大數據分析之數據庫理論和工具Mysql、Hbase、Hive和Sqoop
    掌握使用Spark-SQL進行交互式數據查詢
    掌握使用Spark-Streaming流式計算框架
    掌握使用Spark-MLlib進行機器學習
    掌握使用Spark-GraphX進行圖計算
    掌握使用Pyspark進行大數據分析和機器學習
    掌握企業真實的大數據分析場景案例
  • WHO 學習對象和基礎

    大數據業務工作遲遲得不到進展人士
    針對數據分析、數據挖掘崗位轉型、提拔漲薪、技能優化等的職場白領
    未來準備從事大數據相關工作的計算機專業大學生人群
    需要有統計學基礎和編程基礎最佳(Java或Python)



課程案例,項目特訓

點擊圖片任何區域可放大

大數據交通案例

案例介紹 高速公路ETC交易數據,數據采集時間段為201X年一個季度的數據 技能涉及 1.所有的數據都導入到大數據平臺上,使用hive進行數據的分布式存儲 2.使用spark程序統計出每天的交易金額 3.分析每天交易金額的變化 4.綜合考慮入口、出口、車型等綜合因素,編寫spark程序,使用漏斗模型統計分析出某日數據增加的原因 5.以每天的數據為單位,將每天收費的環比增長率作為因變量,每個入口環比增長率為自變量,根據三個月的數據,建立多元線性回歸模型,算出每個入口的貢獻率,為高速公路管理方出入口開放提供決策依據。
點擊圖片任何區域可放大

查看集群狀態

案例介紹 集群運行中查看集群狀態及集群信息 技能涉及 1 檢查集群、節點、索引的健康情況 2 管理集群、節點,索引數據、元數據 3 執行CRUD,創建、讀取、更新、刪除 以及 查詢 4 執行高級的查詢操作,比如分頁、排序、腳本、聚合等
點擊圖片任何區域可放大

高速公路收費站各站點每日收費額情況圖 ...

案例介紹 將所有數據導入到 mysql 中,同時 hive 中,并編寫 spark 程序, 統計出每天的交易額,并輸出到 mysql 中,hive 中的數據, 編寫 spark 程序,使用漏斗模型統計分析出某日數據增加的原因。 技能涉及 每天的數據為單位,將每天收費的環比增長率作為因變量,每個入口環比增長率為自變量,根據六個月的數據,建立多元線性回歸模型,算出每個入口的貢獻率(使用 hadoop+mysql+hive+spark+sqoop+tableau 完成)
點擊圖片任何區域可放大

Ubuntu使用Mysql創建表

案例介紹 根據給定文檔在MySQL創建3個表并執行查詢 技能涉及 1. 查看配置 show variable; 2.查看目前處理的列表; show processlist; 3.看看有哪些存儲過程 show procedure status; 4.查看一條命令的執行方案 explain select * fromt t_your_tabe;

01預習課程

01-01大數據分析基礎
01-02Python編程基礎知識
01-03Linux&Ubuntu操作系統基礎

02大數據前沿應用與開源框架Hadoop

01-01大數據時代前沿與技術
01-02Hadoop生態系統和技術棧
01-03Hadoop單機環境搭建
01-04Hadoop偽分布式集群搭建
01-05Hadoop完全分布式集群搭建
01-06安裝和使用Ubuntu系統
01-07HDFS分布式文件系統介紹
01-08HFDS進行文件讀寫操作
01-09MapReduce編程概念、框架和流程
01-10Hadoop & Yarn知識介紹

03分布式數據倉庫技術-Hbase/Hive

01-01Hbase簡介與架構
01-02Hbase集群模式安裝
01-03Hbase Shell詳解
01-04Hive基礎知識
01-05Hive技術架構
01-06Hive DDL與DML語言介紹

04關系型數據庫技術-Mysql理論及實戰

01-01數據庫的概念與技術、創建數據庫
01-02數據表操作、數據類型與約束條件
01-03數據表插入數據與導入外部數據方法
01-04檢查與修改數據表
01-05SQL常用函數介紹
01-06SQL單表查詢與多表查詢
01-07查詢操作符與子查詢
01-07SQL實戰:使用SQL語句處理及查詢電商業務數據

05分布式計算引擎-Spark入門

01-01Scala語法知識介紹
01-02Scala函數
01-03Scala對象操作
01-04Spark簡介
01-05Spark運行架構
01-06RDD的創建和操作
01-07Spark SQL簡介
01-07臨時表和SQL查詢

06分布式計算引擎-Spark進階

01-01日志采集系統Flume和分布式消息隊列Kafka入門
01-02流式計算框架Spark Streaming基本原理及使用方法
01-03流式計算框架Structured Streaming基本原理及使用方法
01-04Spark GraphX入門及基本使用方法
01-05分布式算法庫Spark MlLib入門介紹
01-06Spark ML與Spark MLLib
01-07機器學習工作流
01-08機器學習項目-房價預測

07大數據可視化

01-01繪圖思想的基本原理
01-02Python數據可視化包-Matplotlib介紹
01-03使用Matplotlib進行基本的圖形繪制
01-04使用Python數據處理包Pandas做可視化
01-05Python數據可視化包-Seaborn介紹與圖形繪制
01-06Python數據可視化包-Pyecharts介紹與圖形繪制
01-07數據可視化技巧與方法

08大數據與Python結合-Pyspark機器學習

01-01Spark數據結構及編程語言接口
01-02PySpark開發環境搭建
01-03PySpark編程入門:Spark基本數據結構
01-04PySpark編程入門:PySpark常用語句
01-05Spark與分布式數據庫和分布式數據倉庫的集成方法
01-06采用PySpark讀取分布式數據庫中數據
01-07PySpark數據清洗案例
01-08數據挖掘和機器學習的基本思想與方法論
01-09機器學習部分算法串講:有監督、無監督、半監督
01-10機器學習實戰項目介紹

09大數據企業項目案例實做

01-01基于大數據平臺的互聯網金融監管實戰
01-02大數據交通案例
01-03大數據金融案例

來自業界的數據領袖團隊

  • 辛立偉

    CDA數據分析研究院講師/系統架構師 Java高級軟件工程師、Java高級培訓講師、認證高級講師、系統架構師、SUN中國社區會員、JAVA技術專家。精通JAVA、JAVA EE6體系結構;精 通Java企業級中間件技術設計、構建以及應用部署。

  • 吳昊天

    CDA數據分析研究院技術負責人兼高級講師/CDA LEVEL II大數據分析師等級考試命題組組長

    曾就職于電子科技大學大數據中心,從事醫療大數據分析相關工作,擁有豐富的海量數據分析經驗、算法研發經驗、省級數據平臺搭建經驗,擁有算法專利若干,主要研究方向為機器學習和深度學習。
  • 趙仁乾

    CDA數據分析研究院講師/北京郵電大學管理科學與工程碩士

    現就職于北京電信規劃設計院,從事移動、聯通集團及各省分公司市場、業務、財務規劃、經濟評價及運營咨詢。重點研究方向包括離網用戶挖掘、市場細分與精準營銷、移動網絡價值區域分析、潛在價值客戶挖掘等。
權威?經管之家CDA LEVEL Ⅲ數據科學家認證證書,行業頂尖人才認證,已獲得IBM大數據大學,中國電信,蘇寧,德勤,獵聘,CDMS等企業的認可。
專業?CDA認證是根據商業數據分析專業崗位設立的一套體系化、科學化、正規化的人才標準。全國統考、專家命題、評分公平、流程嚴格,更具含金量。
權益?持證人享有系列特殊權益。證書皆綁定考生真實身份,可在CDA官網查詢,確保唯一性與防偽性。證書三年審核一次,保證持證人的實力與權益。

認證介紹:
CDA數據分析師認證”是一套專業化,科學化,國際化,系統化的人才考核標準,分為CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,涉及金融、電商、醫療、互聯網、電信等行業大數據及數據分析從業者所需要具備的技能,符合當今全球大數據及數據分析技術潮流,為各界企業、機構提供數據分析人才參照標準。經管之家為中國區CDA數據分析師認證考試唯一主辦機構,于每年6月與12月底在全國范圍舉辦線下數據分析師考試,通過考試者可獲得CDA數據分析師認證證書。
CDA持證人福利
1.可吸納為CDA Institute、中國數據分析師(CDA)俱樂部會員,活動中具有優先報名參與權。
2.可優先獲得CDA內部就業及職業發展推薦。
3.免費參與CDA舉辦的中國數據分析師行業峰會、大數據峰會、研討會等各項活動,Level Ⅱ與Level III持證人享受特權位置。
4.可申請加入CDA數據分析項目組,參與項目合作(提供項目給持證人演練)。
5.CDA Level Ⅰ持證人免費享受Peixun.net會員服務6個月(價值588 RMB),Level Ⅱ與Level III持證人免費享受peixun.net會員服務1年 (價值998 RMB);
6.其他特權皆以各類活動公告為主。
進入考試報名系統
  • Q:課程使用的大數據軟件版本是如何的?

    A:大數據軟件使用版本如下: centos 7.2、hadoop-2.6.0、hive-1.1.0、sqoop-1.4.6、hbase-1.2.0、spark-2.3.0、zookeeper-3.4.5、Anconda5.2.0及以上、Oracle VM VirtualBox6 或者VMware
  • Q:課程的計算機內存要求和開發工具推薦?

    A:學習大數據課程計算機內存推薦為 16G (享受飛馳的感覺),至少8G。CPU推薦四核八線程的、硬盤可用空 間100G。關于內存是考慮了spark對內存的需求較大,大數據其他組件內存需求會低一些。
    關于開發工具:推薦pyspark使用jupyter notebook,Scala使用 IntelliJ IDEA 社區版,python腳本可以使用pycharm。
  • Q:大數據分析師和JAVA程序員有什么區別?

    A:Hadoop架構基于java程序設計,因此大批的IT人士在大數據時代找到了自己的職業錨,而且最快的進入了這個行業,成為了最先的大數據分析師。但IT人士的宿命就在于他們太IT了,他們熱衷于計算更快、處理更高效的程序設計,而忽略了大數據分析的本意,為企業帶來商業價值,因此他們只能是大數據分析工程師,而正真的大數據分析師應當了解和熟悉hadoop技術架構和算法設計,但不必成為一個優秀的JAVA程序員。
  • Q:大數據分析師區別于普通的數據分析師?

    A:普通的數據分析師具有一定的數理統計基礎,熟悉業務邏輯,能熟練地操作傳統的數據分析軟件,能使數據成為企業的智慧。他們通常遇到的都是一些結構化、體量小的小數據。而大數據分析師更專注數據獲取的架構設計、數據分析模型的選擇、指標的選取,他們具有數據分析師的理論素養和業務能力,面對大數據,他們有一整套分布式的數據獲取、整理、處理和分析的方案,而且這個方案最終的目標是為數據分析服務,他們具有大數據分析的利器,如Hadoop、Spark等軟件。
  • Q:參加課可以考取的考取的證書有哪些?

    A:參加《CDA大數據分析師》證書每年6月和12月考試,通過者即可獲得;培訓后申請工信部《數據分析師》證書。
  • Q: 學員課下如何與老師進行互動?

    A:CDA大數據分析師課程每期都會建立QQ群和微信群,工作日有老師和助教負責答疑;同時學員可以在討論區以帖子的形式向老師提問,老師會在工作日的48小時內回復。

OK
彩经网双色球免费预测