cda

全國校區

您的位置:首頁 > 大數據時代 > CDA教材文件-《用商業案例學R語言數據挖掘》

CDA教材文件-《用商業案例學R語言數據挖掘》

2019-03-19

《用商業案例學R語言數據挖掘》 作者 常國珍  經管之家,電子工業出版社

教材相關資料下載:

《用商業案例學R語言數據挖掘》數據與代碼下載:

鏈接:https://pan.baidu.com/s/1uUkuCh_AeO23AlMAHEXcYQ  密碼:d4u8

本書前言

本書有別于其它數據挖掘書籍最大的特點在于參與寫作的主要作者均為非理工科背景且具有數據挖掘崗位工作8年以上的實際工作經驗,且從事3年以上的培訓工作。這使得本書更貼近實際運用的同時,緊抓初學者的痛點,語言更淺顯易懂,操作性更強。當然,這也使得本書在前沿方法的講解上略顯不足。因為一個算法要在商業數據挖掘中得到運用需要大致3-5年的時間。所以本書僅適合數據挖掘入門人員使用。而且本系列教材強調追求淺顯易懂,只注重視運用中是否夠用,不關心算法知識的全面性,因此在算法推導過程中降低了難度,不涉及非關鍵且不易理解的部分。當讀者從事數據挖掘2-3年后,本書的知識就不能滿足其更深的需求,需要參考更深入的書籍,比如更專業的《統計學習方法》、《機器學習》等。

本書按照數據挖掘工程師規范化學習體系而定,對于一名初學者,應該先掌握必要的編程工具、統計理論基礎,數據挖掘算法等內容。進而,數據挖掘需要根據業務問題選擇合適的方法,按照標準流程,即數據的獲取、儲存、整理、清洗、歸約等系列數據處理技術,并最終得出結果,繪制圖表并解讀數據,這些內容在每版圖書中進行了詳細的講解和操作分析。

本書整體風格是“理論>技術>應用”的一個學習過程,最終目的在于商業業務應用,為欲從事于數據挖掘領域的各界人士提供了一個規范化數據分析師的學習體系。

讀者對象

本書是一本面向商業數據分析初學者的教材,從具體的商業數據分析案例入手,使讀者掌握數據挖掘的目的、理念、思路與分析步驟。本書力圖淡化技術,對于方法的介紹也盡量避免涉及過多的數學內容,和高等數學相關的內容只在線形回歸和主成分分析這兩節中涉及到,而且都輔以圖形作形象的展現。因此本書的讀者只需要具有高中水平的數學基礎即可。但是本書強調每種方法的假設、適用條件都與商業數據分析的主題匹配。在教學實踐中,我們發現業務經驗豐富和有較好商業模式理解的學員,在學習數據挖掘時有更好的效果,主要原因可能是這類學員有較強的思辨能力、分析能力、學習目的性和質量意識,而不是簡單的模仿和套用數學公式。

工具介紹

當前R和Python等開源軟件方興未艾,但是這類軟件學習曲線緩慢,使很多初學者的熱情在進入數據分析的核心領域之前就消逝殆盡。商業數據分析的真正目的是為了解決業務的分析需求,構造穩健的數據挖掘模型。數據挖掘產品的質量是通過對分析流程的嚴格掌控而得以保障的。本書注重實用,直指數據挖掘實施的要點,精選業界使用最廣泛的實施方案,為讀者節約寶貴的時間。

相對于Python,R偏向于統計分析、計量經濟學和統計內容。R不僅在學術研究中擁有廣泛的用戶基礎,而且和Oracle、SQLsever等數據庫軟件的結合使其不再受內存的限制,從而在商業上有了一定的用武之地。而且R和Hadoop、Spark等大數據分析平臺也可以自由連接。

閱讀指南

本書包括16章,內容涉及使用R做數據挖掘的主要分析方法。其中,第1、2章為數據分析方法概述,第3章為R語言編程基礎,第4章至第8章為統計學習方法,第9章至第15章為數據挖掘方法。第16章為時間序列分析方法。每章都根據涉及的知識點的不同,選取了實用的案例,并為讀者準備了相應的思考和練習題。

為方便讀者學習,本書提供書中案例的源文件下載,請讀者進入CDA官網(http://cda.cn/)的相應專欄下載數據和源代碼。

本書特點

本書作為市場上第一本CDA數據挖掘教材,和其他統計軟件圖書有很大的不同,文體結構新穎,案例貼近實際,講解深入透徹。這些特點主要表現在以下幾方面:

場景式設置

本書從互聯網、電商、電信、銀行等商業案例中進行精心歸納、提煉出各類數據分析的運用場景,方便讀者查找與實際工作相似的問題。

開創式結構

本書案例中的“解決方案”環節是對問題的思路解說,結合“操作方法”環節中的步驟讓讀者更容易理解。“原理分析”環節則主要解釋所使用代碼的工作原理或者詳細解釋思路。“知識擴展”環節是對與案例相關的知識點的補充,既能拓展讀者的視野,同時也有利于理解案例本身的解決思路。

啟發式描述

本書注重培養讀者解決問題的思路,以最樸實的思維方式結合啟發式的描述,幫助讀者發現、總結和運用規律,從而啟發讀者快速地找出解決問題的方法。

學習方法

俗話說,打把勢全憑架勢,像不像,三分樣。只有熟悉數據挖掘的流程,才能實現從模仿到靈活運用的提升。在產品質量管理方面,對流程的掌控是成功的關鍵,在數據挖掘過程中,流程同樣是重中之重。數據挖掘是一個先后銜接的過程,一個步驟的失誤會帶來完全錯誤的結果。一個數據挖掘的流程大致包括抽樣、數據清洗、數據轉換、建模和模型評估這幾個步驟。如果抽樣中的取數邏輯不正確,就有可能使因果關系倒置,因而得到完全相反的結論。如果數據轉換方的法選擇不正確,模型就難以得到預期的結果。而且,數據分析是一個反復試錯的過程,每一步都要求有詳細的記錄和操作說明,否則數據挖掘人員很可能迷失方向。

學習數據挖掘最好的方法就是動手做一遍,本書語言通俗但高度凝煉,很少有公式,以避免讀者產生麻痹大意的思想。本書按照相關商業數據分析主題提供了相應的練習數據,同時提供相關方面的參考資料,供學員學習。

售后服務

本書讀者可以在CDA官網(http://cda.cn/) 版塊就書中的問題進行提問,也歡迎大家就自己遇到的業務問題和大家討論。

致謝

本書由CDA數據分析研究院策劃,常國珍、曾珂、朱江負責編寫和完成統稿。

叢書從策劃到出版,傾注了電子工業出版社計算機圖書分社張慧敏、石倩、王靜、張童等多位編輯的心血,特在此表示衷心的感謝!

為保證叢書的質量,使其更貼近讀者,我們組織了著名學者和工作在數據挖掘一線的工程師參與了本書的預讀工作,他們是李御璽教授、瞿輝工程師。感謝兩位預讀員的辛勤、耐心與細致,使得本叢書能以更加完善的面目與各位讀者見面。

盡管作者們對書中的案例精益求精,但疏漏仍然在所難免,如果您發現書中的錯誤或認為某個案例有更好的解決方案,敬請登錄社區網站向作者反饋,我們將盡快在社區中給出回復,且在本書再次印刷時作出修正。

再次感謝您的支持!


完 謝謝觀看

分享
收藏

OK
彩经网双色球免费预测