R語言與數(shù)據(jù)挖掘最佳實踐和經(jīng)典案例 帶書簽?zāi)夸?pdf版
30.5MB / 01-15
數(shù)據(jù)挖掘:R語言實戰(zhàn) (黃文 著) 完整版PDF[57MB]
57.6MB / 12-21
數(shù)據(jù)挖掘與R語言 李洪成譯 中文pdf掃描版[23MB]
23MB / 12-11
基于R語言數(shù)據(jù)挖掘的統(tǒng)計與分析 (韋鵬程等著) 完整pdf掃描版[38M
38.7MB / 01-04
-
-
機器學(xué)習(xí)、深度學(xué)習(xí)面試筆試題300+合集 中文pdf完整版 編程其它 / 5.9MB
-
-
-
Arduino編程參考手冊 中文版PDF 編程其它 / 80KB
-
CODESYS基礎(chǔ)編程及應(yīng)用指南 中文pdf完整版 編程其它 / 10.6MB
-
Tcl教程中文版+入門教程 完整版PDF 編程其它 / 2.12MB
-
圖解算法小抄(筆記) 中文PDF完整版 編程其它 / 6.1MB
-
QNX官方開發(fā)手冊(中英文版) 完整版pdf 編程其它 / 6.32MB
-
詳情介紹
大數(shù)據(jù)不僅意味著數(shù)據(jù)的積累、存儲與管理,更意味著大數(shù)據(jù)的分析。數(shù)據(jù)挖掘無可爭議地成為當(dāng)今大數(shù)據(jù)分析的核心利器。R語言因徹底的開放性策略業(yè)已躋身數(shù)據(jù)挖掘工具之首列。本書以“R語言數(shù)據(jù)挖掘入門并不難”為開篇,總覽了數(shù)據(jù)挖掘的理論和應(yīng)用輪廓,明確了R語言入門的必備知識和學(xué)習(xí)路線,并展示了數(shù)據(jù)挖掘的初步成果,旨在使讀者快速起步數(shù)據(jù)挖掘?qū)嵺`。后續(xù)圍繞數(shù)據(jù)挖掘應(yīng)用的四大核心方面,安排了數(shù)據(jù)預(yù)測篇:立足數(shù)據(jù)預(yù)測未知,數(shù)據(jù)分組篇:發(fā)現(xiàn)數(shù)據(jù)中的自然群組,數(shù)據(jù)關(guān)聯(lián)篇:發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)性,離群數(shù)據(jù)探索篇:發(fā)現(xiàn)數(shù)據(jù)中的離群點。每篇下各設(shè)若干章節(jié),各章節(jié)從簡單易懂且具代表性的案例問題入手,剖析理論方法原理,講解R語言實現(xiàn),并給出案例的R語言數(shù)據(jù)挖掘代碼和結(jié)果解釋。本書內(nèi)容覆蓋之廣泛,原理講解之通俗,R語言實現(xiàn)步驟之詳盡,在國內(nèi)外同類書籍中尚不多見。
目錄
第一篇 起步篇:R語言數(shù)據(jù)挖掘入門并不難
第1章 數(shù)據(jù)挖掘與R語言概述
【本章學(xué)習(xí)目標(biāo)】
1.1 為什么要學(xué)習(xí)數(shù)據(jù)挖掘和R語言
1.2 什么是數(shù)據(jù)挖掘
1.3數(shù)據(jù)挖掘能給出什么
1.3.1數(shù)據(jù)挖掘結(jié)果有哪些呈現(xiàn)方式
1.3.2 數(shù)據(jù)挖掘結(jié)果有哪些基本特征
1.4 數(shù)據(jù)挖掘能解決什么問題
1.4.1 數(shù)據(jù)預(yù)測
1.4.2 發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)
1.4.3 發(fā)現(xiàn)關(guān)聯(lián)性
1.4.4 模式診斷
1.5 數(shù)據(jù)挖掘解決問題的思路
1.6數(shù)據(jù)挖掘有哪些典型的商業(yè)應(yīng)用
1.6.1 數(shù)據(jù)挖掘在客戶細分中的應(yīng)用
1.6.2 數(shù)據(jù)挖掘在客戶流失分析中的應(yīng)用
1.6.3 數(shù)據(jù)挖掘在營銷響應(yīng)分析中的應(yīng)用
1.6.4 數(shù)據(jù)挖掘在交叉銷售中的應(yīng)用
1.6.5 數(shù)據(jù)挖掘在欺詐甄別中的應(yīng)用
1.7 R語言入門需要知道什么
1.7.1 什么是R的包
1.7.2 如何獲得 R
1.7.3 R如何起步
1.7.4 R的基本操作和其他
【本章附錄】
第2章 R語言數(shù)據(jù)挖掘起步:R對象和數(shù)據(jù)組織
【本章學(xué)習(xí)目標(biāo)】
2.1 什么是R的數(shù)據(jù)對象
2.1.1 R的數(shù)據(jù)對象有哪些類型
2.1.2 如何創(chuàng)建和訪問R的數(shù)據(jù)對象
2.2 如何用R的向量組織數(shù)據(jù)
2.2.1 創(chuàng)建只包含一個元素的向量
2.2.2 創(chuàng)建包含多個元素的向量
2.2.3 訪問向量中的元素
2.3 如何用R的矩陣組織數(shù)據(jù)
2.3.1 創(chuàng)建矩陣
2.3.2 訪問矩陣中的元素
2.4 如何用R的數(shù)據(jù)框組織數(shù)據(jù)
2.4.1 創(chuàng)建數(shù)據(jù)框
2.4.2 訪問數(shù)據(jù)框
2.5 如何用R的數(shù)組、列表組織數(shù)據(jù)
2.5.1 創(chuàng)建和訪問數(shù)組
2.5.2 創(chuàng)建和訪問列表
2.6 R數(shù)據(jù)對象的相互轉(zhuǎn)換
2.6.1 不同存儲類型之間的轉(zhuǎn)換
2.6.2 不同結(jié)構(gòu)類型之間的轉(zhuǎn)換
2.7 如何將外部數(shù)據(jù)組織到R數(shù)據(jù)對象中
2.7.1 將文本數(shù)據(jù)組織到R對象中
2.7.2 將SPSS數(shù)據(jù)組織到R對象中
2.7.3 將數(shù)據(jù)庫和Excel表數(shù)據(jù)組織到R對象中
2.7.4 將網(wǎng)頁表格數(shù)據(jù)組織到R對象中
2.7.5 R有哪些自帶的數(shù)據(jù)包
2.7.6 如何將R對象中的數(shù)據(jù)保存起來
2.8 R程序設(shè)計需哪些必備知識
2.8.1 R程序設(shè)計涉及哪些基本概念
2.8.2 R有哪些常用的系統(tǒng)函數(shù)
2.8.3 用戶自定義函數(shù)提升編程水平
2.8.4 如何提高R程序處理的能力
2.9 R程序設(shè)計與數(shù)據(jù)整理綜合應(yīng)用
2.9.1 綜合應(yīng)用一:數(shù)據(jù)的基本處理
2.9.2 綜合應(yīng)用二:如何將匯總數(shù)據(jù)還原為原始數(shù)據(jù)
【本章附錄】
第3章 R語言數(shù)據(jù)挖掘初體驗:對數(shù)據(jù)的直觀印象
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
3.1 數(shù)據(jù)的直觀印象
3.1.1 R的數(shù)據(jù)可視化平臺是什么?
3.1.3 R的圖形邊界和布局
3.1.2 R的圖形組成和圖形參數(shù)
3.1.4 如何修改R的圖形參數(shù)?
3.2如何獲得單變量分布特征的直觀印象
3.2.1核密度圖:車險理賠次數(shù)的分布特點是什么?
3.2.2 小提琴圖:不同車型車險理賠次數(shù)的分布有差異嗎?
3.2.3克利夫蘭點圖:車險理賠次數(shù)存在異常嗎?
3.3如何獲得多變量聯(lián)合分布的直觀印象
3.3.1 曲面圖和等高線圖
3.3.2 二元核密度曲面圖:投保人年齡和車險理賠次數(shù)的聯(lián)合分布特點是什么?
3.3.3 雷達圖:不同區(qū)域氣候特點有差異嗎?
3.4如何獲得變量間相關(guān)性的直觀印象
3.4.1 馬賽克圖:車型和車齡有相關(guān)性嗎?
3.4.2 散點圖:這些因素會影響空氣濕度嗎?
3.4.3 相關(guān)系數(shù)圖:淘寶各行業(yè)商品成交指數(shù)有相關(guān)性嗎?
3.5如何獲得GIS數(shù)據(jù)的直觀印象
3.5.1 繪制世界地圖和美國地圖
3.5.2 繪制中國行政區(qū)劃地圖
3.5.3 依據(jù)地圖繪制熱力圖:不同省市的淘寶女裝成交指數(shù)有差異嗎?
3.7如何獲得文本詞頻數(shù)據(jù)的直觀印象:政府工作報告中有哪些高頻詞?
【本章附錄】
第二篇 數(shù)據(jù)預(yù)測篇:立足數(shù)據(jù)預(yù)測未知
第4章 基于近鄰的分類預(yù)測:與近鄰有趨同的選擇!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
4.1近鄰分析: K-近鄰法
4.1.1 K-近鄰法中的距離
4.1.2 K-近鄰法中的近鄰個數(shù)
4.1.3 R的K-近鄰法和模擬分析
4.1.4 K-近鄰法應(yīng)用:天貓成交顧客的分類預(yù)測
4.2 K-近鄰法的適用性及特征選擇
4.2.1 K-近鄰法的適用性
4.2.2 特征選擇:找到重要變量
4.3基于變量重要性的加權(quán)K-近鄰法
4.3.1 基于變量重要性的加權(quán)K-近鄰法的基本原理
4.3.2 變量重要性判斷應(yīng)用:天貓成交顧客預(yù)測中的重要變量
4.4基于觀測相似性的加權(quán)K-近鄰法
4.4.1 加權(quán)K-近鄰法的權(quán)重設(shè)計
4.4.2 加權(quán)K-近鄰法的距離和相似性變換
4.4.3 加權(quán)K-近鄰法的R實現(xiàn)
4.4.4加權(quán)K-近鄰法應(yīng)用:天貓成交顧客的分類預(yù)測
【本章附錄】
第5章 基于規(guī)則的分類和組合預(yù)測:給出易懂且穩(wěn)健的預(yù)測!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
5.1決策樹概述
5.1.1 什么是決策樹?
5.1.2 決策樹的幾何意義是什么?
5.1.3 決策樹的核心問題
5.2 分類回歸樹的生長過程
5.2.1 分類樹的生長過程
5.2.2 回歸樹的生長過程
5.2.3損失矩陣對分類樹的影響
5.3 分類回歸樹的剪枝
5.3.1 最小代價復(fù)雜度的測度
5.3.2 分類回歸樹后剪枝過程
5.3.3 分類回歸樹的交叉驗證剪枝
5.4 分類回歸樹的R實現(xiàn)和應(yīng)用
5.4.1 分類回歸樹的R實現(xiàn)
5.4.2 分類回歸樹的應(yīng)用:提煉不同消費行為顧客的主要特征
5.5 建立分類回歸樹的組合預(yù)測模型:給出穩(wěn)健的預(yù)測
5.5.1 袋裝技術(shù)
5.5.2 袋裝技術(shù)的R實現(xiàn)
5.5.3 袋裝技術(shù)的應(yīng)用:穩(wěn)健定位目標(biāo)客戶
5.5.4 推進技術(shù)
5.5.5 推進技術(shù)的R實現(xiàn)
5.5.6 推進技術(shù)的應(yīng)用:穩(wěn)健定位目標(biāo)客戶
5.6 隨機森林:具有隨機性的組合預(yù)測
5.6.1 什么是隨機森林?
5.6.2 隨機森林的R實現(xiàn)
5.6.3 隨機森林的應(yīng)用:穩(wěn)健定位目標(biāo)客戶
【本章附錄】
第6章 基于神經(jīng)網(wǎng)絡(luò)的分類預(yù)測:給出高精確的預(yù)測!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
6.1 人工神經(jīng)網(wǎng)絡(luò)概述
6.1.1 人工神經(jīng)網(wǎng)絡(luò)和種類
6.1.2 節(jié)點:人工神經(jīng)網(wǎng)絡(luò)的核心處理器
6.1.3 建立人工神經(jīng)網(wǎng)絡(luò)的一般步驟
6.1.4感知機模型:確定連接權(quán)重的基本策略
6.2 B-P反向傳播網(wǎng)絡(luò):最常見的人工神經(jīng)網(wǎng)絡(luò)
6.2.1 B-P反向傳播網(wǎng)絡(luò)的三大特點
6.2.2 B-P反向傳播算法:確定連接權(quán)重
6.2.3 學(xué)習(xí)率:影響連接權(quán)重調(diào)整的重要因素
6.3 B-P反向傳播網(wǎng)絡(luò)的R實現(xiàn)和應(yīng)用
6.3.1 neuralnet包中的neuralnet函數(shù)
6.3.2 neuralnet函數(shù)的應(yīng)用:精準(zhǔn)預(yù)測顧客的消費行為
6.3.3 利用ROC曲線確定概率分割值
6.3.4 nnet包中的nnet函數(shù)
【本章附錄】
第7章 基于支持向量的分類預(yù)測:給出最大把握的預(yù)測!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
7.1 支持向量分類概述
7.1.1支持向量分類的基本思路:確保把握程度
7.1.2支持向量分類的三種情況
7.2理想條件下的分類:線性可分時的支持向量分類
7.2.1如何求解超平面
7.2.1如何利用超平面進行分類預(yù)測
7.3 一般條件下的分類:廣義線性可分時的支持向量分類
7.3.1如何求解超平面
7.3.2 可調(diào)參數(shù)的意義:把握程度和精度的權(quán)衡
7.4 復(fù)雜條件下的分類:線性不可分時支持向量分類
7.4.1 線性不可分的一般解決途徑和維災(zāi)難問題
7.4.2 支持向量分類克服維災(zāi)難的途徑
7.5 多分類的支持向量分類:二分類的拓展
7.6 支持向量回歸:解決數(shù)值預(yù)測問題
7.6.1 支持向量回歸與一般線性回歸:目標(biāo)和策略
7.6.2 支持向量回歸的基本思路
7.7 支持向量機的R實現(xiàn)及應(yīng)用
7.7.1支持向量機的R實現(xiàn)
7.7.2 利用R模擬線性可分下的支持向量分類
7.7.3 利用R模擬線性不可分下的支持向量分類
7.7.4 利用R模擬多分類的支持向量分類
7.7.5 支持向量分類應(yīng)用:天貓成交顧客的預(yù)測
【本章附錄】
第三篇 數(shù)據(jù)分組篇:發(fā)現(xiàn)數(shù)據(jù)中的自然群組
第8章 常規(guī)聚類:直觀的數(shù)據(jù)全方位自動分組
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
8.1 聚類分析概述
8.1.1聚類分析目標(biāo):發(fā)現(xiàn)數(shù)據(jù)中的“自然小類”
8.1.2 有哪些主流的聚類算法?
8.2基于質(zhì)心的聚類:K-Means聚類
8.2.1 K-Means聚類中的距離測度:體現(xiàn)全方位性
8.2.2 K-Means聚類過程:多次自動分組
8.2.3 K-Means聚類的R實現(xiàn)和模擬分析
8.2.4 K-Means聚類的應(yīng)用:環(huán)境污染的區(qū)域劃分
8.3 PAM聚類:改進的K- Means聚類
8.3.1 PAM聚類過程
8.3.2 PAM聚類的R實現(xiàn)和模擬分析
8.3基于聯(lián)通性的聚類:層次聚類
8.3.1 層次聚類的基本過程:循序漸進的自動分組
8.3.2 層次聚類的R實現(xiàn)和應(yīng)用:環(huán)境污染的區(qū)域劃分
8.4基于統(tǒng)計分布的聚類:EM聚類
8.4.1 基于統(tǒng)計分布的聚類出發(fā)點:有限混合分布
8.4.2 EM聚類:如何估計類參數(shù)和聚類解
8.4.3 EM聚類的R實現(xiàn)和模擬分析
8.4.4 EM聚類的應(yīng)用:環(huán)境污染的區(qū)域劃分
【本章附錄】
第9章 特色聚類:數(shù)據(jù)分組還可以這樣做!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
9.1 BIRCH聚類概述
9.1.1 BRICH聚類有哪些特點?
9.1.2 聚類特征和聚類特征樹:BIRCH聚類的重要策略
9.1.3 BIRCH的聚類過程:由存儲空間決定的動態(tài)聚類
9.1.4 BRICH聚類的R實現(xiàn)
9.1.5 BRICH聚類應(yīng)用:兩期崗位培訓(xùn)的比較
9.2 SOM網(wǎng)絡(luò)聚類概述
9.2.1 SOM網(wǎng)絡(luò)聚類設(shè)計出發(fā)點
9.2.2 SOM網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和聚類原理
9.2.3 SOM網(wǎng)絡(luò)聚類的R實現(xiàn)
9.2.4 SOM網(wǎng)絡(luò)聚類應(yīng)用:手寫郵政編碼識別
9.2.5 拓展SOM網(wǎng)絡(luò):紅酒品質(zhì)預(yù)測
9.3基于密度的聚類模型:DBSCAN聚類
9.3.1 DBSCAN聚類原理:密度可達性是核心
9.3.2 DBSCAN聚類的R實現(xiàn)
9.3.3 DBSCAN聚類的模擬分析
【本章附錄】
第四篇 數(shù)據(jù)關(guān)聯(lián)篇:發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)性
第10章 發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián)特征:關(guān)聯(lián)是推薦的依據(jù)!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
10.1 簡單關(guān)聯(lián)規(guī)則及其測度
10.1.1 什么是簡單關(guān)聯(lián)規(guī)則?
10.1.2 如何評價簡單關(guān)聯(lián)規(guī)則的有效性?
10.1.3如何評價簡單關(guān)聯(lián)規(guī)則的實用性?
10.2 Apriori算法:發(fā)現(xiàn)簡單關(guān)聯(lián)規(guī)則的高效算法
10.2.1 搜索頻繁項集:Apriori算法的重中之重
10.2.2依頻繁項集產(chǎn)生簡單關(guān)聯(lián)規(guī)則:水到渠成
10.2.3 Apriori算法的R實現(xiàn)和應(yīng)用示例
10.2.4 簡單關(guān)聯(lián)的可視化R實現(xiàn)和應(yīng)用示例
10.3 Eclat算法:更快速地發(fā)現(xiàn)頻繁項集
10.3.1 Eclat算法原理:對等類是核心
10.3.2 Eclat算法的R實現(xiàn)和應(yīng)用示例
10.4 簡單關(guān)聯(lián)分析應(yīng)用:商品推薦
10.4.1 發(fā)現(xiàn)連帶銷售商品
10.4.2 顧客選擇性傾向?qū)Ρ?br />
10.5 序列關(guān)聯(lián)分析及SPADE算法:發(fā)現(xiàn)數(shù)據(jù)中的時序關(guān)聯(lián)性
10.5.1 序列關(guān)聯(lián)中有哪些基本概念?
10.5.2 SPADE算法:發(fā)現(xiàn)序列關(guān)聯(lián)規(guī)則的高效算法
10.5.3 序列關(guān)聯(lián)分析的R實現(xiàn)及應(yīng)用示例
10.6 序列關(guān)聯(lián)分析應(yīng)用:發(fā)現(xiàn)網(wǎng)民的瀏覽習(xí)慣
第11章 復(fù)雜網(wǎng)絡(luò)分析初步:基于關(guān)系的研究!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
11.1 網(wǎng)絡(luò)的定義表示及構(gòu)建:復(fù)雜網(wǎng)絡(luò)分析的第一步!
11.1.1 網(wǎng)絡(luò)的圖論定義及R實現(xiàn)
11.1.2 網(wǎng)絡(luò)的矩陣表示方式及R實現(xiàn)
11.1.3 R的網(wǎng)絡(luò)數(shù)據(jù)文件和建立網(wǎng)絡(luò)對象
11.1.4 R的網(wǎng)絡(luò)可視化
11.2 網(wǎng)絡(luò)節(jié)點重要性的測度:誰是網(wǎng)絡(luò)的“主導(dǎo)”?
11.2.1度和測地線距離
11.2.2點度中心度和接近中心度:節(jié)點“中心”作用的測度
11.2.3中間中心度:節(jié)點“樞紐”作用的測度
11.2.4節(jié)點重要性的其他方面:結(jié)構(gòu)洞和關(guān)節(jié)點、特征向量中心度和PageRank得分
11.3 網(wǎng)絡(luò)子群構(gòu)成特征研究:找到網(wǎng)絡(luò)中的“小團體”!
11.3.1二元關(guān)系和三元關(guān)系及R實現(xiàn)
11.3.2 派系和k-核及R實現(xiàn)
11.3.3 社區(qū)和組件及R實現(xiàn)
11.4 網(wǎng)絡(luò)整體特征刻畫:整體關(guān)系是這樣的!
11.4.1 網(wǎng)絡(luò)整體特征的測度
11.4.2 網(wǎng)絡(luò)特征的各種分布和度量
11.5 主要網(wǎng)絡(luò)類型及特點:多姿多彩的網(wǎng)絡(luò)世界!
11.5.1 規(guī)則網(wǎng)絡(luò)及特點
11.5.2 隨機網(wǎng)絡(luò)及特點
11.5.3 小世界網(wǎng)絡(luò)及特點
11.5.4 無標(biāo)度網(wǎng)絡(luò)及特點
【本章附錄】
第五篇 離群數(shù)據(jù)探索篇:發(fā)現(xiàn)數(shù)據(jù)中的離群點
第12章模式甄別:診斷異常數(shù)據(jù)!
【本章學(xué)習(xí)目標(biāo)】
【案例與思考】
12.1 模式甄別方法和評價概述
12.1.1 模式甄別方法
12.1.2 模式甄別結(jié)果及評價:風(fēng)險評分
12.2 模式甄別的無監(jiān)督偵測方法及應(yīng)用示例
12.2.1 依概率偵測模式及R應(yīng)用示例
12.2.2 依距離偵測模式:DB方法及R應(yīng)用示例
12.2.3 依密度偵測模式:LOF方法及R應(yīng)用示例
12.3 模式甄別的有監(jiān)督偵測方法及應(yīng)用示例
12.3.1 樸素貝葉斯分類法及示例
12.3.2 Logistic回歸及示例
12.3.3 非平衡數(shù)據(jù)集的SMOTE處理
12.4 模式甄別的半監(jiān)督偵測方法及應(yīng)用示例
12.4.1 半監(jiān)督分類:自訓(xùn)練分類模型
12.4.2 自訓(xùn)練分類模型的R實現(xiàn)及應(yīng)用示例
【本章附錄】
下載地址
人氣書籍
下載聲明
☉ 解壓密碼:chabaoo.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的R語言數(shù)據(jù)挖掘方法及應(yīng)用 (薛薇 著) 完整pdf掃描版[188MB]資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。