![]() ![]() |
機器學習及其應用 讀者對象:計算機科學、人工智能及其相關(guān)專業(yè)的本科生與研究生 ![]()
機器學習作為人工智能的一個分支,它涵蓋了利用技術(shù)使計算機能夠從數(shù)據(jù)中識別問題并將其應用于人工智能程序的方法。本書是機器學習領域的入門教材,系統(tǒng)、詳細地講述機器學習的主要方法與理論,闡明算法的運行過程,并緊密結(jié)合企業(yè)實踐與應用,根據(jù)企業(yè)實際需求設計算法案例。本書共11章,分別介紹機器學習基本概念、決策樹、K最近鄰算法、支持向量機、線性模型、貝葉斯分類器、數(shù)據(jù)降維、聚類算法、人工神經(jīng)網(wǎng)絡、隨機森林等基礎模型或算法。本書通過具體的案例讓讀者學到思考問題的方式,包括決策樹算法案例、K最近鄰算法案例、SVM算法案例、logistic回歸算法案例、貝葉斯分類器案例、數(shù)據(jù)降維算法案例、聚類算法案例、人工神經(jīng)網(wǎng)絡案例、隨機森林案例,幫助讀者了解機器學習的各種算法,讓讀者真正理解算法、學會使用算法。對于計算機科學、人工智能及其相關(guān)專業(yè)的本科生與研究生而言,本書是入門及深入學習的理想選擇;同時,對于致力于人工智能產(chǎn)品研發(fā)的工程技術(shù)人員來說,本書極具參考價值。
劉佳琦,副教授,博士,內(nèi)蒙古赤峰人,CCF會員。2005年6月畢業(yè)于中南大學計算機科學與技術(shù)專業(yè),獲學士學位;2008年6月畢業(yè)于中南大學計算機應用技術(shù)專業(yè),獲碩士學位;2012年6月畢業(yè)于中南大學計算機應用技術(shù)專業(yè),獲博士學位。2012年9月進入中南大學軟件學院工作,教研。近年來在物聯(lián)網(wǎng)、群智感知、車聯(lián)網(wǎng)用戶行為優(yōu)化方面取得了較好的研究成果,在《IEEE Transactions on Parallel and Distributed System》(CCF A類期刊)、《IEEE Transactions on Mobile Computing》(CCF A類期刊)、《IEEE Internet of Things Journal》(中科院一區(qū) IF>10)、《IEEE Transactions on Vehicular Technology》等分布式、移動計算、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)領域頂級期刊和國內(nèi)外會議共發(fā)表論文 20 余篇。主持國家自然科學基金2項、主持教育部博士點基金1項、主持湖南省自然科學基金1項、參與科技創(chuàng)新2030-“新一代人工智能”重大項目1項、參與國家自然科學基金3項。獲得省部級科技進步二等獎1項、自然科學獎三等獎2項;已授權(quán)國家發(fā)明專利10余項,獲得軟件著作權(quán)10余項。
第 1 章 機器學習基本概念 ............................................................................................................... 1
1.1 機器學習定義 ...................................................................................................................... 1 1.2 算法分類 ............................................................................................................................ 1 1.2.1 有監(jiān)督學習 .............................................................................................................. 1 1.2.2 無監(jiān)督學習 .............................................................................................................. 2 1.2.3 分類與回歸 .............................................................................................................. 2 1.2.4 判別模型與生成模型 ............................................................................................... 3 1.2.5 強化學習 .................................................................................................................. 4 1.3 模型評價指標 ..................................................................................................................... 4 1.4 模型選擇 ............................................................................................................................ 5 1.4.1 訓練誤差和泛化誤差 ............................................................................................... 6 1.4.2 驗證數(shù)據(jù)集 .............................................................................................................. 6 1.4.3 過擬合與欠擬合 ....................................................................................................... 7 1.4.4 偏差-方差分解 ........................................................................................................ 8 第 2 章 決策樹 ................................................................................................................................. 9 2.1 基本概念 ............................................................................................................................ 9 2.2 決策樹的構(gòu)建 .................................................................................................................... 11 2.2.1 如何選擇最優(yōu)的劃分屬性 ...................................................................................... 11 2.2.2 決策樹的關(guān)鍵參數(shù) ................................................................................................. 13 2.2.3 決策樹的剪枝 ........................................................................................................ 14 2.2.4 連續(xù)值與缺失值的處理 ......................................................................................... 14 2.3 訓練算法 .......................................................................................................................... 16 2.3.1 遞歸分裂 ................................................................................................................ 16 2.3.2 尋找最佳分裂 ........................................................................................................ 17 2.3.3 葉節(jié)點值的設定 ..................................................................................................... 20 2.3.4 屬性缺失 ................................................................................................................ 20 2.3.5 剪枝算法 ................................................................................................................ 20 2.4 決策樹算法案例 ................................................................................................................ 21 2.4.1 案例 1:鳥類與非鳥類判定 ......................................................................................... 21 2.4.2 案例 2:隱形眼鏡的類型決策 ..................................................................................... 26 第 3 章 K 最近鄰算法 .................................................................................................................... 31 3.1 基本概念 .......................................................................................................................... 31 3.2 算法原理及要素 ............................................................................................................... 31 3.3 預測算法 .......................................................................................................................... 32 3.4 距離定義 .......................................................................................................................... 33 3.4.1 常用距離定義 ........................................................................................................ 34 3.4.2 距離度量學習 ........................................................................................................ 35 3.5 K 最近鄰算法案例 ........................................................................................................... 36 3.5.1 案例 1:基于 K 最近鄰算法的數(shù)據(jù)分類 ............................................................... 36 3.5.2 案例 2:基于 KNN 算法的手寫數(shù)字識別系統(tǒng)...................................................... 37 第 4 章 支持向量機 ....................................................................................................................... 41 4.1 基本概念 .......................................................................................................................... 41 4.2 線性分類器 ...................................................................................................................... 42 4.2.1 線性分類器概述 ..................................................................................................... 42 4.2.2 分類間隔 ................................................................................................................ 43 4.3 線性可分性 ...................................................................................................................... 43 4.3.1 原問題 .................................................................................................................... 44 4.3.2 對偶問題 ................................................................................................................ 45 4.4 線性不可分 ...................................................................................................................... 47 4.4.1 原問題 .................................................................................................................... 47 4.4.2 對偶問題 ................................................................................................................ 47 4.5 核映射與核函數(shù) ............................................................................................................... 50 4.6 SMO 算法 ......................................................................................................................... 51 4.6.1 求解子問題 ............................................................................................................ 52 4.6.2 優(yōu)化變量的選擇 ..................................................................................................... 55 4.7 多分類問題 ...................................................................................................................... 56 4.8 SVM 算法案例 ................................................................................................................. 57 4.8.1 基于無核函數(shù)的小規(guī)模數(shù)據(jù)分類 .......................................................................... 57 4.8.2 基于核函數(shù)的手寫數(shù)字識別 .................................................................................. 65 第 5 章 線性模型 ........................................................................................................................... 71 5.1 基本形式 .......................................................................................................................... 71 5.2 logistic 回歸 ...................................................................................................................... 71 5.3 正則化 logistic 回歸 ......................................................................................................... 74 5.3.1 對數(shù)似然函數(shù) ........................................................................................................ 74 5.3.2 L2 正則化原問題 ................................................................................................... 75 5.3.3 L2 正則化對偶問題 ............................................................................................... 79 5.3.4 L1 正則化原問題 ................................................................................................... 80 5.4 logistic 回歸算法案例 ...................................................................................................... 81 5.4.1 logistic 回歸工作原理 ............................................................................................ 81 5.4.2 使用 logistic 回歸在簡單數(shù)據(jù)集上的分類 .............................................................. 81 第 6 章 貝葉斯分類器 ................................................................................................................... 85 6.1 貝葉斯決策 ...................................................................................................................... 85 6.1.1 貝葉斯決策概念 ..................................................................................................... 85 6.1.2 貝葉斯決策模型的定義 ......................................................................................... 86 6.1.3 貝葉斯決策的常用方法 ......................................................................................... 86 6.2 貝葉斯分類方法 ............................................................................................................... 89 6.3 樸素貝葉斯分類器 ........................................................................................................... 90 6.3.1 離散型特征 ............................................................................................................ 90 6.3.2 連續(xù)型特征 ............................................................................................................ 91 6.4 正態(tài)貝葉斯分類器 ........................................................................................................... 92 6.4.1 訓練算法 ................................................................................................................ 92 6.4.2 預測算法 ................................................................................................................ 93 6.5 貝葉斯分類器案例 ........................................................................................................... 94 第 7 章 數(shù)據(jù)降維 ........................................................................................................................... 99 7.1 主成分分析 ...................................................................................................................... 99 7.1.1 數(shù)據(jù)降維方法 ...................................................................................................... 100 7.1.2 計算投影矩陣 ...................................................................................................... 101 7.1.3 向量降維 .............................................................................................................. 103 7.1.4 向量重構(gòu) .............................................................................................................. 103 7.2 線性判別分析 ................................................................................................................. 103 7.2.1 線性判別分析原理 ............................................................................................... 103 7.2.2 構(gòu)造判別模型的過程 ........................................................................................... 105 7.3 局部線性嵌入 ................................................................................................................. 106 7.4 拉普拉斯特征映射 ......................................................................................................... 107 7.5 數(shù)據(jù)降維算法案例 ......................................................................................................... 108 第 8 章 聚類算法 .......................................................................................................................... 112 8.1 聚類定義 ......................................................................................................................... 112 8.2 聚類分析過程及結(jié)果評估 .............................................................................................. 113 8.2.1 聚類分析過程 ....................................................................................................... 113 8.2.2 相似度度量 ........................................................................................................... 113 8.2.3 聚類算法的性能評估 ............................................................................................ 115 8.3 聚類算法分類 .................................................................................................................. 115 8.3.1 層次聚類算法 ....................................................................................................... 116 8.3.2 基于質(zhì)心的聚類算法 ............................................................................................ 117 8.3.3 基于概率分布的聚類算法 .................................................................................... 118 8.3.4 基于密度的聚類算法 ........................................................................................... 121 8.4 算法評價指標 ................................................................................................................. 126 8.4.1 內(nèi)部指標 .............................................................................................................. 126 8.4.2 外部指標 .............................................................................................................. 127 8.5 聚類算法案例 ................................................................................................................. 127 第 9 章 人工神經(jīng)網(wǎng)絡 ................................................................................................................. 129 9.1 人工神經(jīng)網(wǎng)絡概念 ......................................................................................................... 129 9.2 多層前饋型神經(jīng)網(wǎng)絡 ..................................................................................................... 130 9.2.1 神經(jīng)元 .................................................................................................................. 130 9.2.2 網(wǎng)絡結(jié)構(gòu) .............................................................................................................. 132 9.2.3 正向傳播算法 ...................................................................................................... 133 9.3 反向傳播算法 ................................................................................................................. 134 9.3.1 算法簡介 .............................................................................................................. 134 9.3.2 舉例說明 .............................................................................................................. 135 9.4 人工神經(jīng)網(wǎng)絡案例 ......................................................................................................... 139 第 10 章 隨機森林 ....................................................................................................................... 143 10.1 集成學習 ...................................................................................................................... 143 10.1.1 集成學習概念 .................................................................................................... 143 10.1.2 隨機抽樣 ............................................................................................................ 144 10.1.3 Bagging 算法 ...................................................................................................... 144 10.2 隨機森林原理和生成過程 ........................................................................................... 145 10.3 訓練算法 ...................................................................................................................... 146 10.4 變量 .............................................................................................................................. 147 10.5 隨機森林案例 ............................................................................................................... 148 第 11 章 機器學習在生物信息中的應用 .................................................................................... 156 11.1 蛋白質(zhì)相互作用熱點識別 ........................................................................................... 156 11.2 實驗數(shù)據(jù)集 ................................................................................................................... 157 11.2.1 訓練數(shù)據(jù)集 ........................................................................................................ 157 11.2.2 獨立測試集 ........................................................................................................ 158 11.3 特征提取與機器學習建模 ........................................................................................... 158 11.3.1 蛋白質(zhì)特征 ........................................................................................................ 158 11.3.2 特征選擇 ............................................................................................................ 160 11.3.3 特征提取 ............................................................................................................ 161 11.3.4 機器學習建模 ..................................................................................................... 162 11.4 實驗結(jié)果分析 ............................................................................................................... 162 11.4.1 實驗環(huán)境說明 ..................................................................................................... 162 11.4.2 實驗評估指標 ..................................................................................................... 162 11.4.3 訓練集結(jié)果比較 ................................................................................................. 163 11.4.4 獨立測試集結(jié)果比較 ......................................................................................... 165 11.4.5 獨立測試集上具體蛋白質(zhì)分析 ........................................................................... 168
你還可能感興趣
我要評論
|