Python數(shù)據(jù)處理與分析案例教程
定 價(jià):49.8 元
- 作者:藺首晶
- 出版時(shí)間:2025/4/1
- ISBN:9787121500749
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP312.8
- 頁碼:244
- 紙張:
- 版次:01
- 開本:16開
本書以VSCode為主要開發(fā)工具,全面系統(tǒng)地介紹了Python數(shù)據(jù)應(yīng)用開發(fā)的相關(guān)知識。本書采用理論與案例相結(jié)合,多樣化的案例、通俗易懂的講解形式、詳細(xì)的演示步驟,幫助大家輕松地學(xué)習(xí)Python數(shù)據(jù)分析的相關(guān)知識。全書共6個(gè)項(xiàng)目,前兩個(gè)項(xiàng)目介紹了文件采集和MySQL與Python交互的應(yīng)用,后面四個(gè)項(xiàng)目介紹了Python數(shù)據(jù)分析的常用庫及其應(yīng)用,涵蓋了科學(xué)計(jì)算庫NumPy、數(shù)據(jù)分析庫Pandas、數(shù)據(jù)清洗和數(shù)據(jù)可視化庫Matplotlib和pyecharts。每個(gè)項(xiàng)目中都結(jié)合所學(xué)的技術(shù)開發(fā)了綜合實(shí)訓(xùn),演示如何在項(xiàng)目中運(yùn)用所學(xué)的知識,通過動(dòng)手操作和練習(xí),幫助讀者更好地理解和掌握所學(xué)的知識。
藺首晶, 畢業(yè)于哈爾濱師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)本科學(xué)歷,在東北財(cái)經(jīng)大學(xué)獲得碩士學(xué)位,"雙師型”教師,自2005年至今,從教于大連電子學(xué)校軟件及應(yīng)用教學(xué)部,現(xiàn)任高級講師,長期工作在職業(yè)院校計(jì)算機(jī)軟件專業(yè)教學(xué)管理一線,有著較強(qiáng)的教育教學(xué)管理能力和豐富的教學(xué)經(jīng)驗(yàn),多次參編教材,主持、參與科研課題多項(xiàng),在各項(xiàng)教學(xué)比賽、課件比賽中榮獲國家級、省級、市級等多個(gè)獎(jiǎng)項(xiàng),多篇教學(xué)論文在國內(nèi)期刊教育專欄發(fā)表并獲獎(jiǎng)。2021年被評為大連市職業(yè)院校骨干教師,具備很好的教學(xué)素質(zhì),并有一定的研究能力,可以帶動(dòng)身邊的教師一起參與研究。
項(xiàng)目1 文件采集 001
1.1 第三方模塊 002
1.1.1 第三方模塊的概念 002
1.1.2 NumPy、Pandas模塊的下載與安裝 004
1.2 CSV格式化數(shù)據(jù)的讀寫 006
1.2.1 CSV文件和csv模塊 006
1.2.2 使用NumPy模塊讀寫CSV文件 013
1.2.3 Pandas讀取和寫入CSV文件 015
1.3 XML文件讀寫 017
1.3.1 XML文件結(jié)構(gòu) 017
1.3.2 解析XML文件 018
1.4 JSON格式化數(shù)據(jù)的讀寫 020
1.4.1 JSON數(shù)據(jù)格式 020
1.4.2 JSON文件讀取 020
1.5 Excel格式化數(shù)據(jù)的讀寫 024
1.5.1 使用xlrd和xlwt模塊讀寫Excel文件 024
1.5.2 使用Pandas讀寫Excel文件 030
任務(wù)拓展 031
實(shí)訓(xùn)1:汽車數(shù)據(jù)寫入CSV文件 031
實(shí)訓(xùn)2:網(wǎng)絡(luò)數(shù)據(jù)爬取 038
課后練習(xí) 047
項(xiàng)目2 Python訪問MySQL與MongoDB數(shù)據(jù)庫 049
2.1 數(shù)據(jù)庫基礎(chǔ) 050
2.1.1 概述 050
2.1.2 數(shù)據(jù)庫分類 051
2.2 MySQL與Python交互 052
2.2.1 pymysql庫 052
2.2.2 訪問及查詢MySQL數(shù)據(jù)庫 053
2.3 MongoDB與Python交互 064
2.3.1 pymongo庫概述 064
2.3.2 訪問MongoDB 數(shù)據(jù)庫 064
任務(wù)拓展 069
實(shí)訓(xùn)3:構(gòu)建基于MySQL與Python交互的汽車數(shù)據(jù)管理系統(tǒng) 069
課后練習(xí) 075
項(xiàng)目3 NumPy庫 077
3.1 Ndarray對象 078
3.1.1 認(rèn)識NumPy數(shù)組對象 078
3.1.2 創(chuàng)建NumPy數(shù)組 079
3.1.3 NumPy數(shù)組屬性 081
3.1.4 NumPy切片和索引 083
3.2 NumPy數(shù)組操作 088
3.2.1 修改數(shù)組形狀 089
3.2.2 連接數(shù)組 089
3.2.3 分割數(shù)組 093
3.2.4 數(shù)組元素的添加與刪除 095
3.3 NumPy函數(shù) 098
3.3.1 NumPy通用函數(shù) 099
3.3.2 NumPy統(tǒng)計(jì)函數(shù) 102
任務(wù)拓展 108
實(shí)訓(xùn)4:管理手機(jī)卡用戶數(shù)據(jù) 108
課后練習(xí) 117
項(xiàng)目4 Pandas庫 119
4.1 Pandas數(shù)據(jù)結(jié)構(gòu) 120
4.1.1 Series的組成及創(chuàng)建 120
4.1.2 DataFrame的組成及創(chuàng)建 123
4.1.3 DataFrame的數(shù)據(jù)切片與合并 127
4.1.4 numpy.array與pandas.DataFrame的轉(zhuǎn)換 131
4.2 數(shù)據(jù)訪問 132
4.2.1 獲取DataFrame的字段信息 132
4.2.2 獲取指定的行和列 135
4.2.3 獲取數(shù)值型字段的統(tǒng)計(jì)信息 139
4.2.4 獲取文本型字段的取值信息 140
任務(wù)拓展 141
實(shí)訓(xùn)5:藥店數(shù)據(jù)維護(hù)與銷售情況分析 141
課后練習(xí) 146
項(xiàng)目5 數(shù)據(jù)清洗 148
5.1 數(shù)據(jù)清洗 149
5.1.1 缺失值的處理 149
5.1.2 重復(fù)值的處理 155
5.1.3 異常值的處理 157
5.1.4 更改數(shù)據(jù)類型 161
5.2 數(shù)據(jù)轉(zhuǎn)換 164
5.2.1 重命名軸索引 165
5.2.2 離散化連續(xù)數(shù)據(jù) 167
5.2.3 啞變量處理類別型數(shù)據(jù) 168
任務(wù)拓展 170
實(shí)訓(xùn)6:餐飲數(shù)據(jù)清洗 170
課后練習(xí) 177
項(xiàng)目6 數(shù)據(jù)可視化 179
6.1 數(shù)據(jù)可視化概述 180
6.1.1 什么是數(shù)據(jù)可視化 180
6.1.2 常見的圖表類型 180
6.1.3 數(shù)據(jù)可視化工具 184
6.2 使用Matplotlib繪制圖表 190
6.2.1 通過figure()函數(shù)創(chuàng)建畫布 190
6.2.2 通過subplot()函數(shù)創(chuàng)建單個(gè)子圖 194
6.2.3 通過subplots()函數(shù)創(chuàng)建多個(gè)子圖 197
6.2.4 通過add_subplot()方法添加和選中子圖 198
6.3 使用Matplotlib繪制其他簡單圖表 200
6.3.1 plot()函數(shù)繪制折線圖 200
6.3.2 通過scatter()繪制散點(diǎn)圖或氣泡圖 203
6.3.2 通過hist()函數(shù)繪制直方圖 206
6.3.3 通過pie()函數(shù)繪制餅圖或圓環(huán)圖 208
6.3.4 通過barth()方法繪制條形圖或堆積條形圖 210
任務(wù)拓展 215
實(shí)訓(xùn)7:使用pyecharts 繪制常見圖表 215
課后練習(xí) 235