本書是作者基于其多年的科研經(jīng)驗(yàn)而撰寫的聚類分析專著。全書從基礎(chǔ)知識和實(shí)際應(yīng)用兩方面系統(tǒng)地介紹了聚類分析方法;A(chǔ)知識部分闡述了聚類分析基本過程、數(shù)據(jù)預(yù)處理、相似度計(jì)算、驗(yàn)證指標(biāo)、常見聚類方法原理和特點(diǎn),并給出了應(yīng)用實(shí)例和程序供讀者參考。應(yīng)用部分則針對高維數(shù)據(jù)非監(jiān)督學(xué)習(xí)問題,分別以心電識別、腦電識別、行為識別以及智能材料
本書為一本大數(shù)據(jù)技術(shù)的入門書籍,介紹Hadoop大數(shù)據(jù)平臺和Spark大數(shù)據(jù)平臺及相關(guān)工具的原理,以及如何進(jìn)行部署和簡單開發(fā)。全書包含13章:第1、2章介紹如何為深入學(xué)習(xí)Hadoop和Spark做環(huán)境準(zhǔn)備,包括VMware虛擬機(jī)的創(chuàng)建和CentOS操作系統(tǒng)安裝。第3~6章介紹Hadoop大數(shù)據(jù)平臺的基本原理,包括HDF
數(shù)據(jù)管道通過整合、清理、分析、可視化等方式來管理初始收集的數(shù)據(jù)流。ApacheAirflow提供了一個(gè)統(tǒng)一的平臺,可以使用它設(shè)計(jì)、實(shí)施、監(jiān)控和維護(hù)數(shù)據(jù)的流動。Airflow具有易于使用的UI、即插即用的選項(xiàng)以及靈活的Python腳本,這些都使Airflow能夠非常輕松地完成任何數(shù)據(jù)管理任務(wù)。在《ApacheAirflo
本書基于“基礎(chǔ)知識”+“代碼示例”+“應(yīng)用案例”的模式編寫,共包括7個(gè)項(xiàng)目。項(xiàng)目1主要介紹互聯(lián)網(wǎng)數(shù)據(jù)采集的入門知識;項(xiàng)目2通過一個(gè)入門級的簡單案例,介紹互聯(lián)網(wǎng)數(shù)據(jù)采集的基本流程;項(xiàng)目3通過一個(gè)進(jìn)階的案例,詳細(xì)介紹在沒有給出官方開放API的情況下,如何通過抓包工具獲取XHR請求地址;項(xiàng)目4主要介紹HTML文檔數(shù)據(jù)的采集,
文本數(shù)據(jù)挖掘是通過機(jī)器學(xué)習(xí)、自然語言處理和推理等相關(guān)技術(shù)或方法,理解、分析和挖掘文本的內(nèi)容,從而完成信息抽取、關(guān)系發(fā)現(xiàn)、熱點(diǎn)預(yù)測、文本分類和自動摘要等具體任務(wù)的信息處理技術(shù)!段谋緮(shù)據(jù)挖掘(第2版)》主要介紹與文本數(shù)據(jù)挖掘有關(guān)的基本概念、理論模型和實(shí)現(xiàn)算法,包括數(shù)據(jù)預(yù)處理、文本表示、文本分類、文本聚類、主題模型、情感分
本書系統(tǒng)介紹了智能調(diào)度領(lǐng)域的理論知識,清晰地勾勒出智能調(diào)度的知識體系。全書共7章,分別是:緒論、智能調(diào)度的理論基礎(chǔ)、單機(jī)調(diào)度問題、并行機(jī)調(diào)度問題、開放車間調(diào)度、流水車間調(diào)度和作業(yè)車間調(diào)度。全書系統(tǒng)、深入淺出地講解了智能調(diào)度的理論知識,同時(shí)強(qiáng)化了各調(diào)度類型的數(shù)學(xué)模型和優(yōu)化方法,重點(diǎn)培養(yǎng)分析問題與解決調(diào)度問題的能力。為幫助
本書為普通高等教育十一五國家級規(guī)劃教材。本書從工程應(yīng)用的角度出發(fā),注重基礎(chǔ)性、系統(tǒng)性和實(shí)用性,較深入地介紹計(jì)算機(jī)控制系統(tǒng)的基本知識、分析和設(shè)計(jì)方法。全書共10章,包括:緒論、計(jì)算機(jī)控制系統(tǒng)設(shè)計(jì)的硬件基礎(chǔ)、計(jì)算機(jī)控制系統(tǒng)的數(shù)學(xué)基礎(chǔ)、計(jì)算機(jī)控制系統(tǒng)特性分析、計(jì)算機(jī)控制系統(tǒng)的間接設(shè)計(jì)方法、計(jì)算機(jī)控制系統(tǒng)的直接設(shè)計(jì)方法、數(shù)字控
本書系統(tǒng)地介紹了Hadoop、Spark、Flink等開源大數(shù)據(jù)組件的相關(guān)知識和實(shí)踐技能。全書共9章,涉及大數(shù)據(jù)采集、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)處理與分析等大數(shù)據(jù)應(yīng)用生命周期中各階段典型組件的部署、使用和基本編程方法,內(nèi)容包括部署全分布模式Hadoop集群、HDFS實(shí)戰(zhàn)、MapReduce編程、部署ZooKeeper集群
本書介紹了克服日常面臨的各種挑戰(zhàn)的實(shí)踐知識,以及各種數(shù)據(jù)科學(xué)解決方案,主要包括數(shù)據(jù)科學(xué)概論,機(jī)器學(xué)習(xí)模型測試,人工智能基礎(chǔ),理想的數(shù)據(jù)科學(xué)團(tuán)隊(duì),數(shù)據(jù)科學(xué)團(tuán)隊(duì)招聘面試,組建數(shù)據(jù)科學(xué)團(tuán)隊(duì),創(chuàng)新管理,管理數(shù)據(jù)科學(xué)項(xiàng)目,數(shù)據(jù)科學(xué)項(xiàng)目的常見陷阱,創(chuàng)造產(chǎn)品與提升可重用性,實(shí)施ModelOps,建立技術(shù)棧和結(jié)論。本書的目標(biāo)讀者是希望
大計(jì)算是融合了算力生產(chǎn)、算力傳輸和算力服務(wù)的一個(gè)綜合體,通過深度應(yīng)用云計(jì)算、大數(shù)據(jù)、人工智能等新興技術(shù),有力支撐了我國數(shù)字經(jīng)濟(jì)發(fā)展。本書從技術(shù)和應(yīng)用兩個(gè)角度出發(fā),系統(tǒng)總結(jié)了作者多年來在云計(jì)算、大數(shù)據(jù)、人工智能、數(shù)據(jù)中心等領(lǐng)域的工作實(shí)踐經(jīng)驗(yàn),在闡述大計(jì)算相關(guān)理論的基礎(chǔ)上,結(jié)合國際最新技術(shù)發(fā)展方向及典型應(yīng)用案例進(jìn)行編寫,并