作 者:龔纔春 著
定 價:158
出 版 社:電子工業出版社
出版日期:2021年05月01日
頁 數:424
裝 幀:平裝
ISBN:9787121408984
"讓讀者明白每一個模型的來龍去脈、適用範圍幫助讀者分析問題、學習模型、選擇模型、建立模型、創新模型"
●第1篇模型為什麼這麼神奇
第1章為什麼要建立模型2
1.1什麼是模型2
1.2無處不在的模型4
1.3模型的意義4
1.3.1萬有引力定律4
1.3.2大陸漂移假說5
1.3.3日心說5
1.4模型都是對的嗎6
1.4.1模型可以是錯的6
1.4.2模型可以是未被證實的7
1.4.3模型可以是互相矛盾的7
1.5什麼模型是好模型8
1.5.1表示客觀事物的能力8
1.5.2簡化客觀事物的能力9
1.5.3評價模型好壞的模型9
1.6模型的演化9
1.7正確看待模型的價值與缺陷10
1.7.1正確看待模型的局限性10
1.7.2用歷史的觀點看模型10
1.7.3拋棄對模型的階級觀點11
1.7.4用發展的觀點看模型11
1.8本書的特點12
1.8.1對讀者的基礎要求12
1.8.2從場景出發講模型12
1.8.3從方法論的視角講模型13
1.8.4用類比的技巧講模型13
1.8.5避免讀者被數學公式嚇倒13
1.8.6避免“知識的詛咒”14
1.9本書主要內容14
1.9.1權重模型15
1.9.2狀態模型15
1.9.3序列模型15
1.9.4表示模型16
1.9.5相似模型16
1.9.6分類模型16
第2章模型的運用18
2.1用知識圖譜表示問題18
2.1.1知識圖譜的基本理念18
2.1.2建立知識圖譜的一般步驟19
2.1.3問題的屬性研究19
2.1.4問題的關繫研究20
2.2問題分析的示例20
2.2.1前提假設分析20
2.2.2已有數據的分析21
2.2.3待求數據的分析21
2.2.4關繫分析21
2.3權重問題的判斷22
2.4狀態問題的判斷24
2.5序列問題的判斷25
2.6表示問題的判斷25
2.7相似問題的判斷26
2.8分類問題的判斷26
2.9模型之間的關繫27
第2篇權重模型:計算你的分量
第3章TF-IDF模型33
3.1應用場景33
3.2詞頻率―逆文檔頻率模型的計算34
3.2.1詞頻率模型34
3.2.2逆文檔頻率模型37
3.2.3TF-IDF模型39
3.3詞權重模型的平滑40
3.4引申閱讀40
3.4.1發明歷史41
3.4.2發明人簡介41
3.4.3近期新研究42
3.5本章總結42
第4章線性回歸模型43
4.1應用場景43
4.2直觀理解回歸問題44
4線性回歸問題45
4.3.1鋼軌長度與溫度的關繫直線45
4.3.2判斷最合適直線的兩個原則47
4.3.3最小二乘法50
4線性回歸問題52
4.5標準方程法53
4.5.1一些符號定義53
4.5.2矩陣表示54
4.5.3參數求解55
4.5.4用標準方程法計算銀行授信額度58
4.6梯度下降法60
4.6.1梯度下降法的直觀理解60
4.6.2坡度最陡下山法63
4.6.3坡度最陡下山法的類比64
4.6.4梯度下降法的計算66
4.6.5銀行授信額度的計算67
4.7梯度下降法與標準方程法的區別68
4.8引申閱讀69
4.8.1最小二乘法的發明69
4.8.2梯度下降法的發明69
4.8.3近期新研究69
4.9本章總結71
第5章PageRank模型73
5.1應用場景73
5.2PageRank的直觀算法74
5.2.1PageRank模型的直觀理解75
5.2.2模型的初始化77
5.2.3模型的迭代79
5.3直觀算法的漏洞修復81
5.3.1非連通漏洞81
5.3.2過河拆橋型漏洞82
5.3.3孤芳自賞型漏洞85
5.3.4過分謙虛型漏洞85
5.3.5隨機遊走模型86
5.4PageRank模型的計算88
5.4.1鏈接關繫表88
5.4.2鏈接瀏覽矩陣88
5.4.3直接瀏覽矩陣89
5.4.4狀態轉移矩陣89
5.4.5迭代計算90
5.4.6計算示例91
5.5引申閱讀92
5.5.1收斂性證明93
5.5.2發明歷史94
5.5.3發明人簡介94
5.5.4相關研究95
5.6本章總結95
第3篇狀態模型:加官進爵的模型
第6章有限狀態自動機模型100
6.1應用場景100
6.1.1Java詞法分析100
6.1.2Java詞法分析示例101
6.2直觀理解與形式化描述103
6.2.1自動機模型的直觀理解103
6.2.2形式化描述105
6.4詞法分析自動機模型105
6.4.1注釋識別自動機105
6.4.2保留字識別自動機107
6.5地址解析自動機模型108
6.5.1地址解析場景概述108
6.5.2地址解析的難度109
6.5.3標準地址庫建設110
6.5.4地址識別自動機模型111
6.6引申閱讀113
6.6.1發明歷史113
6.6.2發明人簡介114
6.6.3近期新研究114
6.7本章總結115
第7章模式匹配自動機模型116
7.1應用場景116
7.2形式化描述118
7.3BF模式匹配算法118
7.3.1BF算法的直觀理解118
7.3.2BF算法的匹配過程示例119
7.3.3BF算法的偽碼表示121
7.3.4BF算法的自動機模型121
7.4RK模式匹配算法122
7.5KMP模式匹配算法123
7.5.1KMP算法的直觀理解123
7.5.2KMP算法的匹配過程示例125
7.5.3移動長度的計算127
7.5.4KMP算法的自動機模型129
7.5.5KMP算法的總結129
7.6BM模式匹配算法129
7.6.1後向BF算法130
7.6.2實現跳躍式匹配131
7.6.3基於壞字符的模式匹配過程132
7.6.4壞字符匹配算法的缺陷137
7.6.5好後綴的匹配規則138
7.6.6BM模式匹配算法介紹141
7.6.7BM算法的自動機模型143
7.7AC模式匹配算法143
7.7.1TRIE樹的使用144
7.7.2TRIE樹的構建145
7.7.3失效指針的直觀理解146
7.7.4失效指針的設置示例147
7.7.5失效指針的設置算法150
7.7.6AC算法的匹配過程示例152
7.8Wu-Manber模式匹配算法153
7.8.1Wu-Manber算法的直觀理解153
7.8.2Wu-Manber算法的總體思路155
7.8.3字符塊156
7.8.4後移長度數組157
7.8.5字符塊的哈希值159
7.8.6倒排鏈表159
7.8.7前綴哈希值160
7.8.8Wu-Manber算法的匹配過程示例161
7.9引申閱讀163
7.10本章總結166
第4篇序列模型:揭示現像背後的規律
第8章隱馬爾可夫模型170
8.1應用場景171
8.2馬爾可夫鏈171
8.3隱馬爾可夫模型的定義173
8.3.1直觀定義173
8.3.2形式化定義174
8.3.3盲人與苔蘚的例子174
8.4兩個假設176
8.4.1齊次馬爾可夫假設176
8.4.2觀察獨立性假設176
8.5評估問題177
8.5.1評估問題的應用價值177
8.5.2暴力求解法178
8.5.3前向算法179
8.5.4前向算法的形式化描述185
8.5.5前向算法的算法描述186
8.5.6後向算法187
8.6解碼問題190
8.6.1暴力求解法190
8.6.2維特比算法190
8.6.3維特比算法的形式化描述197
8.7學習問題198
8.7.1監督學習199
8.7.2非監督學習201
8.7.3一個更簡單的EM算法例子202
8.7.4更好一點的算法205
8.7.5直觀方法206
8.7.6Baum-Welch算法207
8.7.7Baum-Welch算法的偽碼描述212
8.8引申閱讀213
8.8.1發明人簡介213
8.8.2近期新研究214
8.9本章總結215
第9章優選熵模型216
9.1應用場景216
9.1.1語義消歧216
9.1.2音字轉換217
9.1.3其他常見場景217
9.2直觀理解優選熵217
9.2.1熵增加原理217
9.2.2熵的定義218
9.2.3不要把雞蛋放在同一個籃子裡219
9.2.4不要隨意添加主觀假設219
9.3最簡單的優選熵計算示例220
9.3.1方程組求解220
9.3.2優選熵化221
9.3.3拉格朗日乘子法221
9.3.4骰子的概率計算223
9.3.5計算復雜度分析225
9.4形式化定義226
9.4.1經驗分布226
9.4.2特征函數227
9.4.3特征模板228
9.4.4約束條件及其期望228
9.4.5條件熵230
9.4.6優選熵的定義230
9.5優選熵模型的計算流程231
9.5.1模型訓練231
9.5.2模型執行232
9.6平滑方法232
9.6.1拉普拉斯平滑233
9.6.2古德―圖靈平滑235
9.6.3Jelinek-Mercer平滑238
9.6.4Katz平滑239
9.6.5絕對平滑240
9.6.6Witten-Bell平滑241
9.6.7Kneser-Ney平滑242
9.6.8各種平滑方法的演化關繫243
9.7特征選擇244
9.7.1基於閾值的特征選擇245
9.7.2增量式特征選擇245
9.8參數計算245
9.8.1參數計算的形式化246
9.8.2參數的數值計算248
9.9引申閱讀250
9.10本章總結250
第5篇表示模型:萬事萬物的表示
第10章向量空間模型255
10.1應用場景255
10.2之前的文本表示方法256
10.3向量空間模型257
10.3.1文檔的詞袋化257
10.3.2文檔的向量化258
10.3.3詞項的權重計算260
10.4相似度計算262
10.5引申閱讀263
10.5.1發明人介紹263
10.5.2近期新研究263
10.6本章總結264
第11章潛在語義分析模型265
11.1應用場景265
11.2LSA模型的計算267
11.2.1詞―文檔矩陣267
11.2.2奇異值分解269
11.2.3降維處理271
11.3結果的解讀274
11.3.13個矩陣的物理含義274
11.3.2實驗結果解讀274
11.4為什麼LSA模型有效276
11.5LSA模型的應用277
11.5.1識別同義詞和近義詞277
11.5.2文檔的聚類和分類279
11.5.3跨語言語義檢索280
11.6LSA模型的不足281
11.7引申閱讀282
11.7.1發明人介紹282
11.7.2近期新研究282
11.8本章總結283
第6篇相似模型:誰與我臭味相投
第12章相似模型287
12.1歐幾裡得距離287
12.2曼哈頓距離288
12.3切比雪夫距離291
12.4閔可夫斯基距離292
12.5馬哈拉諾比斯距離292
12.5.1用歐氏距離計算身材相似度292
12.5.2歐氏距離失效的原因293
12.5.3引入原因294
12.5.4方差與協方差294
12.5.5馬氏距離的定義297
12.5.6馬氏距離為什麼有效298
12.6皮爾遜相關繫數298
12.7Jaccard相關繫數299
12.8餘弦相似度301
12.9漢明距離303
12.10KL散度304
12.11海林格距離306
12.12編輯距離306
12.13本章總結311
第7篇分類模型:物以類聚,人以群分
第13章感知機模型315
13.1應用場景315
13.的工作原理317
13.3感知機模型的原理320
13.3.1感知機模型的數學表示320
13.3.2感知機模型的分類原理320
13.3.3距離的計算323
13.3.4代價函數323
13.4參數訓練324
13.4.1梯度下降法324
13.4.2計算示例325
13.5引申閱讀326
13.5.1發明歷史326
13.5.2近期新研究327
13.5.3與其他模型的關繫327
13.6本章總結328
第14章邏輯回歸模型329
14.1應用場景329
14.2直觀理解邏輯回歸模型330
14.2.1邏輯回歸的目標模型330
14.2.2邏輯回歸模型的工作原理332
14.3邏輯回歸模型的計算333
14.3.1相關符號表示333
14.3.2代價函數334
14.3.3梯度下降法335
14.4引申閱讀336
14.4.1發明人簡介336
14.4.2發明歷史336
14.4.3近期新研究337
14.5本章總結338
第15章樸素貝葉斯模型339
15.1應用場景339
15.2先驗概率和後驗概率340
15.3貝葉斯公式341
15.3.1全概率公式341
15.3.2逆概率公式342
15.4獨立假設343
15.5文本分類的案例344
15.5.1訓練樣本介紹345
15.5.2詞典與先驗概率345
15.5.3直接使用貝葉斯公式346
15.5.4拉普拉斯平滑347
15.6引申閱讀349
15.7本章總結349
第16章決策樹模型350
16.1應用場景350
16.2決策樹模型的直觀理解351
16.2.1猜數字的遊戲351
16.2.2猜動物的遊戲352
16.2.3決策樹模型要解決的問題354
16.3很好決策樹354
16.3.1蠻力的方法355
16.3.2從數據中領悟審批原則355
16.3.3什麼是好問題356
16.4信息量的計算357
16.4.1信息熵的定義357
16.4.2熵的計算示例358
16.4.3熵的單位359
16.5信息增益與ID3算法359
16.5.1條件熵的定義360
16.5.2信息增益的計算360
16.5.3使用信息增益選擇特征361
16.5.4ID3算法364
16.6信息增益比與C4.5算法364
16.6.1信息增益比的定義364
16.6.2計算示例365
16.6.3C4.5算法365
16.7基尼繫數與CART算法366
16.7.1基尼繫數定義367
16.7.2基尼繫數計算示例368
16.7.3CART分類樹算法372
16.7.4CART回歸樹373
16.8引申閱讀375
16.8.1發明歷史375
16.8.2近期新研究377
16.9本章總結377
第17章支持向量機模型378
17.1應用場景378
17支持向量機379
17支持向量機383
17.3.1實例場景描述383
17.3.2很好分類面384
17.3.3很好分類直線的函數形式385
17.3.4分類間隔的計算387
17.3.5優選化問題的數學表示388
17.3.6拉格朗日乘子法389
17.4支持向量機的對偶問題391
17.4.1SVM模型的數學描述391
17.4.2SVM模型的對偶問題392
17.5支持向量機的參數求解396
17.5.1SMO算法的形式描述396
17.5.2SMO算法的整體思路397
17.5.3參數更新過程399
17.5.4乘子的啟發式選擇401
17.6引申閱讀402
17.6.1發明歷史402
17.6.2發明人簡介403
17.6.3近期新研究403
17.7本章總結404
對從事算法研究與算法開發的人來說,模型的學習與使用必不可少。尤其是在目前備受關注的人工智能領域裡,人人談模型,新模型也是層出不窮,讓人眼花繚亂。模型讓人又愛又恨:可愛的地方在於它確實能夠解決實際問題,而且其有效性一般都經過了檢驗;可恨的地方在於學習它是一件非常痛苦的事情,尤其是對人工智能的初學者來說。本書將人工智能在現實生活場景中解決的問題分類,並根據這個分類來介紹各種模型。書中將人工智能問題分為權重問題、狀態問題、序列問題、表示問題、相似問題和分類問題六大類,方便讀者了解各個模型之間的關繫,也方便讀者理解各個模型的適用場景。本書盡量更多地結合模型的使用場景,更多地介紹實際業務需求之間的關繫,更多地采用生活中淺顯易懂的例子,方便人工智能的初學者學習模型。本書不僅適合希望學習和運用人工智能模型到具體應用場景的企業工程師、科研院所的學生和科研人員,也適合對人工智能模型感興趣的讀者,幫助其將模型等
龔纔春 著
"龔纔春畢業於中國科學院計算技術研究所,工學博士學位;教授,博士生導師;長期從事人工智能與人力資源等領域的研究。中關村科金技術人工智能研究院院長,職品彙創始人,大街網原首席科學家,阿裡巴巴原搜索研發專家。在大數據挖掘方面有許多成功經驗,創辦了大數據虛假簡歷識別平臺職品彙;在自然語言處理,尤其是語義理解、知識圖譜等方面有深刻理解,中文幽默識別是其一個有特色的研究工作;曾負責淘寶評論的情感分析等工作。"