作 者:肖鈴,劉東 著
定 價:99
出 版 社:電子工業出版社
出版日期:2021年11月01日
頁 數:300
裝 幀:平裝
ISBN:9787121417597
一本透徹講解計算機視覺的實戰圖書,通過近60個大中型案例,詳細講解了計算機視覺中的深度學習算法、理論和關鍵技術實現。快速幫助在計算機視覺領域的讀者掌握相關的理論知識,以及通過相應的案例實操從而快速上手,書中的上百個計算機視覺知識點,有C++和Python雙語言支持,不僅適用於直接使用Python的用戶,也能幫助C++用戶快速進階。
●第1章深度學習基礎1
1.1神經網絡1
1.1.1感知機1
1.1.2神經網絡原理2
1.2卷積神經網絡3
1.2.1CNN基本操作3
1.2.2CNN原理6
1.3循環神經網絡7
1.3.1RNN7
1.3.2LSTM與GRU8
1.4經典網絡9
1.4.1AlexNet9
1.4.2VGG10
1.4.3GoogLeNet11
1.4.4ResNet12
1.4.5MobileNet13
1.5進階推薦:如何學習深度學習並“落地”求職16
1.5.1深度學習如何快速入門16
1.5.2深度學習行業求職技巧17
第2章計算機視覺基礎18
2.1目標檢測Two-stage算法18
2.1.1R-CNN算法18
2.1.2FastR-CNN算法20
2.1.3FasterR-CNN算法21
2.2目標檢測One-stage算法23
2.2.1YOLO繫列算法23
2.2.2SSD算法29
2.3圖像分割算法31
2.3.1FCN算法31
2.3.2U-Net算法33
2.3.3DeepLab繫列算法34
2.3.4MaskR-CNN算法37
2.4進階推薦:計算機視覺方向知多少38
第3章基礎圖像處理40
3.1線性濾波40
3.1.1案例1:使用方框濾波41
3.1.2案例2:使用均值濾波46
3.1.3案例3:使用高斯濾波48
3.2非線性濾波50
3.2.1案例4:使用中值濾波例50
3.2.2案例5:使用雙邊濾波52
3.3OpenCV形態學運算54
3.3.1案例6:進行膨脹操作55
3.3.2案例7:進行腐蝕操作57
3.3.3案例8:使用形態學運算58
3.4案例9:使用漫水填充63
3.5圖像金字塔67
3.5.1案例10:使用高斯金字塔67
3.5.2案例11:使用拉普拉斯金字塔70
3.6閾值化73
3.6.1案例12:使用基本閾值74
3.6.2案例13:使用自適應閾值78
3.7進階推薦:選擇一款合適的圖像處理工具80
3.7.1OpenCV80
3.7.2Matlab81
第4章圖像變換83
4.1邊緣檢測83
4.1.1案例14:Sobel算法83
4.1.2案例15:Scharr算法87
4.1.3案例16:Laplacian算法90
4.1.4案例17:Canny算法91
4.2案例18:繪制輪廓94
4.3霍夫變換97
4.3.1案例19:霍夫線變換97
4.3.2案例20:霍夫圓變換101
4.4案例21:重映射103
4.5案例22:仿射變換106
4.6案例23:透視變換109
4.7直方圖111
4.7.1案例24:直方圖的計算與繪制111
4.7.2案例25:直方圖均衡化113
4.8進階推薦:圖像變換應用之文本圖像矯正114
4.8.1圖像變換知識總結114
4.8.2案例26:文本圖像矯正115
第5章角點檢測117
5.1案例27:Harris角點檢測117
5.2案例28:Shi-Tomasi角點檢測119
5.3案例29:亞像素級角點檢測122
5.4進階推薦:角點檢測知識總結125
第6章特征點檢測與匹配127
6.1特征點檢測127
6.1.1opencv-contrib環境安裝127
6.1.2案例30:SIFT特征點檢測130
6.1.3案例31:SURF特征點檢測137
6.2特征匹配139
6.2.1案例32:BruteForce匹配139
6.2.2案例33:FLANN匹配146
6.3案例34:ORB特征提取148
6.4進階推薦:利用特征點拼接圖像151
6.4.1特征點檢測算法彙總151
6.4.2案例35:基於特征點檢測與匹配的圖像拼接151
第7章手寫數字識別155
7.1Keras的應用155
7.1.1Keras模型155
7.1.2Keras層156
7.1.3模型編譯157
7.1.4模型訓練158
7.2LeNet算法159
7.3案例36:使用Keras實現手寫數字識別160
7.3.1模型訓練160
7.3.2手寫數字識別模型推理164
7.4進階推薦:算法模型開發流程167
7.4.1數據準備167
7.4.2網絡搭建169
7.4.3模型訓練170
第8章CIFAR-10圖像分類171
8.1圖像分類數據集171
8.1.1CIFAR-10數據集和CIFAR-100數據集171
8.1.2ImageNet數據集172
8.1.3PASCALVOC數據集173
8.2案例37:CIFAR-10圖像分類173
8.2.1模型訓練過程174
8.2.2模型推理179
8.3進階推薦:COCO數據集與使用
HOGTSVM方法實現圖像分類180
8.3.1COCO數據集180
8.3.2案例38:使用HOG+SVM
方法實現圖像分類180
第9章驗證碼識別184
9.1TensorFlow應用184
9.1.1案例39:TensorFlow的基本使用184
9.1.2TensorFlow的常用模塊186
9.2案例40:驗證碼識別188
9.2.1生成驗證碼圖片188
9.2.2基於TensorFlow的驗證碼識別189
9.3進階推薦:算法模型開發技巧194
9.3.1數據預處理技巧194
9.3.2網絡搭建技巧195
9.3.3模型訓練技巧196
第10章文本檢測實戰197
10.1文本檢測算法197
10.1.1CTPN算法198
10.1.2EAST算法200
10.2案例41:基於EAST算法的文本檢測202
10.2.1數據預處理202
10.2.2網絡搭建205
10.2.3模型訓練212
10.2.4文本檢測驗證217
10.3進階推薦:在不同場景下文本檢測的應對方式218
10.3.1復雜場景文本檢測219
10.3.2案例42:使用形態學運算實現簡單場景文本檢測220
10.3.3案例43:使用MSER+NMS實現簡單場景文本檢測223
第11章文本識別實戰226
11.1文本識別算法226
11.1.1CRNN算法226
11.1.2AttentionOCR算法229
11.2案例44:基於C-RNN算法的文本識別231
11.2.1數據預處理231
11.2.2網絡搭建232
11.2.3模型訓練236
11.2.4文本識別驗證237
11.3進階推薦:單字OCR238
11.3.1OCR探究238
11.3.2案例45:文本圖片字符切割238
第12章TensorFlowLite244
12.1TensorFlowLite介紹244
12.1.1TensorFlowLite基礎245
12.1.2TensorFlowLite源碼分析246
12.2模型轉換248
12.2.1FlatBuffers文件格式248
12.2.2案例46:其他格式轉換為.tflite模型250
12.3模型量化252
12.3.1案例47:量化感知訓練252
12.3.2案例48:訓練後量化255
12.4進階推薦:模型轉換與模型部署優化答疑257
12.4.1模型轉換問題257
12.4.2模型部署優化258
第13章基於TensorFlowLite的AI
功能部署實戰260
13.1部署流程260
13.2案例49:移動端部署261
13.2.1搭建開發環境262
13.2.2編譯運行項目262
13.2.3調用過程解析264
13.3PC端部署266
13.3.1案例50:Windows端部署266
13.3.2案例51:Linux端部署278
13.3.3案例52:ARM平臺部署282
13.3.4案例53:MIPS平臺部署285
13.4進階推薦:推理框架拓展與OpenCV編譯部署286
13.4.1其他深度學習推理框架286
13.4.2OpenCV編譯286
本書是一本學習計算機視覺的實戰指南,通過理論與實踐相結合的思想,真正一站式搞定理論學習、算法開發到模型部署上線。
全書內容可分為四個部分。第一部分包括第1~2章,主要汫解深度學習和計算機視覺基礎,如計算機視覺領域的經典網絡和常見的目標檢測算法;第二部分包括第3~6章,主要汫解圖像處理知識,結合應用案例,對知識點進行分析說明;第三部分包括第7~11章,主要汫解計算機視覺中的實戰項目,對實現細節做了追本溯源的汫解;第四部分包括第12~13章,主要汫解模型的落地部署,該部分的講解基於TensorFlow Lite框架,該框架受眾廣、熱度高,且在各種平臺都有對應的支持與優化加速方案,方便讀者使用。
本書中的上百個知識點與近60個案例都是作者工程應用中的經驗總結,每章末尾均有"逬階推薦",給讀者提供更多的拓展知識。本書適合計算機視.覺的初學者、計算機視覺算法開發人員、對深度學等