作 者:袁雪 著
定 價:39.8
出 版 社:清華大學出版社
出版日期:2021年09月01日
頁 數:168
裝 幀:平裝
ISBN:9787302579250
本書在多年科研積累的基礎上,指導讀者建立以理論+實踐+前沿為導向的“計算機視覺”學習思路,最後以基於YOLO和DeepSort的目標檢測與跟蹤的綜合案例完成實踐
●第1章 人工智能概述1
1.1 人工智能的發展浪潮1
1.2 AI技術發展歷史4
1.2.1 AI技術三要素之算法4
1.2.2 AI技術三要素之計算資源6
1.2.3 AI三要素之數據6
1.3 視頻分析技術的應用案例9
1.3.1 基於人臉識別技術的罪犯抓捕繫統9
1.3.2 基於文字識別技術的辦公自動化繫統10
1.3.3 基於圖像分割及目標檢測技術的無人駕駛環境感知繫統10
1.3.4 基於目標檢測及跟蹤技術的電子交警繫統10
1.3.5 基於圖像比對技術的產品缺陷檢測繫統10
1.3.6 基於行為識別技術的安全生產管理繫統10
1.4 本章小結10
第2章 深度卷積神經網絡11
2.1 深度卷積神經網絡的概念11
2.2 卷積神經網絡的構成12
2.2.1 卷積層12
2.2.2 激活函數12
2.2.3 池化層14
2.3 深度卷積神經網絡模型結構14
2.3.1 常用網絡模型14
2.3.2 網絡模型對比20
2.4 圖像分類20
2.5 遷移學習21
2.6 圖像識別項目實例22
2.6.1 下載ImageNet的訓練模型22
2.6.2 ResNet模型構建23
2.6.3 測試圖像26
2.7 本章小結27
2.8 習題27
第3章 目標檢測28
3.1 目標檢測的概念28
3.2 基於候選區域的目標檢測算法29
3.2.1 Faster R-CNN目標檢測算法30
3.2.2 基於區域的全卷積網絡(R-FCN)目標檢測算法30
3.3 基於回歸的目標檢測算法32
3.3.1 YOLO目標檢測算法32
3.3.2 SSD目標檢測算法33
3.4 目標檢測算法評價指標34
3.5 深度卷積神經網絡目標檢測算法性能對比35
3.6 目標檢測項目實戰36
3.6.1 Faster R-CNN36
3.6.2 用YOLO訓練自己的模型40
3.7 本章小結43
3.8 習題43
第4章 圖像分割44
4.1 圖像分割的概念44
4.2 典型的圖像分割算法45
4.2.1 FCN分割算法45
4.2.2 DeepLab分割算法45
4.2.3 SegNet圖像分割算法47
4.2.4 U-Net算法47
4.2.5 Mask R-CNN算法48
4.3 圖像分割評價標準49
4.4 圖像分割項目實戰50
4.4.1 FCN32模型構建51
4.4.2 FCN8的模型構建52
4.4.3 Seg-Net的模型構建53
4.4.4 U-Net的模型構建56
4.5 本章小結59
4.6 習題59
第5章 目標跟蹤60
5.1 圖像分割的概念60
5.2 基於光流特征的目標跟蹤算法63
5.2.1 基於光流特征跟蹤算法概述63
5.2.2 LK光流法65
5.3 SORT目標跟蹤算法66
5.3.1 卡爾曼濾波器66
5.3.2 基於匈牙利算法的數據關聯68
5.4 Deep SORT多目標跟蹤算法69
5.4.1 Deep SORT算法跟蹤原理69
5.4.2 外觀特征間的關聯性計算69
5.4.3 利用運動信息關聯目標71
5.4.4 級聯匹配71
5.5 目標跟蹤算法評價指標72
5.6 Deep SORT算法主要程序及分析72
5.6.1 目標檢測框的獲取及坐標轉換72
5.6.2 卡爾曼濾波73
5.6.3 深度外觀特征的提取77
5.6.4 匹配78
5.6.5 後續處理79
5.7 本章小結81
5.8 習題81
第6章 OCR文字識別82
6.1 OCR文字識別的概念82
6.2 文字檢測83
6.2.1 傳統的文字檢測算法83
6.2.2 基於深度學習的文字檢測算法83
6.3 文字識別算法89
6.3.1 基於DenseNet網絡模型的序列特征提取89
6.3.2 基於LSTM結構的上下文序列特征提取91
6.3.3 字符序列的解碼方式92
6.4 項目實戰95
6.4.1 CRAFT模型搭建96
6.4.2 CRNN模型搭建97
6.4.3 文字檢測與識別程序99
6.5 本章小結104
6.6 習題105
第7章 多任務深度學習網絡106
7.1 多任務深度學習網絡的概念107
7.2 多任務深度學習網絡構建107
7.2.1 多任務網絡的主要分類107
7.2.2 並行式網絡109
7.2.3 級聯式網絡110
7.3 多任務深度學習網絡的代碼實現113
7.3.1 構建多任務深度學習網絡114
7.3.2 多任務深度學習網絡的訓練116
7.3.3 多任務深度學習模型測試116
7.4 本章小結119
7.5 習題119
第8章 生成對抗神經網絡120
8.1 生成對抗網絡的概念120
8.2 典型的生成對抗網絡121
8.2.1 DCGAN121
8.2.2 CycleGAN123
8.3 傳送帶表面缺陷樣本增強案例126
8.4 項目實戰128
8.4.1 DCGAN128
8.4.2 CycleGAN130
8.5 本章小結132
8.6 習題132
第9章 樣本制作與數據增強133
9.1 數據的獲取133
9.2 數據的標注133
9.2.1 目標檢測與識別標注軟件LabelImg134
9.2.2 圖像分割標注軟件LabelMe134
9.3 數據增強134
9.4 項目實戰:數據增強135
9.4.1 數據增強庫的安裝與卸載135
9.4.2 數據增強庫的基本使用136
9.4.3 樣本數據增強的結果136
9.4.4 關鍵點變換137
9.4.5 標注框(Bounding Box)變換139
9.5 本章小結141
9.6 習題141
第10章 Keras安裝和API142
10.1 安裝Keras142
10.1.1 第1步——安裝依賴項142
10.1.2 第2步——安裝TensorFlow144
10.1.3 第3步——安裝Keras145
10.1.4 第4步——測試TensorFlow和Keras145
10.2 配置Keras146
10.3 Keras API146
10.4 TensorFlow API146
10.5 本章小結147
第11章 綜合實驗:基於YOLO和Deep Sort的目標檢測與跟蹤148
11.1 算法流程148
11.2 實驗代碼149
11.3 實驗評價155
人工智能正在成為全世界產業變革的方向,處於第四次科技革命的核心地位。計算機視覺(Computer Vision)就是利用攝像機、算法和計算資源為人工智能繫統按上“眼睛”,讓其可以擁有人類的雙眼所具有的前景與背景分割、物體識別、目標跟蹤、判斷決策等功能。計算機視覺繫統可以讓計算機看見並理解這個世界的“信息”,從而替代人類完成重復性工作。目前計算機視覺領域熱門的研究方向有物體檢測與識別、語義分割、目標跟蹤等。
本書圍繞著計算機視覺的關鍵技術,介紹基於深度學習計算機視覺的基礎理論及主要算法。
本書結合常見的應用場景和項目實例,循序漸進地帶領讀者進入美妙的計算機視覺世界。
本書共分為11章,第1章為人工智能概述;第2~5章介紹計算機視覺的幾種關鍵技術,即圖像分類、目標檢測、圖像分割和目標跟蹤,並將這四項關鍵技術組合完成人工智能的實際應用;第6、7章介紹人工智能的等