了得網計算機/網絡_計算機視覺—

產品特色

編輯推薦

本書有以下特色：
1.覆蓋全面，對於計算機視覺沒有經驗的讀者也可以通過本書的學習掌握深度學習技術在典型計算機視覺技術領域的應用方法。
2.知行合一，重要的算法除了介紹算法原理和推導過程外，也配置了相應的實驗。
3.學以致用，介紹了工業界視覺應用繫統的搭建。帶領讀者動手搭建圖像識別繫統。
4.工業經驗，借鋻百度先進的視覺繫統經驗，做到理論和實踐相結合。
5.動手實操，本書配套實驗會部署到在線深度學習運行平臺AI-studio 。使用該平臺讀者可以非常方便的閱讀、運行和修改代碼，並且可以使用免費GPU資源訓練模型

內容簡介

本書在介紹深度學習、百度飛槳等相關知識的基礎上，著重介紹了圖像分類、目標檢測、語義分割、人體關鍵點檢測、圖像生成、視頻分類、圖像文本檢測和識別、圖像識別等計算機視覺任務的實現原理及深度學習模型框架，並通過具體案例來詳細介紹各任務的實現細節。全書分為理論篇和實戰篇。理論篇（第1～4章）梳理了計算機視覺技術的發展歷程、主要任務、行業應用繫統，同時簡要介紹了深度學習開發框架、飛槳（PaddlePaddle）開發平臺，以及深度學習的基礎知識與網絡模型架構。實戰篇（第5～12章）結合計算機視覺的各個任務要求與技術發展，對其中經典的深度學習算法模型進行介紹。全書提供了實例代碼，詳解了在飛槳開發框架下各任務的模型實現過程。本書適合作為高等院校人工智能、計算機視覺專業高年級本科生、研究生的教材，同時可作為計算機視覺相關任務實踐教程，也可以作為科研工作者的參考書籍。

理論篇
第3章深度學習算法基礎
3.1機器學習
3.2神經網絡的基本組成
3.2.
3.2.2神經網絡的結構
3.3神經網絡的計算
3.3.1激活函數
3.3.2正向傳播
3.3.3反向傳播
3.3.4優化算法
3.4卷積神經網絡的基本組成
3.4.1卷積層
3.4.2池化層

理論篇

第1章計算機視覺概述

1.1計算機視覺技術的發展

1.2計算機視覺任務概述

1.2.1計算機視覺經典任務

1.2.2計算機視覺常見任務

1.3計算機視覺處理應用繫統

1.3.1計算機視覺行業產業鏈

1.3.2計算機視覺行業應用繫統

1.4計算機視覺處理常用工具

1.4.1OpenCV簡介

1.4.2OpenCVPython

1.4.3OpenCV的基礎模塊

1.4.4其他CV常用工具

1.5本章小結

參考文獻

第2章深度學習開發框架

2.1常見的深度學習開發框架

2.1.1TensorFlow深度學習開發框架

2.1.2PyTorch深度學習開發框架

2.1.3PaddlePaddle深度學習開發框架

2.2飛槳基礎

2.2.1開發環境

2.2.2開發套件

2.2.3工具組件

2.2.4開發平臺

2.3本章小結

參考文獻

第3章深度學習算法基礎

3.1機器學習

3.2神經網絡的基本組成

3.2.

3.2.2神經網絡的結構

3.3神經網絡的計算

3.3.1激活函數

3.3.2正向傳播

3.3.3反向傳播

3.3.4優化算法

3.4卷積神經網絡的基本組成

3.4.1卷積層

3.4.2池化層

3.4.3ReLU激活函數

3.4.4全連接層

3.5深度學習模型的訓練技巧

3.5.1歸一化

3.5.2丟棄法

3.5.3權重衰減

3.5.4參數初始化

3.6本章小結

參考文獻

第4章深度學習網絡模型

4.1深度學習網絡架構

4.2代表性的網絡模型

4.2.1卷積神經網絡模型

4.2.2循環神經網絡模型

4.2.3Transformer網絡模型

4.2.4復雜MLP網絡模型

4.3網絡搭建案例

4.3.1環境準備

4.3.2數據準備

4.3.3模型構建

4.3.4模型訓練與驗證

4.3.5模型可視化

4.4本章小結

參考文獻

實戰篇

第5章圖像分類算法原理與實戰

5.1圖像分類任務的基本介紹

5.1.1圖像分類技術的發展

5.1.2圖像分類的評價指標

5.2基於殘差的網絡

5.2.1ResNet模型

5.2.2DenseNet模型

5.2.3DPN模型

5.3基於Transformer的網絡

5.3.1ViT模型

5.3.2SwinTransformer模型

5.4輕量化的網絡

5.4.1MobileNet模型

5.4.2PPLCNet模型

5.5飛槳實現圖像分類案例

5.5.1環境安裝與配置

5.5.2數據準備

5.5.3模型構建

5.5.4模型訓練

5.5.5模型預測

5.6本章小結

參考文獻

第6章目標檢測算法原理與實戰

6.1目標檢測任務基本介紹

6.1.1目標檢測技術的發展

6.1.2目標檢測的評價指標

6.2Faster RCNN基本解析

6.2.1RCNN繫列

6.2.2Faster RCNN整體架構

6.2.3Faster RCNN主要特點

6.3SSD基本解析

6.3.1SSD基本架構

6.3.2SSD主要特點

6.4YOLOv3基本解析

6.4.1YOLO繫列

6.4.2YOLOv3主要特點

6.5FCOS基本解析

6.5.1FCOS基本架構

6.5.2FCOS主要特點

6.5.3損失函數的設計

6.5.4FCOS的優缺點

6.6DETR基本解析

6.6.1DETR基本結構

6.6.2DETR主要特點

6.7飛槳實現目標檢測案例

6.7.1環境準備

6.7.2數據讀取與增強

6.7.3模型構建

6.7.4模型訓練

6.7.5模型測試與可視化

6.8本章小結

參考文獻

第7章語義分割算法原理與實戰

7.1語義分割任務的基本介紹

7.1.1語義分割的發展

7.1.2語義分割的評價指標

7.2深度學習語義分割基礎網絡

7.2.1FCN模型

7.2.2SegNet模型

7.2.3UNet模型

7.3語義分割網絡的繫列改進

7.3.1空洞可分離卷積： DeepLabv3

7.3.2低層細節信息保留： RefineNet

7.3.3全局語義特征聚合： OCRNet

7.4飛槳實現語義分割案例

7.4.1環境準備

7.4.2數據準備與預處理

7.4.3模型構建

7.4.4模型訓練

7.4.5模型驗證與評估

7.5本章小結

參考文獻

第8章人體關鍵點檢測原理與實戰

8.1人體關鍵點檢測任務的基本介紹

8.1.1人體關鍵點檢測的發展

8.1.2人體關鍵點檢測的評價指標

8.2人體關鍵點檢測的經典方法

8.2.1模板匹配

8.2.2貝葉斯估計

8.3多尺度人體姿態檢測方法

8.3.1Hourglass模型架構

8.3.2一階Hourglass模塊

8.3.3多階Hourglass網絡

8.4高分辨率人體姿態估計方法

8.4.1HRNet模型

8.4.2HigherHRNet 模型

8.5人體姿態識別OpenPose

8.5.1卷積姿態機CPM

8.5.2OpenPose架構

8.6飛槳實現人體關鍵點檢測案例

8.6.1環境準備

8.6.2數據集準備

8.6.3模塊導入

8.6.4數據集定義

8.6.5模型構建

8.6.6損失函數定義

8.6.7模型訓練

8.6.8模型預測

8.7本章小結

參考文獻

第9章圖像生成算法原理與實戰

9.1圖像生成任務的基本介紹

9.1.1圖像生成應用與發展

9.1.2圖像生成的評價指標

9.2基於圖像生成的圖像轉換： Pix2Pix

9.3基於圖像生成的風格遷移： CycleGAN

9.3.1CycleGAN的網絡結構

9.3.2CycleGAN的循環訓練流程

9.4基於圖像生成算法的圖像屬性控制： StyleGAN

9.4.1StyleGANv1的網絡結構與訓練技巧

9.4.2StyleGANv1對隱空間耦合度的量化

9.4.3StyleGANv2的改進

9.5飛槳實現圖像生成案例

9.5.1環境準備

9.5.2數據讀取與預處理

9.5.3模型構建

9.5.4模型訓練

9.5.5模型驗證與評估

9.5.6模型測試

9.6本章小結

參考文獻

第10章視頻分類原理與實戰

10.1視頻分類任務的基本介紹

10.1.1視頻分類的應用與發展

10.1.2視頻分類任務的評價指標

10.2基於時序劃分的雙流網絡

10.2.1TSN模型

10.2.2SlowFast模型

10.3基於時序移位的類3D網絡： TSM

10.3.1類3D思想

10.3.2網絡設計

10.4基於自注意力機制的網絡

10.4.1Nonlocal模型

10.4.2TimeSformer模型

10.5飛槳實現視頻分類案例

10.5.1環境準備

10.5.2數據讀取與預處理

10.5.3模型構建

10.5.4模型訓練

10.5.5模型驗證與評估

10.5.6模型測試

10.6本章小結

參考文獻

第11章圖像文本檢測和識別原理與實戰

11.1圖像文本檢測和識別任務的基本介紹

11.1.1OCR任務的應用與發展

11.1.2OCR任務的評價指標

11.2文本檢測算法

11.2.1小尺度文本檢測算法： CTPN

11.2.2場景文本檢測算法： EAST

11.2.3任意形狀文本檢測器： SAST

11.2.4二值化檢測模型： DBNet

11.3文本識別算法

11.3.1基於卷積循環神經網絡的識別模型： CRNN

11.3.2基於空間注意力殘差網絡的識別模型： STARNet

11.3.3具有自動校正功能的魯棒識別模型： RARE

11.3.4基於語義推理網絡的識別模型： SRN

11.4端到端ORC方法

11.4.1FOTS模型

11.4.2PGNet模型

11.5飛槳實現OCR案例

11.5.1環境準備

11.5.2數據讀取與預處理

11.5.3模型構建

11.5.4CTC Loss

11.5.5訓練配置

11.5.6模型訓練

11.5.7驗證前準備

11.5.8開始驗證

11.6本章小結

參考文獻

第12章圖像識別原理與實戰

12.1圖像識別繫統任務流程基本概述

12.1.1圖像識別任務基本介紹

12.1.2百度飛槳圖像識別繫統簡介

12.2目標檢測模塊

12.3特征學習模塊

12.3.1度量學習算法原理及主要內容

12.3.2深度度量學習常見算法框架

12.3.3百度飛槳中深度度量學習應用

12.4特征檢索繫統

12.4.1特征檢索繫統介紹

12.4.2特征檢索原理介紹

12.5飛槳實現圖像識別應用案例

12.5.1環境配置

12.5.2已知類別的圖像識別

12.5.3商品識別與檢索

12.5.4基於新的索引庫的圖像識別

12.6本章小結

參考文獻

前言

2022年我們經歷了新型冠狀病毒感染的反復無常、國際形勢的瞬息萬變，也感受了鼕季奧運會的中國式浪漫，希望一切都朝著好的方向發展，一起向未來。回首整個書稿撰寫歷程，有對章節內容安排的困惑、對案例選擇的迷茫；也有團隊協作的喜悅、內容逐步明晰的踏實。

計算機視覺(Computer Vision，CV)主要研究如何用機器來代替人類的眼睛和大腦實現對真實世界的“觀察”和“理解”。在深度學習網絡模型不斷發展的同時，互聯網上的圖像數據規模有了爆發性的增長，圖形(Graphic Processing Unit，GPU)性能也飛速提升，三者合力為人類帶來了一場席卷全球的計算機視覺深度學習熱潮。在學術界，人臉識別、目標檢測等相關任務的算法得到了很好的理論優化；在產業界，由深度學習驅動的計算機視覺已經廣泛應用於智慧城市建設、醫療健康、電商與實體零售、無人駕駛等各類場景，逐步成為計算機視覺行業的支撐力量。

本書將計算機視覺及深度學習的理論基礎與代碼實踐相結合，可以作為計算機視覺相關任務實踐教程，也可以作為科研工作者的參考圖書。本書內容涵蓋各類計算機視覺任務的深度學習模型、案例實踐基本流程和步驟。通過本書，讀者可以掌握計算機視覺處理的基本概念、評價指標，熟悉視覺處理任務的具體實現過程。

全書共分為12章，分為理論篇與實戰篇兩部分。

部分為理論篇(第1～4章)，首先梳理了計算機視覺技術的發展歷程、主要任務、行業應用繫統和常用處理工具；其次詳細介紹了目前比較流行的深度學習開發框架，重點介紹了飛槳(PaddlePaddle)開發平臺的構成與入門基礎；然後介紹了深度學習中需要掌握的基礎知識與網絡模型架構；後通過簡單的模型搭建案例，讓讀者能夠輕松地入門飛槳平臺。

第二部分為實戰篇(第5～12章)，每章分別對應計算機視覺領域中不同的經典任務，並且結合各個視覺任務的任務要求與技術發展，對其中經典的深度學習算法模型進行介紹。然後，詳解了在飛槳開發框架下各算法模型的實現過程，讓讀者能夠快速地從基礎入門到熟練掌握。各章節的內容都采用理論與實踐相結合的方式，在模型介紹的基礎上，結合具體案例提供了相應的實現代碼，在百度飛槳AI Studio上進行部署和運行，鏈接詳見配套課件。讀者在閱讀本書的同時，可以進行代碼實戰，加深對計算機視覺任務的深度學習理論及模型的理解。

在國家“新一代人工智能發展規劃”的重大戰略指導下，計算機視覺技術迎來了前所未有的機遇與發展。本書編寫的初衷是推動計算機視覺技術的教育，以及為深度學習平臺自主性、國產化貢獻一份力量。

本書由來自北京航空航天大學和百度公司的幾位多年從事計算機視覺科研和教學的工作者共同編寫完成，書中的內容和結構安排經過了我們團隊多輪討論和審定，實戰案例及相關代碼來源於百度飛槳社區和作者相關的科研實踐。

參與本書編寫的有張磊、李宏、王瑜、王麒雄、李森、姜鴻翔、魏曉東、胡宇韜、吳承曦、於陽、洪友勰、張可昕、於子淇、武東錕、楚天肜、肖雄。

本書在編寫過程中，參考了國內外大量圖書和論文，在此對本書所引用論文和圖書的作者深表感謝。同時，感謝飛槳社區的luplup、月影知星辰、nanting03、自尊心3、ZMpursue、PaddleVideo、GTZhang以及Gitee平臺的dongshuilong，感謝你們為飛槳框架下的代碼做出的貢獻；感謝飛槳團隊程軍、呂健、吳蕾對書中實戰案例與相關代碼的審核和編寫建議；感謝百度公司馬婧對本書撰寫過程中所有事務的處理。

後，感謝北京航空航天大學宇航學院的劉博老師、深圳市塞外科技有限公司的黃明先生，感謝你們百忙中對本書撰寫的指導和建議，雖然書稿還存在不足之處，但你們讓它變得更好！

作者2022年9月

商品搜索

商品分类

【醫學】

【各大出版社】