●前言
第1章 Java深度學習簡介 1
1.1 技術要求 1
1.2 初識深度學習 2
1.2.1 反向傳播 2
1.2.2 多層感知器 3
1.2.3 卷積神經網絡 3
1.2.4 遞歸神經網絡 3
1.2.5 為什麼DL4J對深度學習很重要? 4
1.3 確定正確的網絡類型來解決深度學習問題 4
1.3.1 實現過程 4
1.3.2 工作原理 4
1.3.3 相關內容 7
1.4 確定正確的激活函數 9
1.4.1 實現過程 9
1.4.2 工作原理 9
1.4.3 相關內容 10
1.5 解決過度擬合問題 10
1.5.1 實現過程 11
1.5.2 工作原理 11
1.5.3 相關內容 11
1.6 確定正確的批次大小和學習速率 12
1.6.1 實現過程 12
1.6.2 工作原理 12
1.6.3 相關內容 13
1.7 為DL4J配置 Maven 14
1.7.1 準備工作 14
1.7.2 實現過程 14
1.7.3 工作原理 15
1.8 為DL4J配置GPU加速環境 16
1.8.1 準備工作 16
1.8.2 實現過程 16
1.8.3 工作原理 17
1.8.4 相關內容 18
1.9 安裝問題疑難解答 18
1.9.1 準備工作 19
1.9.2 實現過程 19
1.9.3 工作原理 19
1.9.4 相關內容 20
第2章 數據提取、轉換和加載 23
2.1 技術要求 23
2.2 讀取並迭代數據 24
2.2.1 準備工作 24
2.2.2 實現過程 24
2.2.3 工作原理 28
2.2.4 相關內容 32
2.3 執行模式轉換 33
2.3.1 實現過程 33
2.3.2 工作原理 34
2.3.3 相關內容 34
2.4 構建轉換過程 35
2.4.1 實現過程 35
2.4.2 工作原理 36
2.4.3 相關內容 36
2.5 序列化轉換 37
2.5.1 實現過程 38
2.5.2 工作原理 38
2.6 執行轉換過程 39
2.6.1 實現過程 39
2.6.2 工作原理 39
2.6.3 相關內容 40
2.7 規範化數據以提高網絡效率 40
2.7.1 實現過程 40
2.7.2 工作原理 41
2.7.3 相關內容 42
第3分類的深層神經網絡構建 43
3.1 技術要求 43
3.2 從CSV輸入中提取數據 44
3.2.1 實現過程 44
3.2.2 工作原理 44
3.3 從數據中刪除異常 45
3.3.1 實現過程 45
3.3.2 工作原理 46
3.3.3 相關內容 48
3.4 將轉換應用於數據 49
3.4.1 實現過程 49
3.4.2 工作原理 50
3.5 為神經網絡模型設計輸入層 52
3.5.1 準備工作 52
3.5.2 實現過程 53
3.5.3 工作原理 53
3.6 為神經網絡模型設計隱藏層 54
3.6.1 實現過程 54
3.6.2 工作原理 54
3.7 為神經網絡模型設計輸出層 54
3.7.1 實現過程 54
3.7.2 工作原理 55
3.8 訓練和評估CSV數據的神經網絡模型 55
3.8.1 實現過程 55
3.8.2 工作原理 57
3.8.3 相關內容 62
3.9 部署神經網絡模型並將其用作API 63
3.9.1 準備工作 63
3.9.2 實現過程 64
3.9.3 工作原理 68
第4章 建立卷積神經網絡 70
4.1 技術要求 70
4.2 從磁盤提取圖像 71
4.2.1 實現過程 71
4.2.2 工作原理 72
4.3 為訓練數據創建圖像變體 73
4.3.1 實現過程 73
4.3.2 工作原理 73
4.3.3 相關內容 75
4.4 圖像預處理和輸入層設計 75
4.4.1 實現過程 75
4.4.2 工作原理 76
4.5 為CNN構造隱藏層 77
4.5.1 實現過程 77
4.5.2 工作原理 78
4.6 構建輸出層以進行輸出分類 78
4.6.1 實現過程 78
4.6.2 工作原理 78
4.7 訓練圖像並評估CNN輸出 79
4.7.1 實現過程 79
4.7.2 工作原理 81
4.7.3 相關內容 81
4.8 為圖像分類器創建API端點 82
4.8.1 實現過程 82
4.8.2 工作原理 87
第5章 實現自然語言處理 88
5.1 技術要求 89
5.2 數據要求 89
5.3 讀取和加載文本數據 90
5.3.1 準備工作 90
5.3.2 實現過程 90
5.3.3 工作原理 92
5.3.4 相關內容 92
5.3.5 參考資料 92
5.4 分析詞數據並訓練模型 93
5.4.1 實現過程 93
5.4.2 工作原理 93
5.4.3 相關內容 94
5.5 評估模型 95
5.5.1 實現過程 95
5.5.2 工作原理 95
5.5.3 相關內容 96
5.6 從模型中生成圖譜 96
5.6.1 準備工作 96
5.6.2 實現過程 96
5.6.3 工作原理 97
5.7 保存和重新加載模型 98
5.7.1 實現過程 99
5.7.2 工作原理 99
5.8 導入GoogleNews向量 99
5.8.1 實現過程 99
5.8.2 工作原理 100
5.8.3 相關內容 100
5.9 Word2Vec模型的故障診斷和調整 101
5.9.1 實現過程 101
5.9.2 工作原理 102
5.9.3 參考資料 103
5.10 使用CNNs使用 Word2Vec進行句子分類 103
5.10.1 準備工作 104
5.10.2 實現過程 105
5.10.3 工作原理 107
5.10.4 相關內容 107
5.11 使用Doc2Vec進行文檔分類 109
5.11.1 實現過程 109
5.11.2 工作原理 111
第6章 構建時間序列的LSTM神經網絡 114
6.1 技術要求 114
6.2 提取和讀取臨床數據 115
6.2.1 實現過程 115
6.2.2 工作原理 116
6.3 加載和轉換數據 117
6.3.1 準備工作 117
6.3.2 實現過程 118
6.3.3 工作原理 118
6.4 構建網絡輸入層 119
6.4.1 實現過程 119
6.4.2 工作原理 120
6.5 構建網絡輸出層 121
6.5.1 實現過程 121
6.5.2 工作原理 121
6.6 訓練時間序列數據 122
6.6.1 實現過程 122
6.6.2 工作原理 123
6.7 評估LSTM網絡的效率 123
6.7.1 實現過程 123
6.7.2 工作原理 124
第7章 構建LSTM神經網絡序列分類 125
7.1 技術要求 125
7.2 提取時間序列數據 127
7.2.1 實現過程 127
7.2.2 工作原理 128
7.3 加載訓練數據 129
7.3.1 實現過程 130
7.3.2 工作原理 131
7.4 規範化訓練數據 132
7.4.1 實現過程 132
7.4.2 工作原理 132
7.5 為網絡構建輸入層 133
7.5.1 實現過程 133
7.5.2 工作原理 134
7.6 為網絡構建輸出層 134
7.6.1 實現過程 134
7.6.2 工作原理 135
7.7 LSTM網絡分類輸出的評估 135
7.7.1 實現過程 135
7.7.2 工作原理 136
第8章 對非監督數據執行異常檢測 139
8.1 技術要求 139
8.2 提取和準備 MNIST數據 140
8.2.1 實現過程 140
8.2.2 工作原理 141
8.3 為輸入構造密集層 142
8.3.1 實現過程 142
8.3.2 工作原理 142
8.4 構造輸出層 143
8.4.1 實現過程 143
8.4.2 工作原理 143
8.5 MNIST圖像訓練 144
8.5.1 實現過程 144
8.5.2 工作原理 144
8.6 根據異常得分評估和排序結果 145
8.6.1 實現過程 145
8.6.2 工作原理 146
8.7 保存結果模型 148
8.7.1 實現過程 148
8.7.2 工作原理 148
8.7.3 相關內容 148
第9章 使用RL4J進行強化學習 149
9.1 技術要求 149
9.2 設置 Malmo環境和各自的依賴項 152
9.2.1 準備工作 152
9.2.2 實現過程 152
9.2.3 工作原理 153
9.3 設置數據要求 153
9.3.1 實現過程 153
9.3.2 工作原理 157
9.3.3 參考資料 158
9.4 配置和訓練DQN智能體 158
9.4.1 準備工作 158
9.4.2 實現過程 158
9.4.3 工作原理 160
9.4.4 相關內容 162
9.5 評估 Malmo智能體 162
9.5.1 準備工作 162
9.5.2 實現過程 163
9.5.3 工作原理 163
第10章 在分布式環境中開發應用程序 165
10.1 技術要求 165
10.2 設置DL4J和所需的依賴項 166
10.2.1 準備工作 166
10.2.2 實現過程 167
10.2.3 工作原理 173
10.3 創建用於訓練的uber-JAR 174
10.3.1 實現過程 174
10.3.2 工作原理 175
10.4 訓練用的CPU/GPU特定配置 176
10.4.1 實現過程 176
10.4.2 工作原理 176
10.4.3 更多內容 177
10.5 Spark的內存設置和垃圾回收 177
10.5.1 實現過程 177
10.5.2 工作原理 178
10.5.3 更多內容 179
10.6 配置編碼閾值 181
10.6.1 實現過程 181
10.6.2 工作原理 181
10.6.3 更多內容 182
10.7 執行分布式測試集評估 182
10.7.1 實現過程 182
10.7.2 工作原理 186
10.8 保存和加載訓練過的神經網絡模型 187
10.8.1 實現過程 187
10.8.2 工作原理 188
10.8.3 更多內容 188
10.9 執行分布式推理 188
10.9.1 實現過程 188
10.9.2 工作原理 189
第11章 遷移學習在網絡模型中的應用 190
11.1 技術要求 190
11.2 修改當前的客戶保留模型 190
11.2.1 實現過程 191
11.2.2 工作原理 192
11.2.3 更多內容 195
11.3 微調學習配置 196
11.3.1 實現過程 196
11.3.2 工作原理 197
11.4 凍結層的實現 197
11.4.1 實現過程 198
11.4.2 工作原理 198
11.5 導入和加載Keras模型和層 198
11.5.1 準備工作 198
11.5.2 實現過程 199
11.5.3 工作原理 199
第12章 基準測試和神經網絡優化 201
12.1 技術要求 201
12.2 DL4J/ND4J特定的配置 203
12.2.1 準備工作 230 '203
12.2.2 實現過程 203
12.2.3 工作原理 204
12.2.4 更多內容 206
12.3 設置堆空間和垃圾回收 207
12.3.1 實現過程 207
12.3.2 工作原理 209
12.3.3 更多內容 210
12.3.4 其他參閱 210
12.4 使用異步ETL 210
12.4.1 實現過程 210
12.4.2 工作原理 211
12.4.3 更多內容 211
12.5 利用仲裁器監測神經網絡行為 212
12.5.1 實現過程 212
12.5.2 工作原理 213
12.6 執行超參數調整 213
12.6.1 實現過程 214
12.6.2 工作原理 217