●第1章人工智能與數據標注
1.1人工智能基礎
1.1.1人工智能概述
1.1.2人工智能發展簡史
1.1.3人工智能主要研究內容與熱點
1.1.4人工智能的應用場景
1.1.5人工智能的發展前景
1.2數據——人工智能的重要基石
1.2.1數據是人工智能行業的“石油”
1.2.2數據的定義與來源
1.2.3標注數據是機器學習的重要基礎工作
1.3數據標注的概念與現狀
1.3.1數據標注的概念
1.3.2數據標注應用與發展現狀
1.4數據標注的主要發展脈絡
1.4.1小規模專家標注
1.4.2群智化標注
1.5本章小結
1.6作業與練習
第2章群智化數據標注技術與繫統
2.1數據標注的基本方法
2.1.1人工標注
2.1.2自動化標注
2.1.3人機協同標注
2.2常見數據標注任務及工具
2.2.1文本數據標注
2.2.2音頻數據標注
2.2.3圖像數據標注
2.2.4視頻數據標注
2.2.5面向特定場景的綜合數據標灃
2.3群智化數據標注技術
2.3.1群智化數據標注的產生背景
2.3.2群智化數據標注面臨的挑戰與應對方法
2.4群智化數據標注平臺
2.4.1群智化數據標注平臺產生背景
2.4.2群智化數據標注平臺現狀
2.4.3群智化數據標注平臺的主要功能
2.4.4群智化數據標注平臺架構概述
2.5群智化數據標注平臺實例
2.5.1眾包平臺——亞馬遜MTurk
2.5.2支持數據標注工廠模式的平臺——百度眾測
2.6本章小結
2.7作業與練習
第3章群智化數據標注項目的管理方法
3.1背景簡介
3.2數據標注項目的實施流程
3.2.1數據采集
3.2.2數據清洗
3.2.3數據標注
3.2.4數據質檢
3.2.5數據交付
3.2.6數據驗收
3.3數據標注項目管理
3.3.1人員管理
3.3.2項目評估
3.3.3過程管理
3.3.4進度管理
3.4數據標注質量管理
3.4.1數據標注質量控制的意義
3.4.2數據標注質量控制的概念、流程和方法
3.4.3數據標注質量評價指標
3.5數據標注的標準化
3.5.1數據標注標準化背景
3.5.2數據標注標準化進展
3.6本章小結
3.7作業與練習
第4章基於平臺的群智化數據標注實踐
4.1面向客戶的數據標注實踐
4.1.1數據標注項目需求分析
4.1.2任務設計與發布
4.1.3數據驗收
4.2面向數據標注員的實踐環節
4.2.1身份認證
4.2.2數據標注員培訓
4.2.3標注項目參與
4.2.4標注結果驗收
4.3基於亞馬遜MTurk的眾包標注實踐
4.3.1任務發布及驗收示例
4.3.2基於MTurk平臺的數據標注示例
4.4基於百度眾測平臺的數據標注]二廠模式實踐
4.4.1基於百度眾測平臺的任務發布實例
4.4.2基於百度眾測平臺的項目驗收實例
4.4.3基於百度眾測平臺的標注員實踐示例
4.5本章小結
4.6作業與練習
第5章文本數據標注
5.1文本數據標注簡介
5.1.1文本數據
5.1.2文本數據標注及其發展
5.1.3文本數據標注應用場景
5.2文本數據標注技術和方法
5.2.1序列標注
5.2.2關繫標注
5.2.3屬性標注
5.2.4生成性標注
5.3文本數據標注工具及典型數據集
5.3.1文本數據標注工具
5.3.2典型文本數據集
5.4文本數據標注實踐案例
5.4.1市長熱線投訴內容關鍵要素抽取——輔助工單填寫
5.4.2相關事件、新聞檢索
……
本書屬於工業和信息化部“十四五”規劃教材。全書以數據標注對人工智能技術與應用的重要意義為出發點,梳理了數據標注從小規模、自給自足模式向大規模、職業化標注模式的發展脈絡,深入介紹了當前以眾包和數據標注工廠為代表的標注模式所呈現的“群智化”關鍵特征,並結合不同類型的數據以及典型應用場景,繫統介紹了數據標注的基本概念、關鍵技術、支撐工具和繫統平臺,以及標注過程的組織和管理方法等。第1~4章詳細介紹數據標注的基礎概念、技術及繫統等;第5~8章分別介紹文本、音頻、圖像和視頻四類數據的標注技術;第9、第10兩章以自動駕駛數據標注、人臉與人體數據標注的真實場景為出發點,從實操的角度分別闡述自動駕駛場景、人臉與人體數據標注實踐過程;第11章展望數據標注技術的未來發展。 本書以培養人工智能應用所急需的數據標注人纔為目標,可供高職、大專院校人工智能和大數據等相關專業師生使用,也可供從事數據標注職業的技術人員以等