[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

  •  文化

  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

     保健/养生
     体育/运动
     手工/DIY
     休闲/爱好
     英文原版书
     港台图书
     研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学
  • 群智化數據標注技術與實踐
    該商品所屬分類:研究生 -> 工學
    【市場價】
    872-1264
    【優惠價】
    545-790
    【作者】 孫海龍 
    【所屬類別】 圖書  教材  研究生/本科/專科教材  工學 
    【出版社】北京航空航天大學出版社 
    【ISBN】9787512438651
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787512438651
    作者:孫海龍

    出版社:北京航空航天大學出版社
    出版時間:2022年09月 

        
        
    "
    編輯推薦


    本書由百度官方出品


    工業和信息化部“十四五”規劃教材

     
    內容簡介

      本書屬於工業和信息化部“十四五”規劃教材。全書以數據標注對人工智能技術與應用的重要意義為出發點,梳理了數據標注從小規模、自給自足模式向大規模、職業化標注模式的發展脈絡,深入介紹了當前以眾包和數據標注工廠為代表的標注模式所呈現的“群智化”關鍵特征,並結合不同類型的數據以及典型應用場景,繫統介紹了數據標注的基本概念、關鍵技術、支撐工具和繫統平臺,以及標注過程的組織和管理方法等。第1~4章詳細介紹數據標注的基礎概念、技術及繫統等;第5~8章分別介紹文本、音頻、圖像和視頻四類數據的標注技術;第9、第10兩章以自動駕駛數據標注、人臉與人體數據標注的真實場景為出發點,從實操的角度分別闡述自動駕駛場景、人臉與人體數據標注實踐過程;第11章展望數據標注技術的未來發展。


    本書以培養人工智能應用所急需的數據標注人纔為目標,可供高職、大專院校人工智能和大數據等相關專業師生使用,也可供從事數據標注職業的技術人員以及人工智能技術實踐者參考閱讀。

    作者簡介

    孫海龍 教授,博士生導師。擔任軟件開發環境國家重點實驗室副主任,中國計算機學會協同計算專委副秘書長。入選國家“萬人計劃”青年撥尖人纔、新世紀優秀人纔和北京市科技新星等人纔計劃。主講《操作繫統》課程。主要研究方向:群體智能、智能軟件工程、開源軟件和分布式繫統等。

    目錄
    第1章 人工智能與數據標注
    1.1 人工智能基礎
    1.1.1 人工智能概述
    1.1.2 人工智能發展簡史
    1.1.3 人工智能主要研究內容與熱點
    1.1.4 人工智能的應用場景
    1.1.5 人工智能的發展前景
    1.2 數據——人工智能的重要基石
    1.2.1 數據是人工智能行業的“石油”
    1.2.2 數據的定義與來源
    1.2.3 標注數據是機器學習的重要基礎工作
    1.3 數據標注的概念與現狀
    1.3.1 數據標注的概念
    1.3.2 數據標注應用與發展現狀

    第1章 人工智能與數據標注


    1.1 人工智能基礎  


    1.1.1 人工智能概述  


    1.1.2 人工智能發展簡史


    1.1.3 人工智能主要研究內容與熱點  


    1.1.4 人工智能的應用場景 


    1.1.5 人工智能的發展前景


    1.2 數據——人工智能的重要基石


    1.2.1 數據是人工智能行業的“石油”


    1.2.2 數據的定義與來源


    1.2.3 標注數據是機器學習的重要基礎工作


    1.3 數據標注的概念與現狀


    1.3.1 數據標注的概念


    1.3.2 數據標注應用與發展現狀


    1.4 數據標注的主要發展脈絡


    1.4.1 小規模專家標注


    1.4.2 群智化標注


    1.5 本章小結


    1.6 作業與練習


    第2章 群智化數據標注技術與繫統


    2.1 數據標注的基本方法


    2.1.1 人工標注


    2.1.2 自動化標注


    2.1.3 人機協同標注


    2.2 常見數據標注任務及工具


    2.2.1 文本數據標注


    2.2.2 音頻數據標注


    2.2.3 圖像數據標注


    2.2.4 視頻數據標注


    2.2.5 面向特定場景的綜合數據標注


    群智化數據標注技術與實踐


    2.3 群智化數據標注技術


    2.3.1 群智化數據標注的產生背景


    2.3.2 群智化數據標注面臨的挑戰與應對方法


    2.4 群智化數據標注平臺


    2.4.1 群智化數據標注平臺產生背景


    2.4.2 群智化數據標注平臺現狀


    2.4.3 群智化數據標注平臺的主要功能


    2.4.4 群智化數據標注平臺架構概述


    2.5 群智化數據標注平臺實例


    2.5.1 眾包平臺——亞馬遜 MTurk


    2.5.2 支持數據標注工廠模式的平臺——百度眾測


    2.6 本章小結


    2.7 作業與練習


    第3章 群智化數據標注項目的管理方法


    3.1 背景簡介


    3.2 數據標注項目的實施流程


    3.2.1 數據采集


    3.2.2 數據清洗


    3.2.3 數據標注


    3.2.4 數據質檢


    3.2.5 數據交付


    3.2.6 數據驗收


    3.3 數據標注項目管理


    3.3.1 人員管理


    3.3.2 項目評估


    3.3.3 過程管理


    3.3.4 進度管理


    3.4 數據標注質量管理


    3.4.1 數據標注質量控制的意義


    3.4.2 數據標注質量控制的概念、流程和方法


    3.4.3 數據標注質量評價指標


    3.5 數據標注的標準化


    3.5.1 數據標注標準化背景


    3.5.2 數據標注標準化進展


    3.6 本章小結


    3.7 作業與練習 目 錄


    第4章 基於平臺的群智化數據標注實踐  


    4.1 面向客戶的數據標注實踐


    4.1.1 數據標注項目需求分析


    4.1.2 任務設計與發布


    4.1.3 數據驗收


    4.2 面向數據標注員的實踐環節


    4.2.1 身份認證


    4.2.2 數據標注員培訓


    4.2.3 標注項目參與


    4.2.4 標注結果驗收


    4.3 基於亞馬遜 MTurk的眾包標注實踐


    4.3.1 任務發布及驗收示例  


    4.3.2 基於 MTurk平臺的數據標注示例  


    4.4 基於百度眾測平臺的數據標注工廠模式實踐  


    4.4.1 基於百度眾測平臺的任務發布實例


    4.4.2 基於百度眾測平臺的項目驗收實例  


    4.4.3 基於百度眾測平臺的標注員實踐示例  


    4.5 本章小結  


    4.6 作業與練習


    第5章 文本數據標注


    5.1 文本數據標注簡介  


    5.1.1 文本數據  


    5.1.2 文本數據標注及其發展


    5.1.3 文本數據標注應用場景


    5.2 文本數據標注技術和方法


    5.2.1 序列標注  


    5.2.2 關繫標注


    5.2.3 屬性標注  


    5.2.4 生成性標注  


    5.3 文本數據標注工具及典型數據集  


    5.3.1 文本數據標注工具  


    5.3.2 典型文本數據集  


    5.4 文本數據標注實踐案例  


    5.4.1 市長熱線投訴內容關鍵要素抽取———輔助工單填寫  


    5.4.2 相關事件、新聞檢索


    群智化數據標注技術與實踐


    5.5 本章小結


    5.6 作業與練習  


    第6章 音頻數據標注


    6.1 音頻數據標注簡介  


    6.1.1 音頻數據標注的概念


    6.1.2 音頻數據  


    6.1.3 音頻數據標注及其發展


    6.1.4 音頻數據標注應用場景  


    6.2 音頻數據標注技術和方法  


    6.2.1 語音屬性標注  


    6.2.2 語音轉寫  


    6.2.3 語音切分


    6.3 音頻數據標注工具及典型數據集


    6.3.1 音頻數據標注工具  


    6.3.2 典型音頻數據集  


    6.4 語音數據標注實踐案例  


    6.4.1 智能客服語音數據標注  


    6.4.2 智能冰箱語音數據標注  


    6.4.3 面向多輪對話場景的語音數據標注  


    6.5 本章小結  


    6.6 作業與練習  


    第7章 圖像數據標注


    7.1 圖像數據標注簡介


    7.1.1 圖像數據  


    7.1.2 圖像數據標注及其發展  


    7.1.3 圖像數據標注應用場景


    7.2 圖像數據標注技術和方法  


    7.2.1 關鍵點標注  


    7.2.2 標注框標注   


    7.2.3 圖像區域標注  


    7.2.4 屬性標注


    7.3 圖像數據標注工具及典型數據集  


    7.3.1 圖像數據標注工具  


    7.3.2 典型圖像數據集


    7.4 圖像數據標注實踐案例  


    7.4.1 圖像數據標注熱門實例——3D點雲標注


    7.4.2 圖像數據標注綜合案例——OCR光學字符識別


    7.5 本章小結


    7.6 作業與練習  


    第8章 視頻數據標注


    8.1 視頻數據標注簡介


    8.1.1 視頻及視頻數據標注概念  


    8.1.2 視頻數據標注的現狀與發展前景  


    8.1.3 視頻數據標注應用場景  


    8.2 視頻數據標注技術和方法


    8.2.1 視頻屬性標注  


    8.2.2 視頻切割


    8.2.3 視頻連續幀標注


    8.3 視頻數據標注工具及典型數據集  


    8.3.1 視頻數據標注工具  


    8.3.2 典型視頻數據集  


    8.4 視頻數據標注實踐案例  


    8.4.1 人體跟蹤視頻數據標注  


    8.4.2 視頻內容提取  


    8.5 本章總結


    8.6 作業與練習  


    第9章 面向自動駕駛場景的數據標注實踐


    9.1 自動駕駛技術  


    9.1.1 自動駕駛的發展  


    9.1.2 自動駕駛關鍵技術  


    9.1.3 自動駕駛相關數據集


    9.2 自動駕駛的2D數據標注實例  


    9.2.1 2D障礙物標注


    9.2.2 2D紅綠燈標注


    9.2.3 2D車道線標注


    9.2.4 圖像語義分割標注


    9.3 自動駕駛的3D點雲數據標注實例  


    9.3.1 3D純點雲標注


    9.3.2 2D 3D融合標注


    9.3.3 點雲語義分割標注  


    群智化數據標注技術與實踐


    9.4 本章小結  


    9.5 作業與練習  


    第10章 人臉與人體數據標注實踐  


    10.1 人臉識別與人臉數據標注


    10.1.1 人臉識別及應用場景


    10.1.2 人臉數據標注技術


    10.1.3 人臉數據標注操作分類


    10.1.4 人臉數據標注實例


    10.2 人體識別與人體數據標注


    10.2.1 人體識別與手部識別的應用場景


    10.2.2 人體數據標注與手部數據標注


    10.2.3 人體數據標注與手部數據標注實例


    10.3 本章小結


    10.4 作業與練習


    第11章 數據標注未來展望  


    11.1 數據標注需求趨勢


    11.1.1 人工智能技術與應用的發展趨勢


    11.1.2 數據標注需求持續增長


    11.2 數據標注技術發展方向


    11.2.1 智能化數據標注技術


    11.2.2 數據標注安全與隱私


    11.2.3 新型數據標注工具和平臺


    11.3 群智化數據標注的未來發展


    11.3.1 數據標注的大眾化與職業化並行發展趨勢


    11.3.2 數據標注智能化的過程管理


    11.3.3 數據標注過程標準化


    11.4 本章小結 


    11.5 作業與練習


    附錄 數據標注工程師職業等級劃分與技能等級認證要求


    參考文獻

    前言

    推薦序
    大規模高質量的訓練數據是當今數據驅動的人工智能技術與應用創新的重要基礎,而訓練數據的構建離不開人工主導的數據標注。標注數據中蘊含的人類知識和經驗是許多人工智能算法的基礎,因此數據標注可以看作是實現從人類智能向人工智能轉化的橋梁。特別是以深度神經網絡為代表的人工智能技術需要更大規模的訓練數據,使得傳統小規模專標注難以滿足人工智能技術發展的需要。在這種情況下,出現了基於互聯網的眾包標注,其通過平臺將數據標注需求方和標注者連接起來,從而依靠互聯網上未知大量用戶的群體智能實現高效的數據標注。例如,斯坦福大學通過眾包標注構建了ImageNet數據集,推動了計算機視覺和深度學習算法的進步;卡內基梅隆 大學的reCAPTCHA 項目利用眾包技術幫助《紐約時報》實現了過去110年的報紙的 數字化工作。這些基於群體智能的數據標注模式和平臺為我從事群體智能的研究提供了鮮活的案例和啟發。

     


        推薦序


    大規模高質量的訓練數據是當今數據驅動的人工智能技術與應用創新的重要基礎,而訓練數據的構建離不開人工主導的數據標注。標注數據中蘊含的人類知識和經驗是許多人工智能算法的基礎,因此數據標注可以看作是實現從人類智能向人工智能轉化的橋梁。特別是以深度神經網絡為代表的人工智能技術需要更大規模的訓練數據,使得傳統小規模專標注難以滿足人工智能技術發展的需要。在這種情況下,出現了基於互聯網的眾包標注,其通過平臺將數據標注需求方和標注者連接起來,從而依靠互聯網上未知大量用戶的群體智能實現高效的數據標注。例如,斯坦福大學通過眾包標注構建了ImageNet數據集,推動了計算機視覺和深度學習算法的進步;卡內基梅隆 大學的reCAPTCHA 項目利用眾包技術幫助《紐約時報》實現了過去110年的報紙的 數字化工作。這些基於群體智能的數據標注模式和平臺為我從事群體智能的研究提供了鮮活的案例和啟發。


    伴隨人工智能產業的發展,為了滿足日益增長的標注數據需求,我國出現了數據標注員等新的職業崗位,並出現了許多專門從事數據標注業務的企業。這些企業雇傭大量的數據標注員,並引入工程管理方法,通過標注員之間的群智協同完成客戶的標注項目,由此可見,數據標注已逐漸走向群智化、職業化。北京航空航天大學軟件開發環境國家重點實驗室的李未院士領導了群體智能方向的論證和規劃,推動了群體智能列入國家新一代人工智能發展規劃。近年來,我一直擔任軟件開發環境國家重點實驗室學術委員會委員,有更多機會了解實驗室在群體智能方面的工作。作為實驗室的骨干成員,北航的孫海龍教授在群體智能理論和方法方面開展了深入的研究,在群智化數據標注方面提出了一繫列提高數據標注效率和質量的新方法,發表在人工智能領域的重要學術會議 AAAI和IJCAI等。百度公司作為國際知名的互聯網公司,一方面自身有大量的數據標注需求,另一方面研發了百度眾測平臺提供數據標注服務,並開展了大量的數據標注實踐。此次雙方聯合編寫的《群智化數據標注技術與實踐》教材是一個產教研融合的範例。教材梳理了數據標注發展的脈絡,把握住了當前數據標注的“群智化”特征,對數據標注的基本概念、關鍵方法、支撐工具和應用案例等進行了全面介紹。特別是該教材已列入工業和信息化部“十四五”規劃教材。我相信該教材對於培養數據標注人纔,推動我國人工智能技術的發展一定能夠起到重要作用。


    借此教材出版之際,我希望更多行業關注數據標注問題。實際上,許多行業的專業人員每天都在產生大量高質量的標注數據,例如,判讀醫學影像數據的醫務工作者產生著醫學影像標記數據;判讀聲吶信號的聲吶員產生著水聲標記數據等。如何高效、低成本、合規地彙聚和使用這些行業的標注數據,對於人工智能的研究具有重要意義,對於我國數字經濟發展同樣具有重要意義,無論是普通高等教育還是高等職業教育,都需要提高學生的數據意識和能力。今年5月1日《中華人民共和國職業教育法》頒布施行, 該法明確,職業教育是與普通教育具有同等重要地位的教育類型,高等職業教育不再被視為高等教育的一個初級層次,而是與普通高等教育具有同等重要地位的教育類型,兩種教育類型具有很強的互補性。從數據標注實踐中,我們可以看到研究型大學和職業 型大學在人纔培養上的合作空間。北京航空航天大學軟件開發環境國家重點實驗室與百度公司聯合編寫的《群智化數據標注技術與實踐》教材,既是一個產教研融合的範例, 也是研究型大學和職業型大學合作培養人工智能人纔的實踐。


    王懷民


    中國科學院院士


    2022年7月20日


     


    前言


    近年來,以機器學習為代表的人工智能技術快速發展,已成為推動各行業創新發展的新技術引擎,因而得到世界各國政府、學術界和產業界的普遍重視。在各類機器學習方法中,決策樹、樸素貝葉斯、支持向量機、k近鄰、AdaBoost以及神經網絡等有監督學習算法得到廣泛應用,而訓練高質量的有監督機器學習模型往往需要豐富的訓練數據,尤其是對於深度神經網絡等具有大量參數的機器學習模型來說,往往需要更大規模的訓練數據集。


    數據標注是構建訓練數據集的核心技術,其依賴人類標注員使用標注工具完成對待標注數據的標記或者解釋。在數據標注技術的發展過程中,形成了兩種典型的數據標注模式:專家標注和群智化標注。早期訓練機器學習模型僅需要較少的標注數據,數據標注的工作往往由少量的標注專家即可完成。采用專家標注模式的標注質量較高,但是平均標注成本高。群智化標注包括眾包標注和數據工廠標注兩種形式。一方面,隨著復雜機器學習模型的不斷提出,特別是深度神經網絡的快速發展,對標注數據的需求越來越大,互聯網上出現了眾包標注模式。眾包標注的代表性工作是斯坦福大學李飛飛教授團隊利用眾包模式構建的著名的圖像標注數據集ImageNet,其有力地推動了深度學習技術與應用的發展。相對專家標注,眾包標注的成本較低,但是標注人員的不確定性給數據標注的質量提出了新挑戰。另一方面,隨著人工智能的廣泛應用,對標注數據的需求與日俱增,為了滿足日益增長的數據標注需求,逐漸出現以數據標注為核心業務的實體企業或者部門,這些企業或部門從客戶那裡接收待標注數據,並通過設立標注項目、組建標注員團隊、部署標注工具或平臺和管理標注過程等活動開展標注任務,終向客戶提供高質量標注數據,我們將這種標注形式稱為“數據標注工廠”。國內的百度、阿裡、騰訊和等互聯網企業紛紛推出數據標注平臺,支撐基於數據標注工廠模式提供高效優質的數據標注服務。無論是眾包標注,還是數據標注工廠,它們的共同特點是利用大量標注員的“群智”貢獻實現對海量數據的標注。總之,群智化標注模式的出現與發展演進是數據標注從小規模、自給自足方式發展成為大規模、職業化方式的


    重要標志,是為了滿足人工智能對標注數據需求不斷增長的必然結果。


    在此背景之下,培養大量高素質的數據標注員對於推動我國人工智能技術創新與產業發展,縮小我國與國際人工智能先進水平的差距具有重要意義,對數據標注員的職業化教育和培訓成為我國教育領域的一項緊迫任務,相關的教材建設尤為重要。在數據標注領域,目前市面上有限的幾種教材在對數據標注發展過程的繫統化梳理,以及對當前以“群智化”為主要特征的數據標注過程管理、標注技術和應用實踐中的新問題和新特性的把握等方面尚需改進。北京航空航天大學軟件開發環境國家重點實驗室的李未院士等科學家率先開拓了“群體智能(Crowd Intelligence)”研究方向,並推動群體智群智化數據標注技術與實踐能列入國家新一代人工智能發展規劃,北京航空航天大學成為開展“群體智能”方向研究的先行者和優勢單位,在相關理論和技術方面積累了豐富成果。百度公司是大數據和人工智能領域中科研和實踐的先鋒企業,在國內很早就研發了“百度眾測”平臺,在山西省等地率先建立了人工智能基礎數據產業基地,有力推動了群智化數據標注技術的研發與應用。為此,雙方聯合成立了教材編寫團隊,旨在充分發揮雙方在學術研究和產業應用實踐方面的優勢與積累,編寫一本高質量的反映數據標注技術特點的教材,希望能夠為我國人工智能方面的人纔培養和技術創新做出貢獻。本書重點介紹群智化數據標注的基礎知識、關鍵技術、繫統工具和應用實踐等內容。從數據標注對人工智能技術與應用的重要意義出發,梳理了數據標注從小規模、自給自足模式向大規模、職業化標注模式的發展脈絡,深刻把握當前以眾包和數據標注工廠為代表的標注模式所呈現的“群智化”關鍵特征,結合不同類型的數據以及典型應用場景對數據標注的基本概念、關鍵技術、支撐工具和繫統平臺、組織和管理方法等進行繫統性介紹。其中,第1~第4章對群智化數據標注的基礎概念、技術及繫統等進行詳細介紹;第5~第8章則分別對文本、音頻、圖像和視頻四類數據的標注進行介紹;第9、第10兩章則從自動駕駛數據標注、人臉與人體數據標注的真實場景出發,從實操的角度進行闡述;第11章對數據標注的未來發展進行展望。本書以培養人工智能應用所急需的數據標注人纔為目標,適合作為高職、大專院校人工智能和大數據等相關專業的教材,也適合從事數據標注職業的技術人員以及人工智能技術實踐者閱讀。


    本書由北京航空航天大學的師生和百度在線網絡技術(北京)有限公司的技術人員聯合編寫。在編寫過程中,北京航空航天大學的博士生王子哲和柴磊重點參與了第1~第4章和第11章的編寫工作,以及全書內容的整體規劃、反復校對和多輪迭代修改工作;碩士生顧睿肜以及郝延樸、石澤宏、劉源森、闫思橋、戴芳菲、姜昊等本科生同學參與了第5~第10章內容的編寫與校對等工作;百度公司的蔣曉琳、李昱霖、李明、陸汀、譚小紅、蔣志堅、洪至遠、王光浩、項光特、張亞萍、朱於磊、劉皓、侍紀偉、楊佳瑩、馬利艷、王瑞霞、孫源婕和劉悅旻等為標注平臺及實踐案例方面的內容編寫、全書編寫工作的組織、內容審核與校對等方面給予了重要支持;北京航空航天大學的陳志珺、孫成斌、齊斌航、瀋逸君、王仲池、隋睿、許淳逸、李兆天、王乾偉和亓魯等研究生多次參與書稿的校對工作。


    中國科學院院士王懷民特別為本書作序,王院士是我國開展群體智能研究的著名專家,我們對王院士的支持致以誠摯的感謝! 工業和信息化部批準了本書的“‘十四五’規劃教材”立項申請,特別感謝工業和信息化部以及評審專家對本書的認可和支持!本書中闡述的群智化標注的一些思想和方法是編者在長期開展研究工作的過程中形成的,這些工作得到了國家自然科學基金項目(61932007,61972013和62141209)和國家重點研發計劃(2019YFB1705902和2016YFB1000804)的支持,感謝科技部和國家自然科學基金委員會! 此外,在本書編寫過程中,參考、引用了許多學術界和工業界數據標注方面的理論方法、關鍵技術、繫統工具和應用實踐等成果和應用案例,在此,對相關的學者、技術人員和工程師等表示衷心感謝!


    盡管我們已盡努力保證本書的編寫質量,但由於水平所限,書中難免存在錯誤與不當之處,望廣大讀者批評指正,我們會持續改進本書的內容,歡迎讀者通過電子郵件ehailong@hotmail.com 提供寶貴意見和建議。


    編 者


    2022年7月於北京



     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部