[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 面向機器學習的自然語言標注
    該商品所屬分類:研究生 -> 工學
    【市場價】
    392-568
    【優惠價】
    245-355
    【作者】 美普斯特若夫斯基(James 
    【所屬類別】 圖書  教材  研究生/本科/專科教材  工學 
    【出版社】機械工業出版社 
    【ISBN】9787111555155
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787111555155
    叢書名:OReilly精品圖書繫列

    作者:[美]普斯特若夫斯基(James
    出版社:機械工業出版社
    出版時間:2017年02月 


        
        
    "
    內容簡介
    自然語言理解是人工智能的一個重要分支,主要研究如何利用計算機來理解和生成自然語言。本書重點介紹了自然語言理解所涉及的各個方面,包括語法分析、語義分析、概念分析、語料庫語言學、詞彙語義驅動、中間語言、WordNet、詞彙樹鄰接文法、鏈接文法、基於語段的機器翻譯方法、內識別與文本過濾、機器翻譯的評測等,既有對基礎知識的介紹,又有對新研究進展的綜述,同時還結合了作者(JamesPustejovsky,生成詞庫理論的創始人)多年的研究成果。本書內容全面、詳略得當,結合實例講解,使讀者更易理解。
    作者簡介
    James Pustejovsky教授是美國布蘭代斯(Brandeis University)大學計算機科學繫和Volen國家綜合繫統中心教授。先後在美國麻省理工學院和馬薩諸塞大學獲得學士學位和博士學位。
    Pustejovsky教授主要從事自然語言的理論和計算研究。研究領域包括:計算語言學、詞彙語義學、知識表征、話語語義學、時間推理和抽取等。已經出版多部專著。
    目錄
    目錄
    前言1
    第1章 基礎知識7
    1.1 語言標注的重要性 7
    1.1.1 語言學描述的層次8
    1.1.2 什麼是自然語言處理9
    1.2 語料庫語言學簡史10
    1.2.1 什麼是語料庫13
    1.2.2 語料庫的早期應用15
    1.2.3 當今的語料庫17
    1.2.4 標注類型18
    1.3 語言數據和機器學習24
    1.3.1 分類25
    1.3.2 聚類25目錄
    前言1
    第1章 基礎知識7
    1.1 語言標注的重要性 7
    1.1.1 語言學描述的層次8
    1.1.2 什麼是自然語言處理9
    1.2 語料庫語言學簡史10
    1.2.1 什麼是語料庫13
    1.2.2 語料庫的早期應用15
    1.2.3 當今的語料庫17
    1.2.4 標注類型18
    1.3 語言數據和機器學習24
    1.3.1 分類25
    1.3.2 聚類25
    1.3.3 結構化模式歸納26
    1.4 標注開發循環26
    1.4.1 現像建模27
    1.4.2 按照規格說明進行標注30
    1.4.3 在語料庫上訓練和測試算法31
    1.4.4 對結果進行評價32
    1.4.5 修改模型和算法33
    總結34
    第2章 確定目標與選擇數據36
    2.1 定義目標36
    2.1.1 目標陳述37
    2.1.2 提煉目標:信息量與正確性38
    2.2 背景研究43
    2.2.1 語言資源44
    2.2.2 機構與會議44
    2.2.3 自然語言處理競賽45
    2.3 整合數據集46
    2.3.1 理想的語料庫:代表性與平衡性47
    2.3.2 從因特網上收集數據47
    2.3.3 從人群中獲取數據48
    2.4 語料庫的規模49
    2.4.1 現有語料庫50
    2.4.2 語料庫內部的分布51
    總結53
    第3章 語料庫分析54
    3.1 語料庫分析中的基本概率知識55
    3.1.1 聯合概率分布56
    3.1.2 貝葉斯定理58
    3.2 計算出現次數58
    3.2.1 齊普夫定律(Zip's Law)61
    3.2.2語法62
    3.3 語言模型63
    總結65
    第4章 建立模型與規格說明66
    4.1 模型和規格說明示例66
    4.1.1 電影題材分類69
    4.1.2 添加命名實體70
    4.1.3 語義角色71
    4.2 采用(或不采用)現有模型73
    4.2.1 創建模型和規格說明:一般性與特殊性74
    4.2.2 使用現有模型和規格說明76
    4.2.3 使用沒有規格說明的模型78
    4.3 各種標準78
    4.3.1 ISO標準78
    4.3.2 社區驅動型標準81
    4.3.3 影響標注的其他標準81
    總結82
    第5章 選擇並應用標注標準84
    5數據標注:文檔分類85
    5.1.1 單標簽標注:電影評論85
    5.1.2 多標簽標注:電影題材87
    5.2 文本範圍標注:命名實體90
    5.2.1 內嵌式標注90
    5.2.2 基於詞例的分離式標注92
    5.2.3 基於字符位置的分離式標注95
    5.3 鏈接範圍標注:語義角色96
    5.4 ISO標準和你97
    總結97
    第6章 標注與審核99
    6.1 標注項目的基本結構99
    6.2 標注規格說明與標注指南101
    6.3 準備修改102
    6.4 準備用於標注的數據103
    6.4數據103
    6.4.2 數據預處理104
    6.4.3 為標注工作分割文件104
    6.5 撰寫標注指南105
    6.5.1 例1:單標簽標注——電影評論106
    6.5.2 例2:多標簽標注——電影題材108
    6.5.3 例3:範圍標注——命名實體111
    6.5.4 例4:鏈接範圍標注——語義角色112
    6.6 標注人員114
    6.7 選擇標注環境116
    6.8 評價標注結果117
    6.8.1 Cohen的Kappa(κ)算法118
    6.8.2 Fleiss的Kappa(κ)算法119
    6.8.3 解釋Kappa繫數122
    6.8.4 在其他上下文中計算κ值123
    6.9 創建黃金標準(審核)125
    總結126
    第7章 訓練:機器學習129
    7.1 何謂學習130
    7.2 定義學習任務132
    7.3 分類算法133
    7.3.1 決策樹學習135
    7.3.2 樸素貝葉斯學習140
    7.3.3 熵分類器145
    7.3.4 其他需要了解的分類器147
    7.4 序列歸納算法148
    7.5 聚類和無監督學習150
    7.6 半監督學習150
    7.7 匹配標注與算法153
    總結154
    第8章 測試與評價156
    8.1 測試算法157
    8.2 評價算法157
    8.2.1 混淆矩陣157
    8.2.2 計算評價得分159
    8.2.3 解釋評價得分163
    8.3 可能影響算法評價的問題164
    8.3.1 數據集太小164
    8.3.2 算法過於適合開發數據166
    8.3.3 標注中的信息過多166
    8.4 後測試得分167
    總結167
    第9章 修改與報告169
    9.1 修改項目170
    9.1.1 語料庫分布和內容170
    9.1.2 模型和規格說明170
    9.1.3 標注171
    9.1.4 訓練和測試172
    9.2 報告工作173
    9.2.1 關於語料庫174
    9.2.2 關於模型和規格說明175
    9.2.3 關於標注任務和標注人員175
    9.2.4 關於ML算法176
    9.2.5 關於修改177
    總結177
    第10章 標注:TimeML179
    10.1 TimeML的設計目標180
    10.2 相關研究181
    10.3 建設語料庫182
    10.4 模型:初步的標注規格說明183
    10.4.1 時間183
    10.4.2 信號184
    10.4.3 事件184
    10.4.4 鏈接184
    10.5 標注:初的嘗試185
    10.6 模型:TimeBank中的TimeML標注規格說明185
    10.6.1 時間表達式185
    10.6.2 事件186
    10.6.3 信號187
    10.6.4 鏈接187
    10.6.5 可信度189
    10.7 標注:TimeBank的產生189
    10.8 TimeML成為ISO-TimeML192
    10.9 對未來建模:TimeML的發展方向193
    10.9.1 敘事容器194
    10.9.2 將TimeML擴展到其他領域195
    10.9.3 事件結構196
    總結197
    第11章 自動標注:生成TimeML199
    11.1 TARSQI組件200
    11.1.1 GUTime:時間標志識別201
    11.1.2 EVITA:事件識別及分類201
    11.1.3 GUTenLINK202
    11.1.4 Slinket204
    11.1.5 SputLink204
    11.1.6 TARSQI組件中的機器學習205
    11.2 TTK的改進206
    11.2.1 結構變化206
    11.2.2 時間實體識別改進:BTime207
    11.2.3 時間關繫識別207
    11.2.4 時間關繫驗證208
    11.2.5時間關繫可視化209
    11.3 TimeML競賽:TempEval-2209
    11.3.1 TempEval-2:繫統概述210
    11.3.2 成果綜述213
    11.4 TTK的未來213
    11.4.1 新的輸入格式213
    11.4.2 敘事容器/敘事時間214
    11.4.3 醫學文檔215
    11
    前言
    前言本書的讀者是那些使用計算機來處理自然語言的人。自然語言是指人類所說的任何一種語言,可以是當代語言(如英語、漢語、西班牙語),也可以指過去曾經使用過的語言(如拉丁語、古希臘語、梵語)。標注(annotation)是一個過程,它通過向文本數據來增強計算機執行自然語言處理(Natural Language Processing, NLP)的能力。特別地,我們考察如何通過標注將信息加入自然語言文本中以便改善機器學習(Machine Learning,ML)算法(一組設計好的計算機程序,它從文本提供的信息中推出規則,目的是將這些規則用於將來未標注的文本中)的性能。
    面向機器學習的自然語言標注本書詳細介紹創建自己的自然語言標注數據集(稱為語料庫)所需的各個階段和過程,以便為基於語言的數據和知識發現訓練機器學習算法。本書的總體目標是為讀者展示如何創建自己的語料庫。從選擇一個標注任務開始,然後創建標注規格說明(annotation specification)、設計標注指南(annotation guideline)、創建一個“黃金標準”語料庫(corpus),後采用這個標注過程開始創建實際的數據。前言本書的讀者是那些使用計算機來處理自然語言的人。自然語言是指人類所說的任何一種語言,可以是當代語言(如英語、漢語、西班牙語),也可以指過去曾經使用過的語言(如拉丁語、古希臘語、梵語)。標注(annotation)是一個過程,它通過向文本數據來增強計算機執行自然語言處理(Natural Language Processing, NLP)的能力。特別地,我們考察如何通過標注將信息加入自然語言文本中以便改善機器學習(Machine Learning,ML)算法(一組設計好的計算機程序,它從文本提供的信息中推出規則,目的是將這些規則用於將來未標注的文本中)的性能。
    面向機器學習的自然語言標注本書詳細介紹創建自己的自然語言標注數據集(稱為語料庫)所需的各個階段和過程,以便為基於語言的數據和知識發現訓練機器學習算法。本書的總體目標是為讀者展示如何創建自己的語料庫。從選擇一個標注任務開始,然後創建標注規格說明(annotation specification)、設計標注指南(annotation guideline)、創建一個“黃金標準”語料庫(corpus),後采用這個標注過程開始創建實際的數據。
    標注過程並不是線性的,因此需要多次迭代來定義任務、標注和評價,以便得到結果。這一過程可以概括為MATTER標注開發過程:建模(Model)、標注(Annotate)、訓練(Train)、測試(Test)、評價(Evaluate)、修改(Revise)。本書引導讀者遍歷整個循環,提供詳細的例子並完整地討論幾種不同類型的標注任務。詳細地研究這些任務,使讀者清楚地了解其中的來龍去脈,並為他們自己的機器學習任務奠定基礎。
    此外,本書列出了用於標注文本和評審標注的常用軟件的訪問和使用指南。盡管有許多標注工具可用,但本書采用的多用途標注環境(Multipurpose Annotation Environment, MAE)特別易於安裝和使用(讀者可以免費下載),讀者不會因為令人困惑的文檔而分心。經常與MAE一起使用的是多文檔審核接口(Multidocument Adjudication Interface, MAI),它用於在標注的文檔之間進行比對。
    讀者本書寫給所有對用計算機研究自然語言所傳遞的信息內容感興趣的人。閱讀本書,並不要求具有編程或語言學背景,但若對腳本語言(如Python)有基本的理解將更易於理解MATTER循環,因為書中的一些示例代碼是用Python寫的。如果你從未用過Python,強烈地向你推薦由Steven Bird、Ewan Klein和Edward Loper所著的《Natural Language Processing with Python》(Python自然語言處理)一書(O扲eilly)。該書是一本優秀的關於Python和自然語言處理的入門教材,本書並未涉及這些知識。
    如果讀者已具備XML(或者HTML)等標記語言的基礎知識,將能夠更好地理解和掌握本書。你不需要成為深入了解XML原理的專家,但是由於絕大多數標注項目都使用某種形式的XML對標簽進行編碼,因此我們在本書中將使用XML標準來提供標注樣例。不是一定得成為網頁設計師纔能理解本書,但是具有關於標簽和屬性的知識對於理解標注項目是如何實現的將會有較大的幫助。
    內容安排第1章簡單回顧了語言標注和機器學習的歷史,簡要介紹了將標注任務用於不同層次語言學研究的多種方法。本書的其餘部分帶領讀者遍歷整個MATTER循環,從第2章介紹如何創建一個合理的標注目標開始,歷經每個階段,直到評價標注和機器學習階段的結果,第9章討論修改項目並彙報工作。後兩章完整地介紹了一個標注項目,以及如何用機器學習和基於規則的算法重新創建標注。讀者可以在書後的附錄中找到對自己的標注任務有用的資源列表。
    軟件需求雖然不運行書中給出的任何示例代碼也可以學習本書,但我們強烈推薦至少安裝自然語言工具包(Natural Language ToolKit, NLTK)以便理解涉及的機器學習技術。NLTK當前支持Python 2.4~2.7(Python 3.0直到本書完成時尚未被支持)。想了解更多信息,請參考http://www.nltk.org。
    本書中的所有示例代碼都在交互式Python shell編程環境中運行。關於如何使用這一環境,請參閱http://docs.python.org/tutorial/interpreter.html。如果沒有特別說明,假設在所有的示例代碼前使用命令import nltk。
    本書約定在本書中使用以下排版方式:
    斜體(Italic)此類字體表示新術語、網址(URL)、電子郵件地址,文件名和文件擴展名。
    等寬字體(Constant width)此類字體表示程序清單,以及在文檔段內的各素(如變量名或函數名、數據庫名、數據類型、環境變量、語句和關鍵字)。
    注意:表示一個提示、建議或一般性的注解。
    警告:表示一個警告或注意事項。
    使用代碼示例本書在這裡幫助你完成你的工作。總的來講,你可以在你的程序和文檔中使用本書中的代碼。你不需要聯繫我們以征得許可,除非你正在復制代碼中的重要部分。比如,使用書中的多段代碼寫一個程序並不需要獲得許可。
    若將O扲eilly公司出版的書中的例子制成光盤來銷售或發行則需要獲得許可。在回答問題時,引用本書和列舉書中的例子代碼並不需要許可。把本書中的代碼作為你的產品文檔的重要部分時需要獲得許可。
    我們希望但並不要求你


     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部