[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

  •  文化

  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

     保健/养生
     体育/运动
     手工/DIY
     休闲/爱好
     英文原版书
     港台图书
     研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学
  • Python自然語言處理實戰:核心技術與算法
    該商品所屬分類:計算機/網絡 -> 程序設計
    【市場價】
    761-1104
    【優惠價】
    476-690
    【作者】 塗銘 
    【所屬類別】 圖書  計算機/網絡  程序設計  算法 
    【出版社】機械工業出版社 
    【ISBN】9787111597674
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787111597674
    作者:塗銘

    出版社:機械工業出版社
    出版時間:2018年05月 

        
        
    "

    產品特色

    編輯推薦

    讀者對像:


    1)人工智能相關專業的研究人員;2)信息科學和計算機科學愛好者;3)統計學或相關IT專業學生;4)不具備專業數學知識的人群。


     


    (1)三位作者資歷深厚,分別是阿裡巴巴的數據架構師和NLP專家、百煉智能的NLP專家(前明略數據的技術合伙人和科學家)、七牛雲AI實驗室NLP&OCR方向負責人;


    (2)以實戰為導向,繞開各種復雜數學公式與證明,確保讀者零基礎入門,詳細講解自然語言處理 的各種核心技術、方法論和經典算法;


    (3)阿裡巴巴達摩院高級算法專家、百煉智能CEO、七牛雲AI LAB負責人、天善智能創始人聯袂推薦。

     
    內容簡介
    自然語言處理是一門融語言學、計算機科學、數學於一體的學科,比較復雜,學習門檻高,但本書巧妙地避開了晦澀難懂的數學公式和證明,即便沒有數學基礎,也能零基礎入門。
    本書專注於中文的自然語言處理,以Python及其相關框架為工具,以實戰為導向,詳細講解了自然語言處理的各種核心技術、方法論和經典算法。三位作者在人工智能、大數據和算法領域有豐富的積累和經驗,是*、前明略數據和七牛雲的資深專家。同時,本書也得到了*達摩院高級算法專家、七牛雲AI實驗室Leader等專家的高度評價和鼎力推薦。

    全書一共11章,在邏輯上分為2個部分:
    *部分(第1、2、11章)
    主要介紹了自然語言處理所需要了解的基礎知識、前置技術、Python科學包、正則表達式以及Solr檢索等。
    第二部分(第5-10章)

    自然語言處理是一門融語言學、計算機科學、數學於一體的學科,比較復雜,學習門檻高,但本書巧妙地避開了晦澀難懂的數學公式和證明,即便沒有數學基礎,也能零基礎入門。


    本書專注於中文的自然語言處理,以Python及其相關框架為工具,以實戰為導向,詳細講解了自然語言處理的各種核心技術、方法論和經典算法。三位作者在人工智能、大數據和算法領域有豐富的積累和經驗,是*、前明略數據和七牛雲的資深專家。同時,本書也得到了*達摩院高級算法專家、七牛雲AI實驗室Leader等專家的高度評價和鼎力推薦。


     


    全書一共11章,在邏輯上分為2個部分:


    *部分(第1、2、11章)


    主要介紹了自然語言處理所需要了解的基礎知識、前置技術、Python科學包、正則表達式以及Solr檢索等。


    第二部分(第5-10章)


    第3~5章講解了詞法分析相關的技術,包括中文分詞技術、詞性標注與命名實體識別、關鍵詞提取算法等。


    第6章講解了句法分析技術,該部分目前理論研究較多,工程實踐中使用門檻相對較高,且效果多是依賴結合業務知識進行規則擴展,因此本書未做深入探討。


    第7章講解了常用的向量化方法,這些方法常用於各種NLP任務的輸入。


    第8章講解了情感分析相關的概念、場景以及一般做情感分析的流程,情感分析在很多行業都有應用。


    第9章介紹了機器學習的重要概念,同時重點突出NLP常用的分類算法、聚類算法,還介紹了幾個案例。


    第10章節介紹了NLP中常用的一些深度學習算法,這些方法比較復雜,但是非常實用,需要讀者耐心學習。

    作者簡介
    塗銘:
    阿裡巴巴數據架構師,對大數據、自然語言處理、Python、Java相關技術有深入的研究,積累了豐富的實踐經驗。曾就職於北京明略數據,是大數據方面的高級咨詢顧問。
    在工業領域參與了設備故障診斷項目,在零售行業參與了精準營銷項目。在自然語言處理方面,擔任導購機器人項目的架構師,主導開發機器人的語義理解、短文本相似度匹配、上下文理解,以及通過自然語言檢索產品庫,在項目中構建了NoSQL 文本檢索等大數據架構,也同時負責問答對的整理和商品屬性的提取,帶領NLP團隊構建語義解析層。

    劉祥:
    百煉智能自然語言處理專家,主要研究知識圖譜、NLG等前沿技術,參與機器自動寫作產品的研發與設計。
    曾在明略數據擔當數據技術合伙人兼數據科學家,負責工業、金融等業務領域的數據挖掘工作,在這些領域構建了諸如故障診斷、關聯賬戶分析、新聞推薦、商品推薦等模型。
    酷愛新技術,活躍於開源社區,是Spark MLlib和Zeppelin的Contributor。

    塗銘:


    阿裡巴巴數據架構師,對大數據、自然語言處理、Python、Java相關技術有深入的研究,積累了豐富的實踐經驗。曾就職於北京明略數據,是大數據方面的高級咨詢顧問。


    在工業領域參與了設備故障診斷項目,在零售行業參與了精準營銷項目。在自然語言處理方面,擔任導購機器人項目的架構師,主導開發機器人的語義理解、短文本相似度匹配、上下文理解,以及通過自然語言檢索產品庫,在項目中構建了NoSQL 文本檢索等大數據架構,也同時負責問答對的整理和商品屬性的提取,帶領NLP團隊構建語義解析層。


     


    劉祥:


    百煉智能自然語言處理專家,主要研究知識圖譜、NLG等前沿技術,參與機器自動寫作產品的研發與設計。


    曾在明略數據擔當數據技術合伙人兼數據科學家,負責工業、金融等業務領域的數據挖掘工作,在這些領域構建了諸如故障診斷、關聯賬戶分析、新聞推薦、商品推薦等模型。


    酷愛新技術,活躍於開源社區,是Spark MLlib和Zeppelin的Contributor。


     


    劉樹春:


    七牛雲高級算法專家,七牛AI實驗室NLP&OCR方向負責人,主要負責七牛NLP以及OCR相關項目的研究與落地。在七牛人工智能實驗室期間,參與大量NLP相關項目,例如知識圖譜、問答繫統、文本摘要、語音相關繫統等;同時重點關注NLP與CV的交叉研究領域,主要有視覺問答(VQA),圖像標注(Image Caption)等前沿問題。


    曾在Intel DCSG數據與雲計算部門從事機器學習與雲平臺的融合開發,項目獲得IDF大獎。碩士就讀於華東師範大學機器學習實驗室,在校期間主攻機器學習,機器視覺,圖像處理,並在相關國際會議發表多篇SCI/EI論文。

    目錄
    序一
    序二
    前言
    第1章NLP基礎 1
    1.1什麼是NLP 1
    1.1.1NLP的概念 1
    1.1.2NLP的研究任務 3
    1.2NLP的發展歷程 5
    1.3NLP相關知識的構成 7
    1.3.1基本術語 7
    1.3.2知識結構 9
    1.4語料庫 10
    1.5探討NLP的幾個層面 11
    1.6NLP與人工智能 13

    序一


    序二


    前言


    第1章NLP基礎  1


    1.1什麼是NLP  1


    1.1.1NLP的概念  1


    1.1.2NLP的研究任務  3


    1.2NLP的發展歷程  5


    1.3NLP相關知識的構成  7


    1.3.1基本術語  7


    1.3.2知識結構  9


    1.4語料庫  10


    1.5探討NLP的幾個層面  11


    1.6NLP與人工智能  13


    1.7本章小結  15


    第2章NLP前置技術解析  16


    2.1搭建Python開發環境  16


    2.1.1Python的科學計算發行版——Anaconda  17


    2.1.2Anaconda的下載與安裝  19


    2.2正則表達式在NLP的基本應用  21


    2.2.1匹配字符串  22


    2.2.2使用轉義符  26


    2.2.3抽取文本中的數字  26


    2.3Numpy使用詳解  27


    2.3.1創建數組  28


    2.3.2獲取Numpy中數組的維度  30


    2.3.3獲取本地數據  31


    2.3.4正確讀取數據  32


    2.3.5Numpy數組索引  32


    2.3.6切片  33


    2.3.7數組比較  33


    2.3.8替代值  34


    2.3.9數據類型轉換  36


    2.3.10Numpy的統計計算方法  36


    2.4本章小結  37


    第3章中文分詞技術  38


    3.1中文分詞簡介  38


    3.2規則分詞  39


    3.2.1正向匹配法  39


    3.2.2逆向匹配法  40


    3.2.3雙向匹配法  41


    3.3統計分詞  42


    3.3.1語言模型  43


    3.3.2HMM模型  44


    3.3.3其他統計分詞算法  52


    3.4混合分詞  52


    3.5中文分詞工具——Jieba  53


    3.5.1Jieba的三種分詞模式  54


    3.5.2實戰之高頻詞提取  55


    3.6本章小結  58


    第4章詞性標注與命名實體識別  59


    4.1詞性標注  59


    4.1.1詞性標注簡介  59


    4.1.2詞性標注規範  60


    4.1.3Jieba分詞中的詞性標注  61


    4.2命名實體識別  63


    4.2.1命名實體識別簡介  63


    4.2.2基於條件隨機場的命名實體識別  65


    4.2.3實戰一:日期識別  69


    4.2.4實戰二:地名識別  75


    4.3總結  84


    第5章關鍵詞提取算法  85


    5.1關鍵詞提取技術概述  85


    5.2關鍵詞提取算法TF/IDF算法  86


    5.3TextRank算法  88


    5.4LSA/LSI/LDA算法  91


    5.4.1LSA/LSI算法  93


    5.4.2LDA算法  94


    5.5實戰提取文本關鍵詞  95


    5.6本章小結  105


    第6章句法分析  106


    6.1句法分析概述  106


    6.2句法分析的數據集與評測方法  107


    6.2.1句法分析的數據集  108


    6.2.2句法分析的評測方法  109


    6.3句法分析的常用方法  109


    6.3.1基於PCFG的句法分析  110


    6.3.2基於間隔馬爾可夫網絡的句法分析  112


    6.3.3基於CRF的句法分析  113


    6.3.4基於移進–歸約的句法分析模型  113


    6.4使用Stanford Parser的PCFG算法進行句法分析  115


    6.4.1Stanford Parser  115


    6.4.2基於PCFG的中文句法分析實戰  116


    6.5本章小結  119


    第7章文本向量化  120


    7.1文本向量化概述  120


    7.2向量化算法word2vec  121


    7.2.1神經網絡語言模型  122


    7.2.2C&W模型  124


    7.2.3CBOW模型和Skip-gram模型  125


    7.3向量化算法doc2vec/str2vec  127


    7.4案例:將網頁文本向量化  129


    7.4.1詞向量的訓練  129


    7.4.2段落向量的訓練  133


    7.4.3利用word2vec和doc2vec計算網頁相似度  134


    7.5本章小結  139


    第8章情感分析技術  140


    8.1情感分析的應用  141


    8.2情感分析的基本方法  142


    8.2.1詞法分析  143


    8.2.2機器學習方法  144


    8.2.3混合分析  144


    8.3實戰電影評論情感分析  145


    8.3.1卷積神經網絡  146


    8.3.2循環神經網絡  147


    8.3.3長短時記憶網絡  148


    8.3.4載入數據  150


    8.3.5輔助函數  154


    8.3.6模型設置  155


    8.3.7調參配置  158


    8.3.8訓練過程  159


    8.4本章小結  159


    第9章NLP中用到的機器學習算法  160


    9.1簡介  160


    9.1.1機器學習訓練的要素  161


    9.1.2機器學習的組成部分  162


    9.2幾種常用的機器學習方法  166


    9.2.1文本分類  166


    9.2.2特征提取  168


    9.2.3標注  169


    9.2.4搜索與排序  170


    9.2.5推薦繫統  170


    9.2.6序列學習  172


    9.3分類器方法  173


    9.3.1樸素貝葉斯Naive Bayesian  173


    9.3.2邏輯回歸  174


    9.3.3支持向量機  175


    9.4無監督學習的文本聚類  177


    9.5文本分類實戰:中文垃圾郵件分類  180


    9.5.1實現代碼  180


    9.5.2評價指標  187


    9.6文本聚類實戰:用K-means對豆瓣讀書數據聚類  190


    9.7本章小結  194


    第10章基於深度學習的NLP算法  195


    10.1深度學習概述  195


    10.1.1模型  196


    10.1.2激活函數  197


    10.1.3感知機與多層網絡  198


    10.2神經網絡模型  201


    10.3多輸出層模型  203


    10.4反向傳播算法  204


    10.5化算法  208


    10.5.1梯度下降  208


    10.5.2隨機梯度下降  209


    10.5.3批量梯度下降  210


    10.6丟棄法  211


    10.7激活函數  211


    10.7.1tanh函數  212


    10.7.2ReLU函數  212


    10.8實現BP算法  213


    10.9詞嵌入算法  216


    10.9.1詞向量  217


    10.9.2word2vec簡介  217


    10.9.3詞向量模型  220


    10.9.4CBOW和Skip-gram模型  222


    10.10訓練詞向量實踐  224


    10.11樸素Vanilla-RNN  227


    10.12LSTM網絡  230


    10.12.1LSTM基本結構  230


    10.12.2其他LSTM變種形式  234


    10.13Attention機制  236


    10.13.1文本翻譯  237


    10.13.2圖說模型  237


    10.13.3語音識別  239


    10.13.4文本摘要  239


    10.14Seq2Seq模型  240


    10.15圖說模型  242


    10.16深度學習平臺  244


    10.16.1Tensorflow  245


    10.16.2Mxnet  246


    10.16.3PyTorch  246


    10.16.4Caffe  247


    10.16.5Theano  247


    10.17實戰Seq2Seq問答機器人  248


    10.18本章小結  254


    第11章Solr搜索引擎  256


    11.1全文檢索的原理  257


    11.2Solr簡介與部署  258


    11.3Solr後臺管理描述  263


    11.4配置schema  267


    11.5Solr管理索引庫  270


    11.5.1創建索引  270


    11.5.2查詢索引  276


    11.5.3刪除文檔  279


    11.6本章小結  281

    前言
    為什麼要寫這本書
    這是一本關於中文自然語言處理(簡稱NLP)的書,NLP是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。NLP是一門融語言學、計算機科學、數學於一體的科學。本書偏重實戰,不僅繫統介紹了NLP涉及的知識點,同時也教會讀者如何實際應用與開發。圍繞這個主題,本書從章節規劃到具體的講述方式,具有以下兩個特點:
    個特點是本書的主要目標讀者定位為高校相關專業的大學生(統計學、計算機技術)、NLP愛好者,以及不具備專業數學知識的人群。NLP是一繫列學科的集合體,其中包含了語言學、機器學習、統計學、大數據以及人工智能等方面,尤其依賴數學知識纔能深入理解其原理。因此本書對專業知識的講述過程必須繞過復雜的數學證明,從問題的前因後果、創造者思考的過程、概率或幾何解釋代替數學解釋等一繫列迂回的路徑去深入模型的本源,這可能多少會犧牲一些嚴謹性,但是卻能換來對大多數人更為友好的閱讀體驗。

    為什麼要寫這本書


    這是一本關於中文自然語言處理(簡稱NLP)的書,NLP是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。NLP是一門融語言學、計算機科學、數學於一體的科學。本書偏重實戰,不僅繫統介紹了NLP涉及的知識點,同時也教會讀者如何實際應用與開發。圍繞這個主題,本書從章節規劃到具體的講述方式,具有以下兩個特點:


    個特點是本書的主要目標讀者定位為高校相關專業的大學生(統計學、計算機技術)、NLP愛好者,以及不具備專業數學知識的人群。NLP是一繫列學科的集合體,其中包含了語言學、機器學習、統計學、大數據以及人工智能等方面,尤其依賴數學知識纔能深入理解其原理。因此本書對專業知識的講述過程必須繞過復雜的數學證明,從問題的前因後果、創造者思考的過程、概率或幾何解釋代替數學解釋等一繫列迂回的路徑去深入模型的本源,這可能多少會犧牲一些嚴謹性,但是卻能換來對大多數人更為友好的閱讀體驗。


    第二個特點是本書是一本介紹中文自然語言處理的書,中文分詞相對於英文分詞來說更為復雜,讀者將通過例子來學習,體會到能夠通過實踐驗證自己想法的價值,我們提供了豐富的來自NLP領域的案例。在本書的內容編制上,從知識點背景介紹到原理剖析,輔以實戰案例,所有的代碼會在書中詳細列出或者上傳Github方便讀者下載與調試,幫助讀者快速上手掌握知識點,同時可以應用到後續實際的開發項目中。在實際項目章節中,選取目前在NLP領域中比較熱門的項目,將之前的知識點進行彙總,幫助讀者鞏固與提升。本書難度適中屬於入門和擴展級讀物。


     


    讀者將學到什麼


    如何用NLP 與語言學的關鍵概念來描述和分析語言


    NLP 中的數據結構和算法是怎樣的


    自然語言處理目前主流的技術與方法論


    信息檢索技術與大數據應用


     


    讀者對像


    1)統計學或相關IT專業學生


    本書的初衷是面向相關專業的學生——大量基於理論知識的認知卻缺乏實戰經驗的人員,讓其在理論的基礎上深入了解。通過本書,學生可以跟隨本書的教程一起操作學習,達到對自己使用的人工智能工具、算法和技術知其然亦知其所以然的目的。


    2)信息科學和計算機科學愛好者


    本書是一部近代科技的歷史書,也是一部科普書,還可以作為一部人工智能思想和技術的教科書去閱讀。通過本書可以了解到行業先驅們在探索人工智能道路上所做出的努力和思考,理解他們不同的觀點和思路,有助於開拓自己的思維和視野。


    3)人工智能相關專業的研究人員


    本書具體介紹了NLP相關知識。通過本書可以了解理論知識,了解哪些纔是項目所需的內容以及如何在項目中實現,能夠快速上手。


     


    如何閱讀本書


    本書內容針對NLP從以下幾個方面進行闡述:


    部分的內容包括第1、2、11章,主要介紹了NLP所需要了解的Python科學包、正則表達式以及Solr檢索。


    第二部分的內容包括第5~10章的內容,主要是介紹NLP相關的各個知識點。分別是:


    第3~5章主要介紹了詞法分析層面的一些技術,這一部分是NLP技術的基礎,需要讀者熟練掌握。


    第6章介紹了句法分析技術,該部分目前理論研究較多,工程實踐中使用門檻相對較高,且效果多是依賴結合業務知識進行規則擴展,因此本書未做深入探討,讀者了解即可。


    第7章介紹了常用的向量化方法。這些方法常用於各種NLP任務的輸入,讀者需重點掌握。


    第8章介紹了情感分析相關的概念、場景以及一般做情感分析的流程,情感分析在很多行業都有應用,所以需要讀者熟練掌握。


    第9章介紹了機器學習的一些基本概念,重點突出NLP常用的分類算法、聚類算法,同時還介紹了幾個案例,這章是NLP的基礎內容,需要重點掌握。


    第10章介紹了NLP中常用的深度學習算法,這些方法比較復雜,但是非常實用,需要讀者耐心學習。


    除了以上內容外,以下信息是在本書中涉及特定內容的解釋和說明:


    內容延伸。本書每個章節都有一定的內容延伸章節,其內容是對於有興趣深入研究的讀者推薦的資料或進一步了解的知識點,由於每個主題都涵蓋很多內容,因此本書僅在內容延伸中拋磚引玉,有興趣的讀者可以加以了解和學習。


    相關知識點。本書很多章節中都有“相關知識點”的內容介紹,其對特定工具、知識、算法、庫等方面做了較為詳細的介紹,它們是本書的知識堡壘。


    本章小結。每章的結尾都有“本章小結”,在小結中包含4部分內容。


    內容小結。內容小結是有關本章內容的總結。


    重點知識。重點知識是本章重點需要讀者掌握的知識和內容。


    外部參考。外部參考是本章提到過但是無法詳細介紹的內容,都在外部參考中列出,有興趣的讀者可以基於比構建自己的知識圖譜。


    應用實踐。基於本章內容推薦讀者在實踐中落地的建議。


    提示。對於知識點的重要提示和應用技巧,相對“相關知識點”而言,每條提示信息的內容量較少,一般都是經驗類的總結。


    注意。特定需要引起注意的知識,這些注意點是應用過程中需要避免的“大坑”。


     


    關於附件的使用方法


    除了第1章外,本書的每一章都有對應源數據和完整代碼,該內容可在本書中直接找到,有些代碼需要從Github下載,地址是https://github.com/nlpinaction/learning-nlp。需要注意的是,為了讓讀者更好地了解每行代碼的含義,筆者在注釋信息中使用了中文標注,且每個程序文件的編碼格式都是UTF-8。


     


    勘誤和支持


    由於筆者水平有限,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。讀者可通過以下途徑聯繫並反饋建議或意見:


    即時通訊。添加個人微信(kennymingtu)反饋問題。


    電子郵件。發送E-mail到kenny_tm@hotmail.com。


     


    致謝


    在本書的撰寫過程中,得到了來自多方的指導、幫助和支持。


    首先要感謝的是機械工業出版社華章公司的楊福川編輯,他在本書出版過程中給予我極大的支持和鼓勵,並為此書的撰寫提供了方向和思路指導。


    其次要感謝黃英和周劍老師在自然語言處理項目和工作中提供的寶貴經驗和支持。


    再次要感謝全程參與審核、校驗等工作的張錫鵬、孫海亮編輯以及其他背後默默支持的出版工作者,是他們的辛勤付出纔讓本書得以順利面世。


    後感謝我的父母、家人和朋友,使得我有精力完成本書的編寫。


    謹以此書獻給熱愛數據工作並為之奮鬥的朋友們,願大家身體健康、生活美滿、事業有成!


     


    塗銘


    2018年1月於上海


     


     


    書籍初成,感慨良多。


    在接受邀請撰寫本書時,從未想到過程如此艱辛。


    感謝我的女友和家人的理解與支持,陪伴我度過寫書的漫長歲月。


    感謝我的合著者——塗銘和劉樹春,與他們合作輕松愉快,給予我很多的理解和包容。


    感謝參與審閱、校驗等工作的孫海亮老師等出版社工作人員,是他們在幕後的辛勤付出保證了本書的出版成功。


    再次感謝一路陪伴的所有人!


     


    劉祥


    2018年1月於北京


     


    首先要感謝我的兩位合作者——塗銘和劉祥,能夠相聚在一起寫書是緣分。當初聊到出版NLP入門書籍的想法時我們一拍即合,然而真正開始執筆纔發現困難重重,業餘時間常常被工作擠占,進度一拖再拖,在伙伴們的支持下,克服了拖延癥,順利完成本書。


    特別感謝我的愛人和家人的悉心照料和支持。


    感謝孫海亮老師、張錫鵬老師等出版社工作人員,沒有他們的辛勞付出就沒有本書保質保量的完成。


    後感謝幫我校稿的林博、謝雨飛、陳敏,謝謝他們在生活和工作上給我的支持與幫助。


    後,祝大家學習快樂。


     


    劉樹春


    2018年1月於上海

    媒體評論
    本書從各個方面著手,幫助讀者理解NLP的過程,提供了各種實戰場景,結合現實項目背景,幫助讀者理解NLP中的數據結構和算法以及目前主流的NLP技術與方法論,結合信息檢索技術與大數據應用等流行技術,*終完成對NLP的學習和掌握。
    ——黃英 阿裡巴巴達摩院高級算法專家

    目前市面上的NLP書籍,要麼是針對研究人員的偏理論性的教科書,要麼是針對資深工程師進一步深入了解NLP技術的高級讀物。為了填補這一空白,三位來自工業界的資深NLP專家,結合真實的項目,讓讀者能夠以*快的速度掌握NLP技術的精髓。同時,穿插大量練習,可以幫助讀者反復練習課本中的知識點。所有這些內容,都是為了讓讀者能夠解決工作中遇到的實際問題,而不僅是紙上談兵。本書通俗易懂、操作性強。
    ——馮是聰博士 百煉智能創始人兼CEO/人工智能與信息檢索專家

    本書從各個方面著手,幫助讀者理解NLP的過程,提供了各種實戰場景,結合現實項目背景,幫助讀者理解NLP中的數據結構和算法以及目前主流的NLP技術與方法論,結合信息檢索技術與大數據應用等流行技術,*終完成對NLP的學習和掌握。


    ——黃英 阿裡巴巴達摩院高級算法專家


     


    目前市面上的NLP書籍,要麼是針對研究人員的偏理論性的教科書,要麼是針對資深工程師進一步深入了解NLP技術的高級讀物。為了填補這一空白,三位來自工業界的資深NLP專家,結合真實的項目,讓讀者能夠以*快的速度掌握NLP技術的精髓。同時,穿插大量練習,可以幫助讀者反復練習課本中的知識點。所有這些內容,都是為了讓讀者能夠解決工作中遇到的實際問題,而不僅是紙上談兵。本書通俗易懂、操作性強。


     ——馮是聰博士 百煉智能創始人兼CEO/人工智能與信息檢索專家


     


    本書作者通過對現有的NLP技術以及新興的深度學習方法進行梳理和總結,形成了自己的NLP知識體繫。本書在內容上平衡了理論和技術,在每章的理論之後都配備了實踐課,便於讀者通過動手加深理解,避免成為隻會誇誇其談的NLP理論“專家”。本書可以幫助研究者,特別是初學者,加強對NLP的理論與技術的學習,授人以魚的同時授人以漁,幫助讀者靈活解決實際工作當中遇到的各種NLP問題。


    ——林亦寧 七牛雲AI實驗室Leader/10餘年人工智能和深度學習研究


     


    技術的發展和普及,離不開教育的推動,從商業智能到大數據,再到如今的人工智能,莫不是如此。華章是IT技術圖書出版領域的領軍者,天善智能是IT技術在線教育領域的佼佼者,我們都在為推動IT技術在中國甚至是世界範圍內的發展貢獻力量。華章與天善智能結成了非常重要的戰略合作伙伴關繫,本書是雙方合作的*本書,後續還會有更多的作品出版,希望能對大家有所幫助。


    ——周劍 天善智能聯合創始人&咨詢總監













     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部