作 者:(美)亞歷克斯·托馬斯 著 唐曉,胡喬林,陳新 譯
定 價:128
出 版 社:中國電力出版社
出版日期:2022年09月01日
頁 數:404
裝 幀:平裝
ISBN:9787519869670
●前言
第一部分基礎知識
第1章快速入門
1.1簡介
1.2其他工具
1.3建立你自己的開發環境
1.3.1前置條件
1.3.2啟動Apachespark
1.3.3檢查代碼
1.4熟悉ApacheSpark
1.4.1使用sparkNLP啟動Apachespark
1.4.2在Apachespark中加載和查看數據
1.5SparkNLP的HelloWorld示例
第2章自然語言基礎知識
2.1什麼是自然語言
2.1.1語言的起源
2.1.2口頭語言和書面語言
2.2語言學
2.2.1語音學和音繫學
2.2.2詞法學(形態學)
2.2.3語法
2.2.4語義學
2.3社會語言學:方言、語域和其他變體
2.3.1禮節
2.3.2語境
2.4語用學
2.4.1羅曼·雅各布森
2.4.2如何運用語用學
2.5書寫繫統
2.5.1起源
2.5.2字母
2.5.3輔音音素文字
2.音附標文字
2.5.5音節表
2.5.6標識像形符
2.6編碼
2.6.1ASCII
2.6.2Unicode
2.6.3UTF
2.7練習:分詞
2.7.1英語分詞
2.7.2希臘語分詞
2.7.3Ge'ez(阿姆哈拉語)分詞
2.8資源
第3章ApacheSpark上的NLP
3.1並行性、並發性、分布式計算
3.1.1ApacheHadoop之前的並行化
3.1.2MapReduce和ApacheHadoop
3.1.3ApacheSpark
……
第二部分構建模塊
第三部分應用
第四部分構建NLP繫統
術語表
如果你想構建一個使用自然語言文本的企業級應用程序,但不確定從哪裡開始或使用什麼工具,本書將幫助你入門。Wisecube的首席數據科學家AlexThormas向軟件工程師和數據科學家展示了如何使用深度學習和ApacheSparkNLP庫,來構建可擴展的自然語言處理(NLP)應用程序。通過在Spark處理框架上使用NLP的具體示例、實踐,進行理論解釋和動手練習,本書將會介紹從基本語言學和寫作繫統到情感分析和搜索引擎的所有內容。你還將探索一些開發基於文本的應用程序會遇到的特殊問題,例如性能等。在下面四個部分中,你將學習NLP基礎知識和構建模塊,然後再深入研究應用程序和繫統構建:基礎知識:了解自然語言處理、ApacheSpark上的NLP和深度學習的基礎知識。構建模塊:學習構建NLP應用程序的技術(包括標記化、句子分割和命名實體識別),並了解它們的工作方式和原因。應用程序:探索構建你自己的NLP應等
(美)亞歷克斯·托馬斯 著 唐曉,胡喬林,陳新 譯
亞歷克斯·托馬斯是Wisecube的首席數據科學家。他將自然語言處理和機器學習運用於臨床數據、身份數據、雇主和求職者數據以及如今的生化數據。Alex從09版本開始使用Apache Spark,在工作中也用過包括UIMA和OpenNLP在內的多種NLP庫和框架。