[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • 文本數據挖掘/宗成慶等 宗成慶、夏睿、張家俊 著 大學教材大中專
    該商品所屬分類:教材 -> 教材
    【市場價】
    718-1040
    【優惠價】
    449-650
    【作者】 宗成慶、夏睿、張家俊 
    【出版社】清華大學出版社 
    【ISBN】9787302519904
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    ISBN編號:9787302519904
    書名:文本數據挖掘 文本數據挖掘
    作者:宗成慶、夏睿、張家俊

    代碼:75
    開本:16開
    是否是套裝:否

    出版社名稱:清華大學出版社

        
        
    "

    文本數據挖掘/宗成慶等

    作  者: 宗成慶、夏睿、張家俊 著
    size="731x8"
    定  價: 75
    size="731x8"
    出?版?社: 清華大學出版社
    size="731x8"
    出版日期: 2019年05月01日
    size="731x8"
    頁  數: 0
    size="731x8"
    裝  幀: 簡裝
    size="731x8"
    ISBN: 9787302519904
    size="731x8"
    主編推薦

    "隨著計算機網絡和移動通信技術的快速發展和普及,面向網絡或移動終端用戶的文本大數據挖掘技術越來越多地受到各個領域的高度關注,具有極其廣闊的應用,同時這項研究涉及機器學習、自然語言處理和人工智能等多個領域和學科,開展這項研究對於推動相關學科的發展具有重要的理論意義。 本書闡述文本數據挖掘的理論模型、實現算法和相關應用,通過實例從原理上對相關技術的理論方法和實現算法進行闡述,言簡意賅,深入淺出,使讀者能夠在充分理解基本原理的基礎上掌握應用繫統的實現方法。 本書列入“中國科學院大學研究生教學輔導......

    目錄
    ●第 1章緒論 .1 1.1基本概念 1 1.2文本挖掘任務 .2 1.3文本挖掘面臨的困難 .5 1.4方法概述與本書的內容組織 .7 1.5進一步閱讀 .9 第 2章數據預處理和標注 . 11 2.1數據獲取 11 2.2數據預處理 . 15 2.3數據標注 17 2.4基本工具 19 2.4.1漢語自動分詞與詞性標注 19 2.4.2句法分析 . 20 2.4.語法模型 . 21 2.5進一步閱讀 . 22 第 3章文本表示 . 23 3.1向量空間模型 . 23 3.1.1向量空間模型的基本概念 23 3.1.2特征項的構造與權重 . 24 3.1.3文本長度規範化 . 25 3.1.4特征工程 . 26 3.1.5其他文本表示方法 27 3.2詞的分布式表示 29 3.2.1神經網絡語言模型 29 3.2.2 C&W模型 . 32 3.2.3 CBOW與 Skip-gram模型 34 3.2.4噪聲對比估計與負采樣 . 35 3.2.5字詞混合的分布式表示方法 . 37 3.3短語的分布式表示 . 38 3.3.1基於詞袋的分布式表示 . 39 3.3.2基於自動編碼器的分布式表示 . 39 3.4句子的分布式表示 . 42 3.4.1通用的句子表示 . 42 3.4.2任務相關的句子表示 . 45 3.5文檔的分布式表示 . 48 3.5.1通用的文檔分布式表示 . 48 3.5.2任務相關的文檔分布式表示 . 49 3.6進一步閱讀 . 52 第 4章文本分類 . 53 4.1概述 . 53 4.2傳統文本表示 . 54 4.3特征選擇 55 4.3.1互信息法 . 55 4.3.2信息增益法 58 4.3.3卡方統計量法 . 59 4.3.4其他方法 . 60 4.4傳統分類算法 . 61 4.4.1樸素貝葉斯模型 . 61 4.4.2 Logistic回歸、 Softmax回歸與優選熵模型 . 63 4.4.3支持向量機 65 4.4.4集成學習 . 67 4.5深度神經網絡方法 . 68 4.5.1多層前饋神經網絡 68 4.5.2卷積神經網絡 . 69 4.5.3循環神經網絡 . 71 4.6文本分類性能評估 . 78 4.7進一步閱讀 . 81 第 5章文本聚類 . 83 5.1概述 . 83 5.2文本相似性度量 83 5.2.1樣本間的相似性 . 83 5.2.2簇間的相似性 . 86 目錄 IX 5.2.3樣本與簇之間的相似性 . 87 5.3文本聚類算法 . 87 5.3.1 K-均值聚類 . 87 5.3.2單遍聚類 . 91 5.3.3層次聚類 . 92 5.3.4密度聚類 . 95 5.4性能評估 97 5.4.1外部標準 . 97 5.4.2內部標準 . 99 5.5進一步閱讀 . 99 第 6章主題模型 . 101 6.1概述 . 101 6.2潛在語義分析 . 102 6.2.1奇異值分解 102 6.2.2詞項 -文檔矩陣的奇異值分解 103 6.2.3詞項和文檔的概念表示及相似度計算 . 104 6.3概率潛在語義分析 . 106 6.3.1模型假設 . 106 6.3.2參數學習 . 107 6.4潛在狄利克雷分布 . 108 6.4.1模型假設 . 108 6.4.2詞項和主題序列的聯合概率 . 110 6.4.3模型推斷 . 112 6.4.4新文檔的推斷 . 114 6.4.5 PLSA與 LDA的聯繫與區別 . 115 6.5進一步閱讀 . 115 第 7章情感分析與觀點挖掘 117 7.1概述 . 117 7.2情感分析任務類型 . 118 7.2.1按目標形式劃分 . 118 7.2.2按分析粒度劃分 . 119 7.3文檔或句子級情感分析方法 . 121 7.3.1基於規則的無監督情感分類 . 122 7.3.2基於傳統機器學習的監督情感分類 . 123 7.3.3深度神經網絡方法 126 文本數據挖掘 7.4詞語級情感分析與情感詞典構建 . 131 7.4.1基於語義知識庫的方法 . 131 7.4.2基於語料庫的方法 131 7.4.3情感詞典性能評估 134 7.5屬性級情感分析 134 7.5.1屬性抽取 . 135 7.5.2屬性情感分類 . 138 7.5.3主題與情感的生成式建模 141 7.6情感分析中的特殊問題 143 7.6.1情感極性轉移問題 143 7.6.2領域適應問題 . 145 7.7進一步閱讀 . 147 第 8章話題檢測與跟蹤 . 149 8.1概述 . 149 8.2術語與任務 . 151 8.2.1術語 151 8.2.2任務 152 8.3報道或話題的表示與相似性計算 . 154 8.4話題檢測 156 8.4.1話題在線檢測 . 157 8.4.2話題回溯檢測 . 158 8.5話題跟蹤 159 8.6評估方法 160 8.7社交媒體話題檢測與跟蹤 . 161 8.7.1社交媒體話題檢測 162 8.7.2社交媒體話題跟蹤 163 8.8突發話題檢測 . 163 8.8.1突發狀態識別 . 164 8.8.2以文檔為中心的方法:先檢測話題後評估突發性 . 167 8.8.3以特征為中心的方法:先識別突發特征後生成突發話題 . 168 8.9進一步閱讀 . 169 第 9章信息抽取 . 171 9.1概述 . 171 9.2命名實體識別 . 173 9.2.1基於規則的命名實體識別方法 . 174 目錄 XI 9.2.2有監督的命名實體識別方法 . 175 9.2.3半監督的命名實體識別方法 . 181 9.2.4命名實體識別方法評價 . 183 9.3共指消解 184 9.3.1基於規則的共指消解方法 185 9.3.2數據驅動的共指消解方法 187 9.3.3共指消解評價 . 190 9.4實體消歧 193 9.4.1基於聚類的實體消歧方法 193 9.4.2基於鏈接的實體消歧 . 197 9.4.3實體消歧任務的評價方法 203 9.5關繫抽取 204 9.5.1基於離散特征的關繫分類方法 . 206 9.5.2基於分布式特征的關繫分類方法 212 9.5.3基於遠程監督的關繫分類方法 . 214 9.5.4關繫分類性能評價 215 9.6事件抽取 215 9.6.1事件描述模板 . 215 9.6.2事件抽取方法 . 217 9.6.3事件抽取評價 . 224 9.7進一步閱讀 . 224 第 10章文本自動摘要 227 10.1概述 . 227 10.2抽取式自動摘要 228 10.2.1句子重要性評估 229 10.2.2基於約束的摘要生成方法 . 237 10.3壓縮式自動摘要方法 238 10.3.1句子壓縮方法 238 10.3.2基於句子壓縮的自動摘要方法 242 10.4生成式自動摘要 244 10.4.1基於信息融合的生成式摘要方法 . 244 10.4.2基於編碼 -解碼的生成式摘要方法 249 10.5基於查詢的自動摘要 251 10.5.1基於語言模型的相關性計算方法 . 251 10.5.2基於關鍵詞語重合度的相關性計算方法 . 252 10.5.3基於圖模型的相關性計算方法 252 10.6跨語言和多語言自動摘要方法 253 10.6.1跨語言自動摘要 253 10.6.2多語言自動摘要 256 10.7摘要質量評估方法和相關評測 258 10.7.1摘要質量評估方法 . 258 10.7.2相關評測活動 262 10.8進一步閱讀 . 263 參考文獻 . 265 名詞術語索引 . 285
    內容虛線

    內容簡介

    size="789x11"

    本書闡述文本數據挖掘的理論模型、實現算法和相關應用,主要內容包括:信息抽取和知識庫構建、文本聚類、情感文本分析、熱點發現、生物醫學文本挖掘和多文檔自動摘要等。寫作風格力求言簡意賅,深入淺出,通過實例說明實現相關任務的理論方法和技術思路,而不過多地涉及實現細節。本書可作為大學高年級本科生或研究生從事相關研究的入門文獻,也可作為從事相關技術研發的開發人員的參考資料。

    作者簡介

    宗成慶、夏睿、張家俊 著

    size="43x26"

    "宗成慶 中國科學院自動化研究所研究員、博士生導師,中國科學院大學崗位教授。主要從事自然語言處理、機器翻譯、人機對話繫統和文本數據挖掘等相關研究,主持國家項目10餘項,發表論文200餘篇,出版專著《統計自然語言處理》一部和譯著兩部。目前擔任靠前計算語言學委員會(ICCL)委員、亞洲自然語言處理學會(AFNLP)主席和中國中文信息學會副理事長等職務,是學術期刊ACM TALLIP副主編、《自動化學報》副主編和IEEE Intelligent Systems等期刊的編委,曾任靠前很好學術會議ACL-IJCNLP2015程序委員會主席,IJCAI2017、IJCAI-ECAI2018和AAAI201......

    摘要

    隨著互聯網和移動通信技術的快速發展和普及應用,文本數據挖掘技術備受關注,尤其隨著雲計算、大數據和深度學習等一繫列新技術的廣泛使用,文本挖掘技術已經在眾多領域(如輿情分析、醫療和金融數據分析等)發揮了重要作用,表現出廣闊的應用前景。 雖然十多年前我就指導博士生開展文本分類和自動文摘等相關技術的研究,但對文本數據挖掘的整體概念並沒有一個清晰的認識,隻是將研究的單項技術視為自然語言處理的具體應用。韓家煒教授主筆的《數據挖掘 ——概念與技術》和劉兵教授撰寫的“Web Data Mining”等專著曾讓我大獲裨益,每次聆聽他們的學術報告和與他們當面交談也都受益匪淺。促使我萌生撰寫這部專著念頭的是中國科學院大學讓我開設的“文本數據挖掘”課程。 2015年底我接受中國科學院大學計算機與控制學院的邀請,開始準備“文本數據挖掘”課程的內容設計和課件編寫工作,我不得不靜下心來查閱大量的文獻資料,認真思考這一......

    "




     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部