| | | 文本挖掘中若干關鍵問題研究/博士論叢 | 該商品所屬分類:工業技術 -> 電子通信 | 【市場價】 | 187-272元 | 【優惠價】 | 117-170元 | 【介質】 | book | 【ISBN】 | 9787312022807 | 【折扣說明】 | 一次購物滿999元台幣免運費+贈品 一次購物滿2000元台幣95折+免運費+贈品 一次購物滿3000元台幣92折+免運費+贈品 一次購物滿4000元台幣88折+免運費+贈品
| 【本期贈品】 | ①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
| |
版本 | 正版全新電子版PDF檔 | 您已选择: | 正版全新 | 溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。 *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。 | | | | 內容介紹 | |
![](https://bnmppic.bookuu.com/goods/13/59/50/2018041497873120228071547773-fm.jpg)
-
出版社:中國科大
-
ISBN:9787312022807
-
作者:陸旭
-
頁數:117
-
出版日期:2008-12-01
-
印刷日期:2008-12-01
-
包裝:平裝
-
開本:16開
-
版次:1
-
印次:1
-
字數:163千字
-
自動文本分類是將自然文本文件根據內容自動分為預先定義的一個或幾個類別的過程,基於統計學習、機器學習的文本分類技術已經成為主流技術,本書對基於統計學習的文本分類及其相關技術進行了研究,為解決文本分類的稀疏性和高維性問題,基於偏*小二乘理論,提出一種新的維數約簡算法,從提高文本分類性能和準確性出發,運用偏*小二乘的*新理論成果,提出了一種能較好提取潛在語義的新文本分類模型,對於數量龐大的文檔類別,傳統的平坦文本分類的性能受到很大的制約,層次文本分類是一種有效的解決方法,由此提出了一種新的層次文本分類模型。
-
本書介紹了文本分類和偏最小二乘回歸,提出了基於變量投影重要性
指標的文本分類特征選擇方法,論述了偏最小二乘Logistic文本分類模型
,闡述了CHTC層次文本分類模型的研究工作,本書可供相關領域科研工作
者、大學高年級學生和研究生閱讀。
-
前言 第1章 導論 1.1 研究背景 1.2 文本分類綜述 1.3 本書的內容結構 1.4 本書的創新工作 第2章 文本分類概述 2.1 文本分類的數學定義 2.2 文本分類任務的特點 2.3 文本分類繫統的組成 2.4 文檔預處理 2.5 文檔的表示 2.6 常用文本分類模型 2.7 文本分類器學習、測試和評價 第3章 偏*小二乘回歸方法的基本理論 3.1 偏*小二乘回歸的發展歷史 3.2 偏*小二乘回歸的基本原理 3.3 偏*小二乘回歸的基本思想 3.4 數學原理 3.5 偏*小二乘回歸的理論算法 3.6 成分數的確定 第4章 基於變量投影重要性指標的特征選擇方法研究 4.1 維數約簡技術 4.2 符號約定 4.3 常用的特征選擇方法 4.4 常用的特征抽取方法 4.5 基於變量投影重要性指標的特征選擇方法 4.6 實驗結果和分析 第5章 偏*小二乘Logistic文本分類模型研究 5.1 Logistic回歸模型 5.2 偏*小二乘Logistic回歸模型 5.3 偏*小二乘Logistic文本分類模型 5.4 實驗結果和分析 第6章 GHTC層次文本分類模型研究 6.1 層次分類概述 6.2 層次特征選擇 6.3 GHTC層次文本分類模型 6.4 實驗結果和分析 第7章 總結與展望 7.1 總結 7.2 研究展望 附錄1 REUTERS-21578前10個常見類和前10個稀有類的前20個特征VIP值 附錄2 復旦文本分類語料庫部分類別的前20個特征VIP值 附錄3 OHSUMED語料庫層次結構 附錄4 20 Newsgroups語料庫各節點各特征維數的微平均F1值和宏平均F1值變化情況 參考文獻 後記
| | | | | |