Java數據科學指南
作 者:(加)魯什迪·夏姆斯(Rushdi Shams) 著;武傳海 譯
定 價:79
出 版 社:人民郵電出版社
出版日期:2018年06月01日
頁 數:302
裝 幀:平裝
ISBN:9787115481634
●第1章 獲取數據與清洗數據 1
●1.1 簡介 2
●1.2 使用Java從分層目錄中提取所有文件名 3
●準備工作 3
●操作步驟 3
●1.3 使用Apache Commons IO從多層目錄中提取所有文件名 5
●準備工作 5
●操作步驟 5
●1.4 使用Java 8從文本文件一次性讀取所有內容 6
●操作步驟 7
●1.5 使用Apache Commons IO從文本文件一次性讀取所有內容 7
●準備工作 7
●操作方法 8
●1.6 使用Apache Tika提取PDF文本 8
●準備知識 9
●操作步驟 9
●1.7 使用正則表達式清洗ASCII文本文件 11
●操作步驟 11
●1.8 使用Univocity解析CSV文件 12
●準備工作 13......
內容簡介
現如今,數據科學已經成為一個熱門的技術領域,它涵蓋了人工智能的各個方面,例如數據處理、信息檢索、機器學習、自然語言處理、數據可視化等。而Java作為一門經典的編程語言,在數據科學領域也有著傑出的表現。本書旨在通過Java編程來引導讀者更好地完成數據科學任務。本書通過9章內容,詳細地介紹了數據獲取與清洗、索引的建立和檢索數據、統計分析、數據學習、信息的提取、大數據處理、深度學習、數據可視化等重要主題。本書適合想通過Java解決數據科學問題的讀者,也適合數據科學領域的專業人士以及普通Java開發人員閱讀。
(加)魯什迪·夏姆斯(Rushdi Shams) 著;武傳海 譯
Rushdi Shams畢業於加拿大韋仕敦大學,獲得了機器學習應用博士學位,主攻方向是自然語言處理(Natural Language Processing,NLP)。在成為機器學習與NLP領域的專家之前,他講授本科生與研究生課程。在YouTube上,他一直運營著一個名為“跟Rushdi一起學”(Learn with Rushdi)的頻道,並且做得有聲有色,該頻道主要面向想學習計算機技術的朋友。
"