作 者:(美)董欣( n Luna Dong),(美)戴夫士·斯裡瓦斯塔瓦(Divesh Srivastava) 著;王秋月,杜治娟,王碩 譯
定 價:79
出 版 社:機械工業出版社
出版日期:2017年05月01日
頁 數:186
裝 幀:精裝
ISBN:9787111559863
●叢書前言
●譯者序
●前言
●第1章大數據集成的挑戰和機遇1
●1.1傳統數據集成2
●1.1.1航班示例:數據源2
●1.1.2航班示例:數據集成7
●1.1.3數據集成:體繫結構和三個主要步驟10
●1.2大數據集成:挑戰12
●1.2.1“V”維度13
●1.2.2案例研究:深網數據量15
●1.2.3案例研究:抽取的領域數據18
●1.2.4案例研究:深網數據的質量22
●1.2.5案例研究:淺網結構化數據25
●1.2.6案例研究:抽取的組28
●1.3大數據集成:機遇30
●1.3.1數據冗餘性31
●1.3.2長數據32
●1.3.3大數據平臺33
●1.4章節安排33
●部分目錄
本書作者在多年研究傳統數據集成的基礎上,著重分析了大數據背景下的大數據集成。和傳統的數據集成相比,大數據集成具有一些新的挑戰,例如數據和數據源的海量性、數據的多樣性和數據的動態性等。本書共分6章,包括大數據集成的挑戰和機遇、模式對齊、記錄鏈接、數據融合、出現的新問題和結論,繫統地討論了解決大數據集成中關鍵問題的一些重要研究成果和方法,對大數據集成的研究者和實踐者都很有幫助。另外本書也可以作為學生學習該領域的入門讀物。
(美)董欣( n Luna Dong),(美)戴夫士·斯裡瓦斯塔瓦(Divesh Srivastava) 著;王秋月,杜治娟,王碩 譯
董欣( n Luna Dong),公司不錯科學研究員。加入谷歌公司之前,曾在AT&T公司研究實驗室工作。她擁有美國華盛頓大學博士學位、北京大學碩士學位和南開大學學士學位。研究興趣主要包括數據庫、信息檢索和機器學習,特別是在數據集成、數據清洗、知識庫和個人信息管理等方面有濃厚的興趣。已在數據集成方面的很好會議和期刊上發表50多篇論文,並獲得2005年SIGMOD的很好展示獎(前三名之一)。曾擔任2015年WAIM會議的聯合,以及2015年SIGMOD會議、2013年ICDE會議和2011年CIKM會議的區域。
戴夫士·斯裡瓦斯塔瓦(Divesh S等