[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • 數據科學與工程導論
    該商品所屬分類:圖書 -> 華東師範大學出版社
    【市場價】
    585-848
    【優惠價】
    366-530
    【作者】 王偉劉垚 
    【出版社】華東師範大學出版社 
    【ISBN】9787576004045
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:華東師範大學出版社
    ISBN:9787576004045
    版次:1

    商品編碼:13099300
    品牌:ECNUP
    包裝:平裝

    開本:16開
    出版時間:2021-01-01
    用紙:膠版紙

    頁數:532
    字數:654000
    正文語種:中文

    作者:王偉,劉垚

        
        
    "

    內容簡介

    《數據科學與工程導論》圍繞數據全生命周期介紹了數據科學與工程的基本理論,具體包括七部分內容:第一部分緒論;第二部分大規模數據的采集、加工、管理和數據工程;第三部分數據可視化;第四部分數據分析;第五部分數據應用;第六部分數據科學倫理;第七部分數據科學的高級實現。

    目錄

    第一部分 數據科學與工程概述
    第1章
    緒論
    1.1 信息文明與數據簡史
    1.2 數據科學與工程的基本內涵
    1.3 第四範式:數據密集型科學
    1.4 數據科學與工程的應用
    1.5 實踐:以Git與Python為中心
    1.6 本章小結
    1.7 習題與實踐
    第2章
    數據思維與問題求解
    2.1 問題求解與思維方式
    2.2 計算思維與數據思維
    2.3 計算思維與數據思維實例
    2.4 實踐:Python問題求解
    2.5 本章小結
    2.6 習題與實踐

    第二部分 數據與計算的基礎設施
    第3章
    數據的模型與結構
    3.1 比特與數據
    3.2 進制與數據表達
    3.3 數據的編碼與存儲
    3.4 數據的模型
    3.5 數據的結構
    3.6 實踐:Python數據結構
    3.7 本章小結
    3.8 習題與實踐
    第4章
    數據的計算與程序表達
    4.1 數據的計算
    4.2 算法分析
    4.3 算法的實例
    4.4 計算機編程語言
    4.5 實踐:Python算法
    4.6 本章小結
    4.7 習題與實踐
    第5章
    計算基礎設施
    5.1 數據處理的通用機器
    5.2 程序執行過程
    5.3 計算機繫統結構
    5.4 基礎設施軟件
    5.5 雲計算與數據中心
    5.6 實踐:基礎設施數據采集與分析
    5.7 本章小結
    5.8 習題與實踐
    第6章
    數據的全生命周期管理
    6.1 數據采集
    6.2 數據存儲
    6.3 數據管理
    6.4 數據計算
    6.5 數據分析
    6.6 數據展示
    6.7 實踐:Python網絡爬蟲
    6.8 本章小結
    6.9 習題與實踐
    第7章
    數據庫繫統
    7.1 數據庫的起源與發展
    7.2 關繫數據庫
    7.3 數據倉庫與OLAP
    7.4 SQL語言
    7.5 實踐:SQL數據處理與分析
    7.6 本章小結
    7.7 習題與實踐
    第8章
    大數據繫統
    8.1 大數據的基本概念
    8.2 Hadoop和Spark生態
    8.3 SQL與Hadoop的組合
    8.4 大數據繫統的發展與未來
    8.5 實踐:Hadoop與Spark大數據處理
    8.6 本章小結
    8.7 習題與實踐

    第三部分 數據分析的原理與方法
    第9章
    數據科學過程
    9.1 數據科學過程基礎
    9.2 數據科學工作流
    9.3 實踐:KNIME數據科學工作流
    9.4 本章小結
    9.5 習題與實踐
    第10章
    統計分析的原理
    10.1 數據科學的數學基礎
    10.2 概率與統計基礎
    10.3 統計建模:線性回歸模型
    10.4 數據分析的工具
    10.5 實踐:Python統計分析
    10.6 本章小結
    10.7 習題與實踐
    第11章
    機器學習方法
    11.1 機器學習發展歷史
    11.2 機器學習方法
    11.3 機器學習最新發展
    11.4 經典機器學習算法
    11.5 實踐:Python機器學習
    11.6 本章小結
    11.7 習題與實踐
    第12章
    深度學習
    12.1 深度學習介紹
    12.2 深度學習價值
    12.3 誤差反向傳播算法
    12.4 卷積神經網絡
    12.5 深度學習工具
    12.6 實踐:Python深度學習——手寫漢字識別
    12.7 本章小結
    12.8 習題與實踐
    第13章
    數據挖掘基礎
    13.1 初識數據挖掘
    13.2 數據挖掘技術
    13.3 典型數據挖掘算法
    13.4 實踐:Python圖像分類
    13.5 本章小結
    13.6 習題與實踐
    第14章
    非結構化數據挖掘
    14.1 自然語言處理
    14.2 語音信號處理
    14.3 圖像處理與理解
    14.4 實踐:Python文本數據挖掘
    14.5 本章小結
    14.6 習題與實踐

    第四部分 數據應用與社會問題
    第15章
    數據綜合應用
    15.1 搜索引擎
    15.2 智能運維
    15.3 開源數字年報
    15.4 本章小結
    15.5 習題與實踐
    第16章
    數據道德與職業行為準則
    16.1 開放的世界
    16.2 數據科學與工程職業規劃
    16.3 數據隱私與社會問題
    16.4 數據與人工智能倫理
    16.5 本章小結
    16.6 習題與實踐

    文獻閱讀
    參考文獻
    附錄

    算法 程序列表
    第1章 緒論 3
    程序1.1 第一個Python數據科學程序 36

    第2章 數據思維與問題求解 39
    程序2.1 遞歸加法 52
    程序2.2 最小值_循環 52
    程序2.3 最小值_遞歸 53
    程序2.4 最小值_分治 54
    程序2.5 驗證帕斯卡的分析 56
    程序2.6 估計π值 58
    程序2.7 開平方1 “笨辦法” 62
    程序2.8 開平方2 二分法 63
    程序2.9 開平方3 牛頓法 64
    程序2.10 開平方4 蒙特卡羅法 66

    第3章 數據的模型與結構 71
    程序3.1 變量的賦值 97
    程序3.2 棧的實現 97
    程序3.3 簡單樹的實現 99
    程序3.4 用列表創建簡單樹 99
    程序3.5 二叉樹類的定義 99
    程序3.6 二叉樹中插入左子節點 100
    程序3.7 二叉樹中插入右子節點 100
    程序3.8 獲取和設置根值以及獲得左右子樹 100

    第4章 數據的計算與程序表達 103
    算法4.1 函數search for X 112
    程序4.2 交換變量a和b的值 117
    算法4.3 冒泡排序 118
    算法4.4 漢諾塔問題的解 120
    算法4.5 樹排序 124
    程序4.6 冒泡排序 130
    程序4.7 選擇排序 132
    程序4.8 插入排序 133
    程序4.9 快速排序 135
    程序4.10 希爾排序 137

    第5章 計算基礎設施 138
    程序5.1 替換函數1 167
    程序5.2 替換函數2 167
    程序5.3 替換函數3 167
    程序5.4 替換函數4 167
    程序5.5 程序性能測試 168

    第6章 數據的全生命周期管理 171
    程序6.1 散點圖 191
    程序6.2 網絡爬蟲 198
    程序6.3 繪制散點圖 200
    程序6.4 繪制正弦、餘弦曲線 200
    程序6.5 繪制等高線圖 201

    第7章 數據庫繫統 204
    程序7.1 查詢客戶總消費額 212
    程序7.2 數據庫事務 213
    程序7.3 創建表 228
    程序7.4 SQL查詢1 228
    程序7.5 SQL查詢2 229
    程序7.6 SQL查詢3 229
    程序7.7 SQL查詢4 230
    程序7.8 SQL查詢5 230
    程序7.9 SQL查詢6 231
    程序7.10 SQL分析1 231
    程序7.11 SQL分析2 231
    程序7.12 SQL分析3 232
    程序7.13 SQL分析4 232
    程序7.14 SQL分析5 232

    第8章 大數據繫統 235
    程序8.1 map代碼 258
    程序8.2 reduce代碼 258
    程序8.3 用Spark進行WordCount 261

    第10章 統計分析的原理 296
    程序10.1 文本詞頻統計 323
    程序10.2 線性回歸模型 325

    第11章 機器學習方法 329
    程序11.1 損失函數 350
    程序11.2 梯度計算函數 350
    程序11.3 梯度下降算法 351

    第12章 深度學習 359
    程序12.1 基於VGG模型的手寫漢字識別模型 384

    第13章 數據挖掘基礎 387
    程序13.1 KNN算法模型 413
    程序13.2 訓練KNN 414

    第14章 非結構化數據挖掘 417
    程序14.1 詞雲制作 433
    程序14.2 文本分類實踐 434

    第15章 數據綜合應用 445
    程序15.1 使用倒排索引的檢索處理 455
    程序15.2 基於文檔和查詢關聯度的檢索 456
    程序15.3 基於查詢單詞的文檔和查詢關聯度的檢索 457
    程序15.4 基於排序的索引構建 458
    程序15.5 基於合並的索引構建 459
    查看全部↓

    精彩書摘

    數據科學與工程核心課程的繫列教材終於要面世了,這是一件鼓舞人心的事。作為華東師範大學數據學院的發起者和見證人,核心課程和繫列教材一直是我心心念念的事情。值此繫列教材出版發行之際,我很高興能被邀請寫幾句話,做個回顧,分享一些感悟,也展望一下未來。
    借著大數據熱的東風,依托何積豐院士在2007年倡導成立的華東師範大學海量計算研究所,2012年6月在時任SAP公司CTO史維學博士(Dr. Vishal Sikka)的支持下,我們成立了華東師範大學雲計算與大數據研究中心。2013年9月,學校發起成立作為二級獨立實體的數據科學與工程研究院,開始在軟件工程一級學科下自設數據科學與工程二級學科,開展博士研究生和碩士研究生的培養工作。在進行研究生培養的探索過程中,我們深切感受到計算機類的本科生人纔培養需要反思和改革。因此,到了2016年9月,研究院改制成數據科學與工程學院,隨後就開始招收數據科學與工程專業的本科生,第一屆本科生已於2020年畢業,這就是我們學院和專業的簡單歷史。經過這麼幾年的實踐和思考,我們越發堅信當年對“數據科學與工程”這一名稱的選擇,“數據學院”和“數據專業”已經得到越來越多的認可,學院的師生也逐漸接受“數據人”這一稱呼。
    這裡我想分享以下幾方面的感悟:為什麼要辦數據專業?怎麼辦數據專業?教材為什麼很重要?對人纔培養有什麼貢獻?
    為什麼要辦數據專業?數據是新能源,這是大家耳熟能詳的一句話。說到能源,我們首先想到的是石油,所以大家就習慣把數據比喻成石油。但是,在我們看來,“新能源”對應的英文應該是“New Power”。“Data is Power”,這是我們的基本信念,也是我們要辦數據學院的根本動機。數據是人類文明史上的第三個重要的Power,之前的兩個Power是蒸汽能(Steam Power)和電能(Electric Power),它們分別引發了第一次和第二次工業革命。如果說蒸汽能和電能造就了從西方世界開始的兩百多年的工業文明,數據能(Data Power)將把人類帶入數字文明時代。數據是數字經濟發展的重要生產要素,這個生產要素不同於土地、勞動力,也不同於資本、技術。如果要給數據找一個恰當的比擬物,也許隻有19世紀末偉大的發明家尼古拉·特斯拉發明的交流電。數據是新時代的交流電,就像20世紀,交流電給世界帶來的深刻變化一樣,隨著人們對數據能(Data Power)認識的提高,我們將進入一個“未來已來,一切重構”的時代。數據學院就像一百多年前的電力學院或電氣學院。
    怎麼辦數據專業?我們數據學院脫胎於軟件工程學院,在此以前還有計算機科學與工程學院,數據相關的研究和偏向管理的圖書情報方向的信息繫統學科及專業也密切相關,應用數學、概率統計更是數據分析和處理的理論基礎,不可或缺。到底什麼樣的專業纔算是數據專業?起初的時候,這對我們來說基本上可以說是一個“靈魂拷問”。為此,我們發起成立了由國內十五所高校三十多位知名教授組成的“高校數據科學與工程專業建設協作組”。
    並且以協作組成員為班底,成立了數據科學與工程繫列教材編委會,除了協作組成員,還邀請了多位有豐富教材編寫經驗的華東師範大學教師加入編委會,共同策劃教材的內容安排。
    我們相信,有了先進的理念,再加上集體的力量,數據專業建設的探索之路就能走通。截至2020年11月,協作組已經召開了四次研討會,確定了被稱為CST的專業建設路線圖,C代表Curriculum(培養計劃),S代表Syllabus(課程大綱),T代表Textbook(教材建設)。在得知我們的工作後,ACM/IEEE計算機工程學科規範主席約翰·因帕利亞佐(John Impagliazzo)教授邀請我們參與了ACM/IEEE數據科學學科規範的制定。協作組經過討論達成共識:專業課程分為基礎課、核心課、方向課三類,核心課是體現專業區分度的一組課程。與數據專業(DSE)最相近的專業就是計算機科學與工程(CSE)及軟件工程(SE)兩個專業,我們確定的第一批DSE區別於CSE和SE 的8門核心課程是:數據科學與工程導論、數據科學與工程數學基礎、數據科學與工程算法基礎、應用統計與機器學習、當代數據管理繫統、當代人工智能、分布式計算繫統、雲計算繫統。隨後我們又確定兩門課納入這個繫列,分別是:區塊鏈導論——原理、技術與應用,數據中臺初階教程。數據專業作為一個新專業,三類課程的邊界還不清晰,我們將關注重點放在核心課程上面,核心課有遺漏的知識點可以納入基礎課或方向課。這樣可以保證知識體繫的完整性,簡單起步,快速迭代。隨著實踐和認識的深入,逐漸明晰三類課程的邊界,形成完善的培養計劃。
    教材為什麼很重要?建設好一個專業,確定培養計劃和課程體繫固然很重要,但落實在根本上是教材。一套好的教材是建成一個好的專業的前提。放眼看去,無論是國內還是國外,無論是具體某個高校還是國家區域層面,這都是不爭的事實,即好的專業都有成體繫的好的教材。當然,現在的教材已經不僅僅指單純的一本教科書,還有深層次的內容,比如說具體的教學內容和教學方式。我們都知道,教材是知識的結晶,是站到巨人肩膀上的臺階。在自然科學領域,確實如此,一百年前我們民族的仁人志士呼喚“賽先生”,在中華大地上科學的傳播帶來了翻天覆地的變化。在更廣泛的領域,教材也還是技術、工藝和文化的傳承,是產業發展的助推器。拿信息技術來舉例,技術的源頭和產業的發祥地都在美國和歐洲,像IBM、Lucent、Oracle等跨國企業在我國商業上取得的巨大成功無一不與他們重視教材開發密切相關。試想一下,我們的學生在課堂上學的都是他們研究和研發的東西,等走上工作崗位,自然會對熟悉的技術和繫統有親近感,這應該是產業或產品生態最重要的一個環節。21世紀以來,隨著互聯網的蓬勃發展,人們已經深刻認識到,互聯網改變世界。在人類的文明史上,沒有任何一項科研成果像互聯網這樣深刻地改變人、改變世界。互聯網之所以能改變世界,是因為它真正發揮了數據的威力。互聯網實現了信息技術發展從“以計算為中心”到“以數據為中心”的路徑轉變。用“昔日王謝堂前燕,飛入尋常百姓家”來形容很多我們以前甚至當前教材上的一些內容,可以說毫不為過。以互聯網為代表的新型產業的發展,極大地推動了技術的進步,我們已經到了可以編寫自己的教材,形成自己的技術體繫和科學理論體繫的時候了。我們是現代科學的後來者,已經習慣了從科學到技術再到應用的路徑,現在有了成功的應用,企業也發展出了領先的技術,學界可以在此基礎上發展出技術體繫和科學理論體繫,應用、技術和科學的聯動纔是真正的創新之路。
    對人纔培養有什麼貢獻?在信息技術領域,迄今為止我們更多地是參考或沿襲了西方發達國家的培養計劃和教材體繫。在改革開放以來的四十年,這種“拿來主義”的做法很有效,培養了大量的人纔,推動了我國的社會經濟發展。但總的來說,我們的高校在這一領域更像是在培養“駕駛員”,培養開車的人,現在到了需要我們來培養自己的造車人的時候了。技術發展趨勢如此,國際形勢也對我們提出了這樣的要求。我們處在一個大變局的時代,世界充滿不確定性,開放和創新是應對不確定性的不二之選。創新成為人纔培養的第一性原理,更新觀念、變革教育、卓越育人是我們華東師範大學新時期人纔培養的基本理念。人纔培養是大學的第一要務,科學研究、社會服務和文化傳承是大學的另外三大職能,大學通過這三大職能的實現可以更好地服務於人纔培養。人工智能時代最稀缺的是想像力,想像力是比知識更重要的東西。如何在傳播知識、傳承文化的同時,保護和激發學生的想像力,這也許是當前教育需要關注的。激發想像力,培養創新能力,這是數據專業核心課程繫列教材建設的指導思想,我們願意為之付出,久久為功地建設這套數據專業核心課程繫列教材就是我們踐行以上認識和理解的一個具體行動。
    最後,要特別表示感謝。感謝華東師範大學出版社和高等教育出版社的支持和鼓勵,感謝數據科學與工程專業建設協助組的各位老師的通力協作和辛勤勞動,也要感謝數據學院師生的信任和付出。心有所信,方能行遠;因為相信,所以看見。希望作為探路者而付出的所有艱辛能夠成為我們學術和事業生涯中的一筆重要財富。
    “The best way to predict the future is to invent it.”—— Alan Kay
    “Imagination is more important than knowledge. For knowledge is limited to all we now know and understand, while imagination embraces the entire world, and all there ever will be to know and understand.” ——Albert Einstein

    2020年11月
    查看全部↓

    前言/序言

    中國大陸首家迪士尼樂園已於2016年6月在上海盛大開園營業,樂園擁有七大主題園區:米奇大街、奇想花園、探險島、寶藏灣、明日世界、夢幻世界、玩具總動員;兩座主題酒店:上海迪士尼樂園酒店、玩具總動員酒店;一座地鐵站:迪士尼站;並有許多全球首發遊樂項目。
    不太嚴謹地說,可以把一門導論類課程比之於遊覽迪士尼的導遊。遊客可能希望在入門之前,就有熟悉情況的人作一個總的介紹,特別是提醒他哪些是要緊之處,以便遊覽時心中有底。希望這本關於“數據科學與工程”的導論教材能對讀者起到一點這種“導遊”的作用。
    更重要的是,我們希望通過該教材解決這門課程的知識結構以及核心問題。我們要回答的是:什麼是數據科學?什麼是數據工程?數據科學與大數據的關繫又是什麼?如何進行這門課程的實踐?諸如此類。在這個大背景下,我們將用建設一門專業基礎課程的方式來思考上面這些問題。無論你是老師還是學生,無論你是研究人員還是工程師,無論你是教育者還是實踐者,隻要你對數據感興趣,相信都會在這門課程中學到很多你所不知道、同時又有趣的東西。
    過去幾十年,互聯網、雲計算和物聯網得到了蓬勃發展,信息技術得到極大的普及與應用。未來若干年,數據科學與人工智能將迎來人類有史以來最美妙的春天,一個數據與智能復興的時代!阿爾法狗圍棋賽戰勝了人類,這一事件不僅僅是一次人機之間的娛樂活動,它更是開啟了一個新的數據科學時代。
    本教材定位為數據專業的入門課程教材,為學生搭建起通向“數據科學與工程知識空間”的橋梁和紐帶。教材將繫統梳理總結數據科學與工程的相關原理、技術和實踐案例,幫助學生形成對數據科學與工程知識體繫及其應用領域的輪廓性認知,為學生在該領域“深耕細作”奠定基礎、指明方向,最終形成數據思維。截至2019年3月,教育部批準了477所高校設立“數據科學與大數據技術”專業,682所職校設立“大數據技術與應用”專業,這種前無古人的做法充滿了挑戰與機遇。無論如何,數據學科開始像當年的計算機學科一樣生根發芽,作為人工智能時代的核心備受矚目。
    然而,作為一門年輕得不能再年輕的學科,數據科學與工程究竟是什麼?會發展成為什麼樣子?它與計算機科學、軟件工程、統計學等學科究竟有什麼樣的區別與聯繫?現階段,對這些問題的回答無疑還是有些困難的,就像當年的計算機學科一樣。隻有在經歷了一段長時間的沉澱,以及大量反復的實踐後,一個新學科纔能真正成為一個強學科。
    這本教材以及與之對應課程的目標包括:
    ●了解數據專業全貌,建立數據思維的意識;
    ●掌握數據科學與工程的基本內涵和應用模式;
    ●培養以數據為中心的問題求解能力,繫統性地學習數據科學與工程的核心原理與關鍵技術;
    ●培養開源開放的精神,建立基於開源工具的數據分析與處理意識,並完成初步的數據編程訓練;
    ●讓大家感受到數據與計算的美,數據與計算的愉悅;
    ●點燃大家對數據專業的熱情與興趣!
    最後兩點無疑是重要的,也是作為一門導論類課程的核心,是一門卓越課程的最高追求。
    數據專業作為一個新工科專業(也有少數學校將其歸為理科或經管類),工程實訓的重要性不言而喻。隨著教育技術的發展,大規模的在線實訓開始成為可能。為此,在在線實訓平臺的協助下(感謝KFCoding提供的支持!),本教材所配套的實訓課將會貫穿到整個學習過程中。
    作為一個交叉性學科,在計算機科學、信息管理、統計學等學科前輩的幫助下,數據學科的知識體繫已經有了一個基本的輪廓,但還需要細化、發展和完善,這個是一個學科之所以能夠成為一個學科的關鍵所在。
    現階段,僅從對應的課程來說,我們認為,數據科學與工程是以數據為中心,通過計算思維與數據思維的方法,來理解我們所處的世界(科學),以及對現實問題的求解(工程)。其最重要的思維方式是數據思維,簡單來說就是以數據為中心的問題求解。這將是縱貫整本教材最重要的一條線。
    教材的整體框架和概要如下所示,總共包括四大部分:數據科學與工程概述、數據與計算的基礎設施、數據分析的原理與方法,以及數據應用與社會問題。

    這些內容通過五條線貫穿起來:
    1. 數據思維:第1章“緒論”介紹了信息文明與數據簡史、數據科學與工程的基本內涵、第四範式,以及數據科學與工程的應用;第2章“數據思維與問題求解”介紹問題求解與思維方式、計算思維與數據思維以及相關實例。
    2. 數據、計算與基礎設施:第3章“數據的模型與結構”介紹了比特與數據、數據的二進制表示、數據的模型、數據的結構;第4章“數據的計算與程序表達”介紹了數據算法、算法分析與局限性、數據結構與算法的關繫、計算機編程語言;第5章“計算基礎設施”介紹了通用機器的思想、程序是如何執行的、計算機繫統結構、雲計算與數據中心;第6章“數據的全生命周期管理”介紹了數據采集、數據存儲、數據管理、數據計算、數據分析、數據展示;第7章“數據庫繫統”介紹了數據庫的起源與發展、關繫數據庫、數據倉庫與OLAP、數據管理技術新格局、結構化查詢語言SQL;第8章“大數據繫統”介紹了大數據的基本概念、Hadoop和Spark生態、SQL與Hadoop的組合、大數據繫統實例。
    3. 分析方法:第9章“數據科學過程”介紹了數據科學過程基礎、數據科學工作流;第10章“統計分析的原理”介紹了數據科學的數學基礎、概率與統計基礎、統計建模;第11章“機器學習方法”介紹了機器學習的發展歷史、機器學習的方法、機器學習的最新發展;第12章“深度學習”介紹了深度學習的基本概念、深度學習的拓展、深度學習的應用、深度學習的工具;第13章“數據挖掘基礎”介紹了數據挖掘的概念、數據挖掘標準流程、數據挖掘的技術、大數據挖掘;第14章“非結構化數據挖掘”介紹了自然語言處理、語音信號處理、圖像處理與理解。
    4. 應用與社會規範:第15章“數據綜合應用”介紹了數據科學與工程在搜索引擎、智能運維、開源數字年報中的綜合應用;第16章“數據道德與職業行為準則”介紹了我們處於一個開放的世界、職業規劃、數據隱私與社會問題。
    5. 開源實踐:每個章節中,我們均選取了主流的開源編程語言與軟件工具,指導大家充分地在數據上進行實踐,主要包括:Python語言、SQL語言、Hadoop、 KNIME工具等。
    各個章節的實踐內容、實踐語言與實踐工具如下表所示:
    序號(章節)實踐內容語言和工具
    實踐1以Git與Python為中心Git/Python
    實踐2Python問題求解Python
    實踐3Python數據結構Python
    實踐4Python算法Python
    實踐5基礎設施數據采集與分析Python
    實踐6Python網絡爬蟲Python
    實踐7SQL數據處理與分析SQL/MySQL
    實踐8Hadoop與Spark大數據處理Hadoop/Spark
    實踐9KNIME數據科學工作流KNIME
    實踐10Python統計分析Python
    實踐11Python機器學習Python
    實踐12Python手寫漢字識別Python
    實踐13Python圖像分類Python
    實踐14Python文本數據挖掘Python
    如果上面的某些點能夠讓你感興趣,不要猶豫,加入我們,一起來探索數據科學與工程的美妙世界,一起來見證這個代表著未來時代發展的新專業的成長。
    科技的源頭就是科學,信息技術的發展造就了當下的大數據與數據科學。今天,我們都在義無反顧地擁抱數據,呼喚著數據的視野、數據的思維與數據的想像,這一次,我們將向數據科學與工程尋根究底、理清源流。
    我們在每章內容後配套了豐富的習題材料幫助讀者進行復習、思考和實踐等活動,主要包括下面三個類型的習題材料:
    ●復習題:幫助讀者復習本章的一些基本核心概念,有的從章節內容中基本上就可以找到對應答案,有的則需要讀者查找一些課外資料,甚至包括一些開放問題。
    ●踐習題:圍繞本章內容,結合對應的編程語言或工具,開展動手實踐的活動,動手實踐已經成為新工科背景之下課程內容的必要組成部分。
    ●研習題:閱讀所推薦的學術論文,深度調研與本章內容相關的話題,培養讀者學術論文閱讀與理解的能力,從中也可以找到很多數據科學與工程領域的最新前沿內容。
    本書在編寫過程中,參考和引用了大量國內外的著作、論文和研究報告。由於篇幅有限,本書僅僅列舉了主要的參考文獻。作者向所有被參考和引用相關文獻的作者表示由衷的感謝,他們的辛勤勞動成果為本書提供了豐富的資料。如果有的資料沒有查到出處或因疏忽而未列出,請原作者見諒,並請告知我們,以便再版時補上。
    衷心感謝華東師範大學出版社和高等教育出版社的工作人員,從本書的策劃開始,多次滿足我們在書稿上的各種苛刻要求,正是在他們無數次的幫助下,纔使本書順利出版。特別感謝華東師範大學數據科學與工程學院的同仁,大家的幫助和指導使得該書能夠按時出版;還要感謝Xlab開放實驗室的所有成員,特別是周添一、蘇斌、黃立波、範家寬、吳佳潔、楊尚輝、王皓月等同學,他們給本書的編寫提供了極大的幫助;同時感謝錢衛寧、周烜、金澈清、高明、陳志雲、白玥、朱晴婷和胡文心等老師為本書的審稿工作做出了巨大的貢獻。
    蘇軾在《稼說》一文中提出學習的主張“博觀而約取,厚積而薄發”,這是我們多年教育工作的共鳴,其精髓就是勤於積累和精於應用。一個好的教育,是一個靈魂對另一個靈魂的呼喚;一門好的課程,是一個生命對另一個生命的踫撞。
    最後,歡迎讀者關注我們的公眾號(嘉數彙:微信公眾號Datahui),獲取配套的課件、擴展閱讀材料以及實踐資料等。
    作者
    2020年8月於上海
    查看全部↓



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部