了得網計算機/網絡_Spark高級數據分析(影印版)(英文版)

	[ 收藏 ] [ 繁体中文 ]
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款，4-7個工作日送達，999元臺幣免運費　　　在線留言商品價格為新臺幣

計算機周邊

商品搜索

类别：

关键字：

商品分类

　管理

　一般管理学
　市场/营销
　会计
　金融/投资
　经管音像
　电子商务
　创业企业与企业家
　生产与运作管理
　商务沟通
　战略管理
　商业史传
　MBA
　管理信息系统
　工具书
　外文原版/影印版
　管理类职称考试
　WTO
　英文原版书-管理

　投资理财

　证券/股票
　投资指南
　理财技巧
　女性理财
　期货
　基金
　黄金投资
　外汇
　彩票
　保险
　购房置业
　纳税
　英文原版书-投资理财

　经济

　经济学理论
　经济通俗读物
　中国经济
　国际经济
　各部门经济
　经济史
　财政税收
　区域经济
　统计审计
　贸易政策
　保险
　经济数学
　各流派经济学说
　经济法
　工具书
　通货膨胀
　财税外贸保险类考试
　英文原版书-经济

　社会科学

　语言文字
　社会学
　文化人类学/人口学
　新闻传播出版
　社会科学总论
　图书馆学/档案学
　经典名家作品集
　教育
　英文原版书-社会科学

　哲学

　哲学知识读物
　中国古代哲学
　世界哲学
　哲学与人生
　周易
　哲学理论
　伦理学
　哲学史
　美学
　中国近现代哲学
　逻辑学
　儒家
　道家
　思维科学
　马克思主义哲学
　经典作品及研究
　科学哲学
　教育哲学
　语言哲学
　比较哲学

　宗教

　心理学

　古籍

　经部　史类　子部　集部　古籍管理　古籍工具书　四库全书　古籍善本影音本　中国藏书

　文化

　文化评述　文化随笔　文化理论　传统文化　世界各国文化　文化史　地域文化　神秘文化　文化研究　民俗文化　文化产业　民族文化　书的起源/书店　非物质文化遗产　文化事业　文化交流　比较文化学

　历史

　历史普及读物
　中国史
　世界史
　文物考古
　史家名著
　历史地理
　史料典籍
　历史随笔
　逸闻野史
　地方史志
　史学理论
　民族史
　专业史
　英文原版书-历史
　口述史

　传记

　文学

　艺术

　摄影
　绘画
　小人书/连环画
　书法/篆刻
　艺术设计
　影视/媒体艺术
　音乐
　艺术理论
　收藏/鉴赏
　建筑艺术
　工艺美术
　世界各国艺术概况
　民间艺术
　雕塑
　戏剧艺术/舞台艺术
　艺术舞蹈
　艺术类考试
　人体艺术
　英文原版书-艺术

　青春文学

　文学

　中国现当代随笔
　文集
　中国古诗词
　外国随笔
　文学理论
　纪实文学
　文学评论与鉴赏
　中国现当代诗歌
　外国诗歌
　名家作品
　民间文学
　戏剧
　中国古代随笔
　文学类考试
　英文原版书-文学

　法律

　小说
　世界名著
　作品集
　中国古典小说
　四大名著
　中国当代小说
　外国小说
　科幻小说
　侦探/悬疑/推理
　情感
　魔幻小说
　社会
　武侠
　惊悚/恐怖
　历史
　影视小说
　官场小说
　职场小说
　中国近现代小说
　财经
　军事

　童书

　成功/励志

　政治

　军事

　科普读物

　计算机/网络

　程序设计
　移动开发
　人工智能
　办公软件
　数据库
　操作系统/系统开发
　网络与数据通信
　CAD CAM CAE
　计算机理论
　行业软件及应用
　项目管理 IT人文
　计算机考试认证
　图形处理图形图像多媒体
　信息安全
　硬件
　项目管理IT人文
　网络与数据通信
　软件工程
　家庭与办公室用书

　建筑

　执业资格考试用书　室内设计/装潢装修　标准/规范　建筑科学　建筑外观设计　建筑施工与监理　城乡规划/市政工程　园林景观/环境艺术　工程经济与管理　建筑史与建筑文化　建筑教材/教辅　英文原版书-建筑

　医学

　中医
　内科学
　其他临床医学
　外科学
　药学
　医技学
　妇产科学
　临床医学理论
　护理学
　基础医学
　预防医学/卫生学
　儿科学
　医学/药学考试
　医院管理
　其他医学读物
　医学工具书

　自然科学

　数学
　生物科学
　物理学
　天文学
　地球科学
　力学
　科技史
　化学
　总论
　自然科学类考试
　英文原版书-自然科学

　工业技术

　环境科学
　电子通信
　机械/仪表工业
　汽车与交通运输
　电工技术
　轻工业/手工业
　化学工业
　能源与动力工程
　航空/航天
　水利工程
　金属学与金属工艺
　一般工业技术
　原子能技术
　安全科学
　冶金工业
　矿业工程
　工具书/标准
　石油/天然气工业
　原版书
　武器工业
　英文原版书-工业技

　农业/林业

　园艺　植物保护　畜牧/狩猎/蚕/蜂　林业　动物医学　农作物　农学(农艺学) 　水产/渔业　农业工程　农业基础科学　农林音像

　外语

　考试

　教材

　工具书

　中小学用书

　中小学教科书

　动漫/幽默

　烹饪/美食

　时尚/美妆

　旅游/地图

　家庭/家居

　亲子/家教

　两性关系

　育儿/早教

　保健/养生

　体育/运动

　手工/DIY

　休闲/爱好

　英文原版书

　港台图书

　研究生
　 工学
　 公共课
　 经济管理
　 理学
　 农学
　 文法类
　 医学

　音乐
　 音乐理论

　声乐　通俗音乐　音乐欣赏　钢琴　二胡　小提琴

Spark高級數據分析(影印版)(英文版)
該商品所屬分類：計算機/網絡 -> 數據庫
【市場價】	488-707元
【優惠價】	305-442元
【介質】	book
【ISBN】	9787564159108
【折扣說明】	一次購物滿999元台幣免運費+贈品一次購物滿2000元台幣95折+免運費+贈品一次購物滿3000元台幣92折+免運費+贈品一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】	①優質無紡布環保袋，做工棒！②品牌簽字筆 ③品牌手帕紙巾

版本	正版全新電子版PDF檔
您已选择：	正版全新
溫馨提示：如果有多種選項，請先選擇再點擊加入購物車。 . 電子圖書價格是0.69折，例如了得網價格是100元，電子書pdf的價格則是69元。 . 購買電子書不支持貨到付款，購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意，可以聯絡我們退款。謝謝。

內容介紹

字體縮小

字體放大

出版社：東南大學
ISBN：9787564159108
作者：(美)裡扎
頁數：260
出版日期：2015-09-01
印刷日期：2015-09-01
包裝：平裝
開本：16開
版次：1
印次：1
字數：338千字

內容提要 

在裡扎等編著的《Spark高級數據分析（影印版
）（英文版）》這本實用書籍中，4位Cloude陽公司
的數據科學家講解了一繫列自包含模式，用於在
Spark中進行大規模數據分析。本書作者們把Spark、
統計原理和現實世界中的數據集合放到一起，通過實
例教你如何解決數據分析問題。
你將從Spark及其生態繫統的介紹開始，然後深
入運用標準技巧的模式——歸類、聚合過濾及異常檢
測等，這些技巧被用於生物基因、安全和金融等行業
。如果你對機器學習和統計學有初步了解，使用Java
、Pytton或者Scala編程，就會發現這些模式對於你
的數據分析應用程序會非常有用。
模式包括：
音樂推薦和Audioscrobbler數據集合
用決策樹分析森林覆蓋
用K均值聚合檢測網絡流量中的異常
用潛在語義分析理解維基百科
用GraphX分析共生網絡
用地理空間和瞬態數據分析紐約市出租車路線的
數據
用蒙地卡羅模擬來估計金融風險
分析基因數據和BDG項目
通過PySpark和Thunder分析神經造影數據
目錄 

Foreword
Preface
1. Analyzing Big Data
The Challenges of Data Science
Introducing Apache Spark
About This Book
2. Introduction to Data Analysis with Scala and Spark
Scala for Data Scientists
The Spark Programming Model
Record Linkage
Getting Started: The Spark Shell and SparkContext
Bringing Data from the Cluster to the Client
Shipping Code from the Client to the Cluster
Structuring Data with Tuples and Case Classes
Aggregations
Creating Histograms
Summary Statistics for Continuous Variables
Creating Reusable Code for Computing Summary Statistics
Simple Variable Selection and Scoring
Where to Go from Here
3. Recommending Music and the Audioscrobbler Data Set
Data Set
The Alternating Least Squares Recommender Algorithm
Preparing the Data
Building a First Model
Spot Checking Recommendations
Evaluating Recommendation Quality
Computing AUC
Hyperparameter Selection
Making Recommendations
Where to Go from Here
4. Predicting Forest Cover with Decision Trees
Fast Forward to Regression
Vectors and Features
Training Examples
Decision Trees and Forests
Covtype Data Set
Preparing the Data
A First Decision Tree
Decision Tree Hyperparameters
Tuning Decision Trees
Categorical Features Revisited
Random Decision Forests
Making Predictions
Where to Go from Here
5. Anomaly Detection in Network Traffic with K-means Clustering
Anomaly Detection
K-means Clustering
Network Intrusion
KDD Cup 1999 Data Set
A First Take on Clustering
Choosing k
Visualization in R
Feature Normalization
Categorical Variables
Using Labels with Entropy
Clustering in Action
Where to Go from Here
6. Understanding Wikipedia with Latent Semantic Analysis
The Term-Document Matrix
Getting the Data
Parsing and Preparing the Data
Lemmatization
Computing the TF-IDFs
Singular Value Decomposition
Finding Important Concepts
Querying and Scoring with the Low-Dimensional Representation
Term-Term Relevance
Document-Document Relevance
Term-Document Relevance
Multiple-Term Queries
Where to Go from Here
7. Analyzing Co-occurrence Networks with GraphX
The MEDLINE Citation Index: A Network Analysis
Getting the Data
Parsing XML Documents with Scala's XML Library
Analyzing the MeSH Major Topics and Their Co-occurrences
Constructing a Co-occurrence Network with GraphX
Understanding the Structure of Networks
Connected Components
Degree Distribution
Filtering Out Noisy Edges
Processing EdgeTriplets
Analyzing the Filtered Graph
Small-World Networks
Cliques and Clustering Coefficients
Computing Average Path Length with Pregel
Where to Go from Here
8. 6eospatial and Temporal Data Analysis on the New York City Taxi Trip Data
Getting the Data
Working with Temporal and Geospatial Data in Spark
Temporal Data with JodaTime and NScalaTime
Geospatial Data with the Esri Geometry API and Spray
Exploring the Esri Geometry API
Intro to GeoJSON
Preparing the New York City Taxi Trip Data
Handling Invalid Records at Scale
Geospatial Analysis
Sessionization in Spark
Building Sessions: Secondary Sorts in Spark
Where to Go from Here
9. Estimating Financial Risk through Monte Carlo Simulation
Terminology
Methods for Calculating VaR
Variance-Covariance
Historical Simulation
Monte Carlo Simulation
Our Model
Getting the Data
Preprocessing
Determining the Factor Weights
Sampling
The Multivariate Normal Distribution
Running the Trials
Visualizing the Distribution of Returns
Evaluating Our Results
Where to Go from Here
10. Analyzing Genomics Data and the BDG Project
Decoupling Storage from Modeling
Ingesting Genomics Data with the ADAM CLI
Parquet Format and Columnar Storage
Predicting Transcription Factor Binding Sites from ENCODE Data
Querying Genotypes from the 1000 Genomes Project
Where to Go from Here
11. Analyzing Neuroimaging Data with PySpark and Thunder
Overview of PySpark
PySpark Internals
Overview and Installation of the Thunder Library
Loading Data with Thunder
Thunder Core Data Types
Categorizing Neuron Types with Thunder
Where to Go from Here
A.Deeper into Spark
B.Upcoming MLlib Pipelines API
Index

網友評論我們期待著您對此商品發表評論

相關商品

在線留言 商品價格為新臺幣

關於我們送貨時間安全付款會員登入加入會員我的帳戶網站聯盟

DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.