●第1章大數據概述1
1.1研究背景1
1.2國內外研究概況2
1.2.1國內研究概況2
1.2.2國外研究概況3
1.3大數據理論5
1.3.1大數據定義5
1.3.2大數據特征6
1.4發展情況7
1.4.1國外發展情況7
1.4.2國內發展情況8
1.4.3大數據發展環境與策略8
1.4.4大數據產業發展狀況9
1.4.5大數據發展趨勢10
1.5大數據發展面臨的挑戰與機遇13
1.5.1大數據發展面臨的挑戰13
1.5.2大數據發展帶來的機遇14
1.6大數據應用15
1.7本章小結18
第2章雲計算概述19
2.1傳統數據中心19
2.1.1數據中心的概念19
2.1.2傳統數據中心的構建19
2.1.3傳統數據中心存在的問題21
2.2雲數據中心的構建21
2.2.1虛擬化22
2.2.2資源池化26
2.2.3自動化27
2.3數據中心的管理27
2.4雲計算概論30
2.4.1國內外研究發展現狀30
2.4.2雲計算發展歷程32
2.4.3雲計算的概念35
2.4.4雲計算的服務交付模式37
2.4.5雲計算的原理39
2.4.6雲計算的核心技術41
2.4.7雲計算部署方式43
2.4.8雲計算面臨的問題和機遇44
2.4.9雲計算的應用46
2.5雲計算平臺架構48
2.5.1雲計算平臺架構簡介48
2.5.2雲計算平臺架構的設計49
2.6雲計算的業界動態50
2.6.1IBM50
2.6.2 54
2.6.3Salesforce63
2.6.4Microsoft64
2.7雲計算的安全風險分析66
2.7.1雲計算平臺安全風險66
2.7.2數據安全風險66
2.7.3虛擬機引發的新安全風險67
2.7.4其他安全風險67
2.8本章小結68
第3章Hadoop概況69
3.1Hadoop的簡介69
3.2Hadoop的特點70
3.3HDFS分布式文件繫統70
3.3.1HDFS的架構70
3.3.2HDFS的數據組織方式72
3.3.3HDFS文件讀寫分析73
3.3.4HDFS的缺點74
3.4MapReduce分布式計算框架75
3.4.1MapReduce的執行流程76
3.4.2MapReduce的調度機制與容錯機制77
3.4.3MapReduce的性能78
3.5HBase分布式存儲查詢繫統79
3.5.1HBase架構80
3.5.2HBase的存儲82
3.5.3HBase的數據模型84
3.6Hive數據倉庫基礎架構86
3.6.1Hive的架構86
3.6.2Hive與傳統數據庫的比較87
3.7Zookeeper分布式協調服務88
3.8Hadoop的其他子項目89
3.8.1Avro數據序列化的繫統89
3.8.2Pig89
3.8.3Ambari89
3.8.4Sqoop91
3.9Hadoop的應用現狀92
3.10本章小結94
第4章網絡輿情的理論基礎95
4.1研究背景95
4.2網絡輿情的概念96
4.3網絡輿情的構成要素97
4.4網絡輿情的特點98
4.5網絡輿情的作用99
4.6網絡輿情演化過程與監控預警99
4.7相關理論基礎綜述100
4.7.1復雜網絡理論100
4.7.2群體行為理論105
4.7.3用戶影響力評價理論108
4.7.4社會網絡理論109
4.8本章小結111
第5章微博及其解釋結構模型的構建113
5.1微博的文本特性113
5.2微博文本的特征分析114
5.3微博用戶群體行為的解釋結構模型116
5.3.1影響微博群體行為的因素116
5.3.2解釋結構模型的確立122
5.3.3模型結論解釋與分析134
5.4本章小結134
第6章基於Hadoop的文本信息抽取繫統開發135
6.1背景135
6.1.1文本信息抽取繫統的意義與作用135
6.1.2目前網絡輿情監測相關的關鍵性技術136
6.2文本信息抽取繫統所采用的技術137
6.3文本信息抽取繫統的總體設計138
6.3.1繫統總體設計138
6.3.2主要功能模塊139
6.4繫統功能的具體實現141
6.4.1網絡爬蟲模塊的實現141
6.4.2Hadoop模塊實現146
6.4.3PHP模塊實現149
6.5繫統測試152
6.6本章小結154
第7章網絡輿情傳播網絡結構的研究155
7.1網絡信息傳播155
7.2微博網絡拓撲性質分析156
7.2.1復雜網絡特性156
7.2.2微博網絡度的分布156
7.2.3微博網絡拓撲結構對信息傳播的影響158
7.3網絡輿情的形成與傳播過程158
7.4微博用戶信息傳播能力分析159
7.4.1用戶自身屬性160
7.4.2社團密度160
7.5網絡輿情發展演化規律分析161
7.5.1網絡輿情發展過程與傳播主體分析161
7.5.2突發性公共危機事件網絡輿情演化路徑分析163
7.5.3內外源動力影響因素165
7.6微博輿情的信息傳播模型167
7.6.1微博輿情話題領域與用戶分類167
7.6.2微博輿情的信息傳播模型168
7.7不同領域的微博突發事件輿情實例分析170
7.7.1實驗數據集的采集170
7.7.2娛樂領域輿情實例分析170
7.7.3民生領域輿情實例分析177
7.7.4經濟領域輿情實例分析183
7.7.5各領域事件對比分析188
7.8本章小結189
第8章經濟領域網絡輿情傳播問題的研究191
8.1經濟領域突發事件網絡輿情的演進機制研究191
8.1.1經濟領域突發事件網絡輿情的演化模式191
8.1.2經濟領域突發事件網絡輿情作用要素分析193
8.1.3經濟領域突發事件網絡輿情的演化周期分析195
8.2突發事件網絡輿情的演進及仿真模型的構建分析197
8.2.1經濟領域突發事件網絡輿情演進傳播模型的構建197
8.2.2經濟領域突發事件網絡輿情演進傳播模型199
8.3經濟領域突發事件輿情實例分析203
8.3.1常規狀態下“3.17北京房市調控新政”案例203
8.3.2非常規狀態下“華萬股權之爭”案例210
8.4本章小結215
第9章網絡輿情的情感分析研究217
9.1文本情感分類基礎研究217
9.1.1文本分詞217
9.1.2文本表示方法218
9.2基於微博情感分析的網絡輿情熱點發現模型222
9.2.1模型設計223
9.2.2基於貝葉斯分類算法的情感分類器構造225
9.2.3基於詞共現圖的事件提取方法227
9.3生態領域的突發事件輿情實例分析229
9.3.1生態領域熱點內容分析229
9.3.2生態環境問題輿情案例分析230
9.3.3生態環境問題的輿情引導措施241
9.4本章小結245
第10章網絡輿情指標體繫設計與分析247
10.1Web數據特征分析247
10.1.1數據源特征分析247
10.1.2微博的數據模型248
10.1.3數據收集和管理248
10.2模型和數據指標的構建249
10.2.1突發事件網絡輿情數據主要分析指標249
10.2.2什麼是指標體繫250
10.2.3主要算法250
10.3突發事件網絡輿情監控預警指標體繫的設計250
10.3.1網絡輿情監測指標體繫框架設計250
10.3.2輿情發布者指標252
10.3.3輿情熱度指標253
10.3.4輿情受眾指標254
10.3.5輿情傳播指標254
10.3.6指標體繫權重繫數的確定255
10.4本章小結256
第11章網絡輿情預警機制研究257
11.1緒論257
11.1.1網絡輿情監控預警257
11.1.2存在的主要問題257
11.2突發事件網絡輿論的傳播機制258
11.2.1突發事件網絡輿論震蕩周期258
11.2.2突發事件網絡輿論的媒介路線261
11.2.3突發事件網絡輿論噪聲流的形成261
11.2.4突發事件網絡小世界特性262
11.2.5突發事件網絡中聯合度分布265
11.3基於情感計算的網絡輿情預警指標體繫266
11.3.1基於情感計算的網絡輿情預警指標體繫266
11.3.2網絡輿情預警指標的權重繫數267
11.4網絡輿情預警模型繫統構建269
11.4.1各個指標具體的情感值計算269
11.4.2綜合指標情感值計算270
11.4.3對於網絡輿情嚴重性的預警等級270
11.5以世界衛生組織關注中國疫苗事件及“辱母殺人案”為實證研究271
11.5.1取證過程及方法步驟271
11.5.2世界衛生組織關注中國疫苗事件272
11.5.3世界衛生組織關注中國疫苗事件輿情取證273
11.5.4世界衛生組織關注中國疫苗事件的數據抓取275
11.5.5“辱母殺人案”事件279
11.5.6“辱母殺人案”事件網絡輿情時間微輿情取證279
11.5.7“辱母殺人案”事件中情感指標的抓取和模型驗證283
11.5.8“辱母殺人案”事件人民日報發聲的取證研究286
11.6突發事件輿情演化的社會網絡分析290
11.6.1社會網絡分析方法的應用290
11.6.2突發事件輿情演進傳播的社會網絡結構圖290
11.7社會輿情發酵特點293
11.7.1焦點事件呈現區域與行業化分布293
11.7.2傳統媒體的“脫敏”效應294
11.7.3標簽化往往遭遇輿情反轉294
11.8本章小結295
第12章網絡輿情傳播的監管策略297
12.1提升網絡用戶的媒介素養297
12.2發揮意見領袖的輿論引導功能298
12.3加強信息把關制度299
12.4提高公眾在網絡輿情中的理性300
12.5建立網絡輿情預警對策301
12.6建立信息公開和輿論引導機制302
12.7本章小結303
參考文獻305