●章 緒論
1.1 研究背景
1.2 多媒體程序並行特征分析
1.3 短向量計算相關體繫結構研究
1.3.1 通用處理器中的短向量計算
1.3.2 單片同構/異構多核處理器
1.3.3 支持多媒體計算的流處理器
1.4 本書工作和創新點
1.5 本書結構
第2章 多粒度短向量計算多核結構
2.1 多粒度短向量計算考慮
2.1.1 數據級並行計算考慮
2.1.2 指令級並行計算考慮
2.1.3 線程級並行計算考慮
2.2 短向量計算多核互連
2.3 短向量計算多核存儲繫統
2.4 異構多核結構處理器――龍騰
第3章 支持高實時性響應的主控核研究
3.1 主控核高實時性響應分析
3.1.1 最差執行時間(WCET)估計
3.1.2 上下文切換分析
3.1.3 精確異常處理分析
3.1.4 高實時陛與處理性能分析
3.2 支持高實時陛響應的雙流水線結構模型
3.2.1 雙發射雙流水線結構與分析
3.2.2 基於影子寄存器的分布式精確異常處理
3.3 龍騰R2處理器設計
3.3.1 龍騰R2指令集選擇
3.3.2 龍騰R2微體繫結構
3.3.3 龍騰R2流水線設計
3.3.4 龍騰R2芯片物理實現
3.4 支持HRCore-Model的龍騰R2處理器
3.4.1 雙流水線結構實現及性能評測
3.4.2 精確異常處理設計
第4章 支持細粒度並行的短向量計算核研究
4.1 計算核細粒度並行分析
4.1.1 數據級並行粒度確定
4.1.2 指令級並行粒度確定
4.2 基於源操作數擴展的多粒度分裂式加法
4.2.1 短向量設計需求
4.2.2 分裂式結構分析
4.2.3 源操作數擴展
4.2.4 性能分析比較
4.3 計算核超標量控制設計
4.3.1 寄存器設計
4.3.2 讀數算法和重命名算法設計
4.3.3 流水線結構設計與分析
4.4 短向量設計
4.5 短向量(VPU)設計
第5章 基於特征參數的循環流數據預取研究
5.1 短向量循環流數據預取研究
5.2 短向量循環流數據預取評價
5.3 基於特征參數的循環流數據自適應預取引擎
5.3.1 LSAPE-IC的提出
5.3.2 LSAPE-IC的主要問題分析
5.3.3 LSAPE-IC的預取結構
5.4 LSAPE-IC性能評估
5.4.1 仿真平臺及測試程序
5.4.2 仿真結果及分析
第6章 多核間局部緊耦合共享數據通信研究
6.1 多核間共享數據通信分析
6.1.1 共享數據存儲一致性開銷分析
6.1.2 緩解存儲一致性牆的策略分析
6.1.3 基於消息傳遞的多媒體流處理
6.2 分布式輕量級主動推送緩衝區存儲結構
6.2.1 DLWAP-Buffer硬件結構
6.2.2 DLWAP-Buffer控制協議
6.2.3 基於DLWAP-Buffer的流水線模型分析
6.2.4 DLWAP-Buffer代價及對比分析
6.3 DLWAP-Buffer性能評估
6.3.1 多核仿真平臺設計
6.3.2 仿真應用程序移植
6.3.3 仿真結果及分析
第7章 結束語
7.1 本書所做的工作
7.2 關於進一步的研究
參考文獻
內容簡介
隨著大數據、人工智能、互聯網技術,以及集成電路芯片技術的不斷進步,與多媒體,如圖形、圖像信息有關的異構多核並行計算技術成為研究熱點。本書通過挖掘分析多媒體程序的應用特征,從數據級、指令級、線程級等維度對多媒體程序的硬件特征進行了分析,詳細介紹了面向多媒體計算的異構多核架構關鍵技術。主要內容包括異構多核架構分析、高實時性主控核技術、支持細粒度並行的短向量計算核、循環流數據預取技術以及異構多核間通信技術等,本書對相關領域的研究和應用具有很好的理論指導意義和應用價值。
本書內容豐富、文字精煉、可讀性好,可以成為航空電子繫統、微處理器設計、高性能計算等相關領域的管理人員、工程技術人員、研究人員的參考用書。此外,本書還可以作為高等院校研究生、本科生的教學用書或培訓教材使用。