溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Intel CPU指令集以及運算加速

發布時間:2020-07-05 12:05:16 來源:網絡 閱讀:980 作者:fengyuzaitu 欄目:軟件技術

前沿

???????? ? 人工智能運算分析依賴CPU和顯卡的運算能力 。查詢CPU支持的指令集,當前加速會用到AVX2指令集,如何查詢是否支持


工具下載

https://www.cpuid.com/softwares/cpu-z.html

AMD Ryzen Threadripper 3000 preliminary support
Intel Ice-Lake preliminary support
NVIDIA RTX 2070 and 2080 Super

下載ZIP.CHINESE
https://www.cpuid.com/downloads/cpu-z/cpu-z_1.90-cn.zip


Linux的查詢指令cat /proc/cpuinfo?


知識儲備

AVX2指令集:AVX指令集的加強版
   對于指令集和AVX指令集不了解的朋友可以先看看《AVX是什么?AVX指令集技術與應用解析》。當年AVX在SSE4指令集的基礎上加入了256位矢量寬度、增強的數據排序、3/4個操作數、不對齊內存存取以及VEX編碼方式,最直接的收益就是浮點性能最大提升了2倍。

AVX2的新內容
   在2011年發布的AVX2則在此基礎上加入了以下新內容:
  -整數SIMD指令擴展至256位
  -2個新FMA(融合乘加,即±(a×b)±c)單元及浮點FMA指令
  -離散數據加載指令“gather”、新的位移和廣播指令
理論性能:整數和浮點性能翻倍
  其中最為重要的是對256位的整數SIMD的支持,并新增60條256位浮點SIMD指令,完善從AVX開始的256位擴展,理論上可再次提升整數和浮點運算速度。

新FMA單元和指令帶來更強的性能
   FMA則關系到浮點運算能力。Haswell架構中擁有2個新的FMA單元(Intel的FMA3指令),每個FMA單元支持8個單精度或4個雙精度浮點數,每周期單/雙精度FLOPs都要比AVX高1倍。
   FMA擁有20種指令形式,與3種操作數次序組合,形成60種新指令,為選擇內存操作數或目的操作數提供了極大的靈活性。另外融合乘加還會自動選擇多項式的計算過程,降低了延遲。

?

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女