您的位置:首頁>>智能設備

多核打游戲反而更慢?談CPU和游戲優化那點事

發布時間:2019-07-28 10:18:47  來源:太平洋電腦網    背景:

  隨著AMD銳龍的橫空出世,電腦CPU進入了多核震懾的時代。

  同一系列的產品,核心翻倍已經司空見慣,有爆料顯示Intel下一代CPU的i3將會配備4核8線程——這樣的CPU,三年前它的名字叫i7。

  而在高端系列中,核戰更是令人心驚膽戰,在售的AMD銳龍3900X的12核24線程已經足以令人倒吸一口涼氣,而即將上市的3950X更是配備了16核24線程,數框框愛好者們紛紛表示把持不住,高呼yes根本停不下來。

  然而多核CPU打游戲一定會更快嗎?不一定。排除頻率、架構IPC的差異,某些情況下多核CPU打游戲甚至會更慢——例如在某些情況下,AMD的12核新品3900X,某些游戲中要比8核的3700X更慢。

有測試顯示,核心更多、頻率更高的3900X在某些情況游戲表現不如3700X

有測試顯示,核心更多、頻率更高的3900X在某些情況游戲表現不如3700X

  要知道從規格來看,3900X全面壓倒3700X,且不說核心多了四個,連頻率也更高(3.8/4.6GHz vs 3.6/4.4GHz),3級緩存也翻了倍(64MBvs32MB),那為什么會出現多核玩游戲更慢的情況?

  今天就從這個現象出發,談談CPU和游戲優化的那點事吧。

  游戲的多核優化有多難?

  我們就先從游戲對多核心的優化談起吧。談游戲的優化,就繞不開對多核的支持。什么游戲對多核優化好、什么游戲只能一核有難、多核圍觀,一直是玩家們津津樂道的話題。

  為什么游戲在對多核心的優化上會出問題,而視頻壓縮等應用就能充分利用多核心?這和游戲的運行機制有關。

  為何游戲喜歡用單核心?

  視頻壓縮這類任務可以輕易做到并行計算,例如一個線程壓縮某個片段,另一個線程壓縮另一個片段,多核一起運作,最后壓縮完成所有片段,完整視頻也就壓縮完成了。

  而游戲的運行一般都是線性的,某一步的運算往往會和上一步息息相關,很難充分利用多個線程。

  例如在FPS游戲中,某個玩家被擊中產生傷害,那么這個傷害結果和子彈運行軌跡有關,需要先計算出子彈軌跡然后才能計算出傷害,這只能在一條線程中先后完成,無法通過多線程同時計算子彈軌跡和傷害。

  游戲想要充分利用多核,需要巧妙地將計算任務拆分成為多線程,例如不同的線程負責物理碰撞、AI行為等,技術門檻比較高,也得下更多功夫。基于此,目前仍有大量游戲未能充分利用CPU的所有核心。

  支持多核心一定優化好嗎?

  隨著時代的發展,越來越多游戲愿意在多線程優化上做出努力。

  例如前幾年,我們經常可以看到“i3默秒全”的情況,而現在的游戲大作已經將門檻提升至4核,雙核i3已經難堪大任。

  但盡管如此,仍會出現12核3900X表現不如8核3700X的情況,這又是為何?

  出現這種情況,主要在于CPU核心調度不合理。銳龍的架構比較特殊,每4個核心封裝成為一個CCX,每兩個CCX封裝為一個CCD,核心和核心之間的通訊,可以跨CCX,乃至跨CCD,而無論是CCX還是CCD之間通信,都存在延遲。

  換言之,如果一個程序能夠調用多個核心,會出現以下幾種情況。

  1、調用的多核心處于同一CCX內,延遲最小;

  2、調用的多核心跨CCX,但處于同一CCD內,有所延遲;

  3、調用的多核心跨CCX、跨CCD,延遲最大

  例如一個游戲可以調用4個核心,最理想的情況自然是調用同一CCX內的4核,這樣能獲得最好的性能。

  但實際上,代碼對多核心的調用不一定這么智能,很有可能不能辨認出哪些核心位于同一CCX上。于是,游戲可能會調用位于不同CCX、CCD的多個核心,產生的額外延遲導致性能有所損失。

  知道了這些,就可以解釋為什么有時候3900X的游戲表現有時候還要低于3700X了。3900X封裝了兩個CCD,每個CCD內有兩個CCX,每個CCX有4核心,原生共4x2x2=16核心,屏蔽了4核心后得12核。

  而3700X則只有一個CCD,內含兩個CCX,共4x2=8核。可見,3900X比3700X多了一個CCD,多了一種可能產生額外延遲的情況,如果游戲不能發揮出3900X的多核心優勢,那么3900X表現略遜于3700X也就在情理之中了。

  因此,即使游戲對多核進行了優化,但在核心調度方面,也需要另外下更多功夫,才能取得最佳性能。

  很高興的是,微軟已經意識到了相關問題,在Windows 10 1903中做出了優化,系統會優先調度處于同一CCX內的核心,避免跨CCX造成的延遲。

  如果你想要更好地發揮AMD Ryzen處理器的性能,升級到Windows 10 1903還是很有必要的。

  2CPU單核性能真的在擠牙膏?CPU單核性能真的在擠牙膏?有人認為,目前CPU已經很難從頻率上做性能突破,架構亦難以進一步提升效率,堆核是性能進步的唯一之道。

  有的朋友從Intel的“擠牙膏”中論證這一觀點,認為CPU的同頻性能已經多年止步不前,而AMD的Zen2架構盡管效率相對于前代大幅提升,但也只是追上競爭對手的水平而已。

  用數年前的4核CPU和現在的4核CPU玩游戲,體驗似乎并沒有什么不同,也是一個有力的佐證。但事實是否如此?

  實際上,這種觀點是片面的。之所以數年前的CPU在某些測試、某些游戲中表現尚可,是因為這些測試、游戲并沒有針對新CPU的指令集作出優化。

  近年來,新款CPU的一大價值在于增加了AVX、AVX2、TSX等指令集。

  如果代碼調用了相應指令集,能更高效地利用FMA這樣的浮點加乘混合單元,減少CPU流水線的閑置,性能表現可以獲得可觀的提升。

這些都可是近十年間陸續增加的指令集,不是說沒有堆核就是擠牙膏

這些都可是近十年間陸續增加的指令集,不是說沒有堆核就是擠牙膏

  以著名的渲染軟件Cinebench為例,這是DIY玩家都相當熟悉的CPU測試工具。

  最新版的Cinebench R20對比舊版的Cinebench R15,一大改進就是加入了AVX指令集的支持。

  在CPU對AVX指令集有較好支持的情況下,同樣的渲染項目,在Cinebench R20中跑,速度甚至要比Cinebench R15快一倍以上!新型指令集對性能的提升之巨,由此可見一斑。

Zen2的單核性能進步如此大,很大程度上是因為AVX2性能大幅提高

Zen2的單核性能進步如此大,很大程度上是因為AVX2性能大幅提高

  支持AVX或更新的指令集已經在渲染、視頻壓縮、科學計算等專業領域中漸漸成為常態,著名的Linux發行版Fedora 32甚至計劃不支持沒有AVX指令集的CPU。

  然而,仍有大量游戲未跟進AVX等新指令集,只支持老的SSE,新CPU跑這些游戲自然和舊款CPU沒有太大區別。在指令集支持方面,游戲對CPU仍缺乏應有的優化。

  著名的游戲性能測試組件3DMark已經意識到了這點。在新的Time Spy Extreme測試項目當中,加入了AVX、AVX2乃至AVX512指令集支持,調用AVX512指令集跑分,成績對比SSE3跑出來的分數高了一倍有余。

  AVX等新指令集在實際游戲中意義也變得越來越重大,例如《刺客信條:奧德賽》甚至不支持沒有AVX指令集的CPU(因為太激進,后來不得不重新兼容老CPU)。

  又例如某些使用了D加密的游戲需要FMA3指令集才能正確解密運行,早年的“神U”E1230 v2只能干瞪眼;如果你是PS3模擬器玩家,也有切身體會過TSX指令集下性能的飛躍。

  總體而言,大部分游戲在指令集方面的優化做得依然不夠,在缺乏指令集優化的情況下,舊CPU和新CPU的游戲表現拉不出太大差距。

  但支持新指令集是游戲對CPU優化中無法規避的環節,活用新指令集才能彰顯新款CPU應有的價值,希望有更多游戲對新的CPU指令集作出優化吧。

  后話

  無論是增加CPU核心多線程,還是使用新型指令集提升SIMD性能,都可以大大增強CPU的性能。

  就消費市場而言,AMD似乎更多地走了多核路線,而Intel則致力于推行新指令集。但無論是哪種發展方向,都需要相應的軟件對此作出優化,才能發揮出CPU應有的性能。

  現在早已經不是不改一行代碼就能發揮出新CPU的全部性能的時代,多核心和先進指令集,限于匱乏游戲支持的現狀,都不得不淪為“戰未來”。

  CPU并沒有在“擠牙膏”,游戲對CPU的優化也遠未到盡頭,希望未來我們能看到更多能發揮出CPU真正功力的游戲吧。

特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。


返回網站首頁 本文來源:太平洋電腦網

本文評論
曝華為P40系列將發鴻蒙和安卓兩個系統版本 后置5攝像頭
近日,有博主在推特爆料,華為P40系列手機將會有鴻蒙系統和安卓系統兩個版本。不出意外的話,應該是...
日期:10-19
華為全新MediaPad M7渲染圖釋出:首度采用打孔屏設計
10月19日消息 據外媒報道,華為目前正在開發一款采用打孔屏設計的平板電腦,預計這將會是業內首款采...
日期:10-19
精英手柄北通宙斯 雙平臺鏈接并支持NS
北通宙斯游戲手柄又公布了全新的功能,這次北通宙斯游戲手柄正式宣布,除了傳統的PC平臺外將會支持...
日期:10-19
adolbook14的漸變時尚感 鋼鐵直女也為之沉醉
作為首款實現金屬漸變設計的adol輕薄筆記本,adolbook14的熱度從上市起就居高不下。新穎時尚的設計...
日期:10-19
聯想攜手創業邦為中小企業提效,ThinkVision智能大屏重磅推出
2019年10月18日,北京——日前,聯想攜手創業邦在京舉行“提效行動派”會員特...
日期:10-18
一文盡懂 USB4
今年3月份,USB Promoter Group(領導小組)首次發布了USB4規范,即下一代USB架構。而在9月初,USB Pr...
日期:10-18
OPPO Reno Ace斬獲全平臺銷量&銷售額雙冠軍,是誰買走了它
10月17日,OPPO Reno Ace搶先購正式開啟,短短5分鐘的時間,銷售額就已經破億元,斬獲全平臺手機單...
日期:10-18
華為Mate 30攝像功能完勝?轉轉投票結果顯示:近3成網友力挺iPhone 11 Pro
冷空氣來得猝不及防,轉眼北方已經入秋,但手機市場仍然延續著夏天般的火熱。
日期:10-18
教科書般的大屏輕薄筆記本,17英寸LG gram全面體驗
“輕薄本”這個概念已經在筆記本市場上提出了好幾年,不少朋友也正是奔著這個品類,將臺...
日期:10-18
一加7T系列外媒點評:用過90Hz流體屏就回不去了
近日,一加7T系列新品發布會在北京舉行,一加7T、一加7T Pro同臺發布。一加7T系列全系搭載90Hz流體屏,...
日期:10-18
三星Galaxy Note10+5G版將推出周仰杰博士手工定制版
10月18日消息 昨日三星GALAXY蓋樂世官方宣布,將推出三星Galaxy Note10+5G版手機的周仰杰博士手工定...
日期:10-18
三星明年發屏下攝像頭手機 不過不是S11
原標題:三星明年發屏下攝像頭手機 不過不是S11
日期:10-18
索尼Xperia 5測評:設計更緊湊,體驗又上了一步
在今年年初索尼Xperia 1發布時,我便看到了“One Sony”戰略的曙光。這部手機集結了索尼...
日期:10-18
十代酷睿高性能!聯想威6 2020預售開啟
預付100元可狂抵600元現金使用!開售當日購買僅需3999元!
日期:10-18
谷歌Pixel 4面部解鎖功能存在重大安全漏洞:閉眼也能解鎖
10月18日消息 谷歌的Pixel 4系列已于幾天前推出,但現在外媒已經發現了新設備面部解鎖功能的一些問...
日期:10-18
realme X2 Pro今日開售
(原標題:realme X2 Pro今日開售:90Hz流體屏+50W閃充,2699元起)
日期:10-18
iPhone 11熱賣 市場需求提升
(原標題:報告:iPhone11將蘋果手機中國市場需求提升230% 主要是便宜)
日期:10-18
三星明年發布首款屏下攝像頭手機,但并非是S11或Fold 2
10月17日消息 三星計劃在2020年推出一款顯示屏下攝像頭的新型智能手機。
日期:10-17
OPPO Reno Ace搶先購,線上購機線下1小時送貨上門
10月17日,OPPO Reno Ace搶先購活動正式開啟,OPPO K5也正式首銷。對于這兩款分別在中高端領域中,...
日期:10-17
靈動智美 戴爾Latitude二合一系列新成員面世
在移動辦公逐漸成為趨勢的今天,僅僅一臺普通的筆記本電腦有時已經不能滿足各種場景下的辦公需求,...
日期:10-17
  專欄介紹
王涵 的專欄
王涵發表的文章
積分:
自我介紹 :
 
欢乐捕鱼大战怎么获得冰冻道具 开心棋牌最新安卓版下载 黑龙江十一选五片结果 大乐透开奖结果 福建十一选五开奖软件 辽宁快乐12 博远棋牌网站最全网站 国中高频彩 哈尔滨体育彩票官网下载 网络卖房子能赚钱吗 体彩浙江20选5玩法