Смотрим, насколько полезным окажется L3-кэш в рамках микроархитектуры K10 в современных приложениях и играх.
Введение
В продолжении серии статей о тестировании первых 4-ядерных настольных процессоров в современном профессиональном и игровом программном обеспечении мы сегодня затронем вопрос о пользе L3-кеша в процессорах микроархитектуры K10. Напомним, что помимо 4-ядерных Phenom II X4 на чипах Deneb, уже протестированных ранее, во втором поколении микроархитектуры K10 появились ещё и 4-ядерные Athlon II X4 на чипах Propus, отличавшихся от чипов Deneb лишь отключенным L3-кэшем. Ход с отключением дефектного L3-кэша, занимавшего в Phenom II треть площади кристалла, и последующей реализацией полученных чипов под торговой маркой Athlon II позволил AMD существенно снизить стоимость своих 4-ядерных процессоров. Процессоры Athlon II X4 стоили в 1.5-2 раза дешевле Phenom II X4, при этом проигрывали им в производительности лишь 10-15%.
Здесь будет не лишним упомянуть, что как у первого, так и у во второго поколения 4-ядерных процессоров AMD имелись ещё и 3- и 2-ядерные "обрезки", выпускавшиеся под различными названиями (Phenom X3, Phenom II X3, Athlon II X3, Phenom II X2, Athlon II X2). Вся эта история с отключением кэша и ядер тянулась ещё с момента производства самых первых 2-ядерных чипов AMD, когда компания столкнулась со значительным количеством дефектов, для снижения издержек от которых на готовых изделиях приходилось выключать либо одно ядро, либо часть блоков кэш-памяти L2. Причём, второй метод был эффективнее, так как уже на тот момент времени более половины транзисторов в чипах были частью именно кэш-памяти, и если дефекты и имели место, то, вероятнее всего, именно в блоках кэш-памяти. Со временем, конечно, процент выхода годных 2-ядерных кристаллов возрос, но переход к производству 4-ядерных кристаллов, а затем ещё и на более тонком техпроцессе вновь сопровождался ростом количества дефектов. Благо, возможность отключать ядра и кэш-память (теперь уже, правда, L3) никуда не делась и всё ещё оставалась вполне эффективным способом снижения издержек производства. При этом 2- и даже 3-ядерные модели в рамках текущего исследования нам безынтересны, так как априори не обладают достаточной для современных игр производительностью, а вот на Athlon II X4 посмотреть было бы интересно.
В качестве конкурента протестированному ранее Phenom II X4 945 был выбран равный ему по частоте Athlon II X4 640. Так же для сравнения в диаграммы были добавлены результаты Phenom первого поколения, а именно Phenom X4 9950, частота которого ниже, а L3-кэш всё же имеется, пускай и объёмом меньшем, чем у Phenom II. Ну а кратким тест будет потому, что все процессоры будут протестированы исключительно в стоке.
Характеристики, тестовые стенды и методика тестирования
Характеристики участников тестирования сведены в следующую таблицу.
Phenom X4 9950
Athlon II X4 640
Phenom II X4 945
Краткое описание тестового стенда и методики тестирования приведено ниже под спойлерами.
Тестовый стенд
GIGABYTE GA-MA790X-UD3P
4x2 ГБ DDR2-1066 CL5 (Kingston HyperX, KHX8500D2)
ID-Cooling FROSTFLOW X 360
PowerColor AMD Radeon RX 6800 Fighter
SSD Apacer AS350 PANTHER на 512 ГБ (Windows 11 и приложения)
SSD Colorful SL500 на 4 ТБ (игры)
CHIEFTEC BDF-1000C
Методика тестирования (кликните, чтобы закрыть)
Производительность будем сравнивать в современном программном окружении, используя актуальные (насколько это возможно) версии тестируемых приложений и игр. Аналогично и с Windows — на оба тестовых стенда была установлена "свеженькая" Windows 11, версия 22H2. Здесь можно было бы возразить, что использование современного ПО ставит участников тестирования в не совсем равные условия, ведь актуальные версии приложений и игр с большой долей вероятности могут использовать наборы инструкций, отсутствующие у "старичков". Как следствие, более актуальные процессоры получат от использования SSE4- и AVX-инструкций дополнительное, якобы несправедливое, преимущество. Но я считаю иначе: новые наборы инструкций — это одно из микроархитектурных улучшений, которое ничем по сути своей не отличается от более высоких тактовых частот или больших объёмов объёма кэш-памяти. В конце концов, появились все эти наборы не просто так, и транзисторный бюджет на их поддержку был потрачен не смеху ради.
Жаль лишь, что во многих случаях использовать максимально современное ПО в тестах не получится, так как поддержка наборов инструкций, отсутствующих у "старичков" много где уже стала обязательной. В особенности сказанное, конечно же, касается игр, но и многие актуальные версии неигрового ПО уже не так просто или вообще невозможно запустить на стареньких процессорах. Тем не менее, небольшой список вполне себе актуального ПО набрать удалось:
Для тестов синтетических были выбраны AIDA64 и Geekbench 5. Из первой, правда, мы воспользуемся лишь тестами скоростных характеристик памяти, так как бенчмарки вычислительной скорости процессоров мне в Geekbench 5 нравятся больше.
Некую общую производительность ПК будем измерять с помощью PCMark 10.
В качестве реального неигрового ПО будут использованы Cinebench R23, Photoshop 2020, Premiere Pro 2022, 7-Zip 22, Blender 3.3, HandBrake 1.5, NAMD 2, Python 3.9.
И, наконец, игры будет представлены проектами Grand Theft Auto V, Sid Meier's Civilization VI, Shadow of the Tomb Raider, Hitman 2, Metro Exodus, Total War: Three Kingdoms, Borderlands 3, F1 2020.
Тестировать игры будем исключительно в HD-разрешении и (там, естественно, где есть выбор) с использованием современных API (например, DirectX 12).
Тестирование: синтетические и комплексные тесты
AIDA64 Memory Bandwidth & Latency
По результатам тестов скоростных характеристик подсистемы памяти в AIDA64 вновь отмечаем, что во втором поколении 4-ядерных процессоров AMD удалось устранить хорошо известный недостаток встроенного контроллера памяти Phenom первого поколения, а именно невысокую эффективность записи в память. Отсутствие L3-кэша у Athlon II несколько негативно сказалось на скорости записи, но показатели всё ещё заметно выше в сравнении с Phenom первого поколения. Латентность памяти у всех протестированных процессоров примерно на одном уровне.
Geekbench 5
В наборе синтетических тестов Geekbench 5 отсутствие L3-кэша сказалось на однопоточных результатах Athlon II незначительно, а вот в многопоточных тестах влияние L3-кэша уже заметно. Впрочем, частота всё же оказалась важнее — более низкочастотный Phenom первого поколения остался позади Athlon II.
PCMark 10
Аналогичную картину можно наблюдать и в комплексном тесте PCMark 10. За вычетом лишь группы тестов Essentials, которая отражает производительность при обычной работа среднестатистического пользователя. Здесь Athlon II и Phenom первого поколения выступили почти на равных.
Тестирование: профессиональное ПО
Cinebench R23
А вот в профессиональном ПО сразу же в первом тесте видим существенное влияние L3-кэша — с рендерингом в Cinebench R23 Athlon II справился значительно медленнее равночастотного Phenom II. Почти настолько же медленно, как и более низкочастотный Phenom первого поколения.
Photoshop 2020
В Photoshop протестированные процессоры расположились в уже привычную по синтетическим тестам иерархию — Phenom II быстрее Athlon II, который в свою очередь, быстрее Phenom первого поколения. L3-кэш здесь оказался важен примерно настолько же, насколько и частота.
Premiere Pro 2022
А вот в Premiere Pro необходимость в L3-кэше оказалась минимальна, здесь всё решила частота — Athlon II чуть медленнее Phenom II, и оба заметно быстрее Phenom первого поколения.
Visual Studio 2022
Наконец-то первый пример рабочей задачи, где L3-кэш заметно важнее частоты — с компиляцией Blender в Visual Studio Athlon II справился сильно хуже не только Phenom II, но и Phenom первого поколения.
7-Zip 22
Чуть меньше значимость L3-кэша при сжатии данных в 7-Zip — Athlon II здесь всё ещё медленнее Phenom II, но уже чуть быстрее Phenom первого поколения.
Blender 3.3
А вот рендеринг в Blender оказался практически не чувствительным к факту отсутствия у Athlon II L3-кэша — Athlon II здесь лишь немного медленнее Phenom II, при этом оба заметно быстрее Phenom первого поколения.
HandBrake 1.5
H.265-кодирование видео уже острее реагирует на отсутствие L3-кэша, но частота всё же важнее.
NAMD 2
Не пригодился L3-кэш и при решении задачи классической молекулярной динамики в NAMD 2. Зато грубая сила (частота) вновь оказалась не лишней.
Python 3.9
А вычислениям с матрицами в многопоточном режиме в Python 3 L3-кэш, напротив, оказался жизненно необходим — Phenom первого поколения здесь даже немного обошёл Athlon II. Оба, впрочем, заметно отстали от полноценного Phenom II.
В среднем на равной частоте Phenom II оказался быстрее Athlon II на 11%, а Athlon II оказался быстрее более низкочастотного Phenom первого поколения на 6%.
Тестирование: игры
А как дела обстоят в играх?
Grand Theft Auto V (2015, RAGE, DirectX 11) (кликните, чтобы закрыть)
Sid Meier's Civilization VI (2016, собственный, DirectX 12) (кликните, чтобы закрыть)
Shadow of the Tomb Raider (2018, Foundation, DirectX 12) (кликните, чтобы закрыть)
Hitman 2 (2018, Glacier 2, DirectX 12) (кликните, чтобы закрыть)
Metro Exodus (2019, 4A Engine, DirectX 12) (кликните, чтобы закрыть)
Total War: Three Kingdoms (2019, TW Engine 3, DirectX 11) (кликните, чтобы закрыть)
F1 2020 (2020, EGO, DirectX 12) (кликните, чтобы закрыть)
Среднегеометрические результаты
Здесь влияние объёма L3-кэша пускай и немного, но всё-таки ожидаемо выше — в среднем Phenom II оказался быстрее равночастотного Athlon II на 17% и 10% по средним и минимальным показателям, а Athlon II оказался лишь едва быстрее более низкочастотного Phenom первого поколения (на 1% и 5% по средним и минимальным показателям).
Выводы
Относиться к Athlon II X4 можно по-разному. С одной стороны отсутствие L3-кэша могло ударить по производительности этих процессоров как в профессиональном ПО, так и в играх. С другой — в момент выхода на рынок отставание Athlon II от равночастотного Phenom II в среднем составляло лишь 10–15%. И как показало наше исследование, осталось оно таковым и спустя многие годы. А вот цена Athlon II была заметно ниже таковой у Phenom II, так что по соотношению цена-производительность Athlon II не было равных. Именно Athlon II X4 стали первыми 4-ядерными процессорами, сначала приблизившимися к розничной цене в $100, а затем и опустившимися ниже этой планки. За такие деньги небольшое отставание в производительности от более дорогих 4-ядерных процессоров Athlon-ам можно и простить.