Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce GTX 650 и GeForce 930MX, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | 498 | 569 |
Соотношение цена-качество | 0.31 | 0.36 |
Архитектура | Kepler | Maxwell |
Графический процессор | GK107 | N16S-GMR |
Тип | Десктопная | Для ноутбуков |
Дата выхода | 6 сентября 2012 (9 лет назад) | 10 марта 2016 (5 лет назад) |
Цена на момент выхода | 109$ | нет данных |
Цена сейчас | 1130$ (10.4x) | 1808$ |
Для получения индекса мы сравниваем характеристики видеокарт и их стоимость, учитывая стоимость других карт.
- Характеристики
- Совместимость и размеры
- Оперативная память
- Видеовыходы
- Технологии
- Поддержка API
- Тесты в бенчмарках
- Общая производительность в тестах
- NVIDIA GeForce GTX 650: технические характеристики и тесты
- Описание
- Общая информация
- Характеристики
- Совместимость и размеры
- Оперативная память
- Видеовыходы
- Технологии
- Поддержка API
- Тесты в бенчмарках
- Общая производительность в тестах
- Nvidia Geforce GTX 650:
- Платы
- Установка и драйверы
- Direct3D 9: тесты Pixel Shaders
- Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0
- Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
- Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
- Direct3D 10: тесты геометрических шейдеров
- Direct3D 10: скорость выборки текстур из вершинных шейдеров
- 3DMark Vantage: тесты Feature
- Direct3D 11: Вычислительные шейдеры
- Direct3D 11: Производительность тесселяции
- Выводы по синтетическим тестам
- 💥 Видео
Характеристики
Общие параметры GeForce GTX 650 и GeForce 930MX: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce GTX 650 и GeForce 930MX, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Количество потоковых процессоров | 384 | 384 |
Количество конвейеров CUDA | 384 | нет данных |
Частота ядра | 1058 МГц | 952 МГц |
Частота в режиме Boost | нет данных | 1020 МГц |
Количество транзисторов | 1,270 млн | нет данных |
Технологический процесс | 28 нм | 28 нм |
Энергопотребление (TDP) | 64 Вт | 17 Вт |
Скорость текстурирования | 33.9 млрд/сек | 24.48 |
Производительность с плавающей точкой | 812.5 gflops | 783.4 gflops |
Совместимость и размеры
Параметры, отвечающие за совместимость GeForce GTX 650 и GeForce 930MX с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания). Для ноутбучных видеокарт это предполагаемый размер ноутбука, шина и разъем подключения, если видеокарта подключается через разъем, а не распаивается на материнской плате.
Шина | PCI Express 3.0 | PCI Express 3.0 |
Интерфейс | PCIe 3.0 x16 | PCIe 3.0 x8 |
Длина | 14.5 см | нет данных |
Высота | 11.1 см | нет данных |
Дополнительные разъемы питания | 1x 6-pin | нет |
Оперативная память
Параметры установленной на GeForce GTX 650 и GeForce 930MX памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.
Тип памяти | GDDR5 | DDR3, GDDR5 |
Максимальный объём памяти | 1 Гб | 2 Гб |
Ширина шины памяти | 128-bit GDDR5 | 64 бит |
Частота памяти | 5.0 Гб/с | 2000 МГц |
Пропускная способность памяти | 80.0 Гб/с | 14.40 Гб/с |
Разделяемая память | нет данных | — |
Видеовыходы
Перечисляются имеющиеся на GeForce GTX 650 и GeForce 930MX видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Видеоразъемы | 1x Dual Link DVI-I, 1x Dual Link DVI-D, 1x Mini HDMI | No outputs |
Поддержка нескольких мониторов | 4 монитора | нет данных |
HDMI | + | нет данных |
HDCP | + | нет данных |
Максимальное разрешение через VGA | 2048×1536 | нет данных |
Аудио-вход для HDMI | внутренний | нет данных |
Технологии
Здесь перечислены поддерживаемые GeForce GTX 650 и GeForce 930MX технологические решения и API. Такая информация понадобится, если от видеокарты требуется поддержка конкретных технологий.
3D Blu-Ray | + | нет данных |
3D Gaming | + | нет данных |
3D Vision | + | нет данных |
GPU Boost | нет данных | 2.0 |
Optimus | нет данных | + |
GameWorks | нет данных | + |
Поддержка API
Перечислены поддерживаемые GeForce GTX 650 и GeForce 930MX API, включая их версии.
DirectX | 12 (11_0) | 12 (11_0) |
Шейдерная модель | 5.1 | 5.1 |
OpenGL | 4.3 | 4.5 |
OpenCL | 1.2 | 1.2 |
Vulkan | 1.1.126 | 1.1.126 |
CUDA | + | + |
Тесты в бенчмарках
Это результаты тестов GeForce GTX 650 и GeForce 930MX на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.
Общая производительность в тестах
Это наш суммарный рейтинг производительности. Мы регулярно улучшаем наши алгоритмы, но если вы обнаружите какие-то несоответствия, не стесняйтесь высказываться в разделе комментариев, мы обычно быстро устраняем проблемы.
Видео:GTX 650 с АлиЭкспресс в 2024 году - это все еще ИГРОВАЯ ВИДЕОКАРТА?! Обзор/тесты в играх/ vs UHD630.Скачать
NVIDIA GeForce GTX 650: технические характеристики и тесты
Описание
NVIDIA начала продажи GeForce GTX 650 6 сентября 2012 по рекомендованной цене 109$. Это десктопная видеокарта на архитектуре Kepler и техпроцессе 28 нм, в первую очередь рассчитанная на геймеров. На ней установлено 1 Гб памяти GDDR5 на частоте 5.0 Гб/с, и вкупе с 128-bit GDDR5 интерфейсом это создает пропускную способность 80.0 Гб/с.
С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 3.0 x16. Длина референсной версии – 14.5 см. Для подключения требуется дополнительный 1x 6-pin кабель питания, а потребляемая мощность – 64 Вт.
Она обеспечивает слабую производительность в тестах и играх на уровне
от лидера, которым является NVIDIA GeForce RTX 3080 Ti.
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce GTX 650, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | 498 | |
Соотношение цена-качество | 0.31 | |
Архитектура | Kepler | |
Графический процессор | GK107 | |
Тип | Десктопная | |
Дата выхода | 6 сентября 2012 (9 лет назад) | |
Цена на момент выхода | 109$ | |
Цена сейчас | 1130$ (10.4x) | из 10388 (Quadro GV100) |
Для получения индекса мы сравниваем характеристики видеокарт и их стоимость, учитывая стоимость других карт.
Характеристики
Общие параметры GeForce GTX 650: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce GTX 650, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Количество потоковых процессоров | 384 | из 15360 (Radeon RX 7900 XT) |
Количество конвейеров CUDA | 384 | |
Частота ядра | 1058 МГц | из 2233 (Playstation 5 GPU) |
Количество транзисторов | 1,270 млн | из 14400 (GeForce GTX 1080 SLI (мобильная)) |
Технологический процесс | 28 нм | из 5 (Apple M1 GPU) |
Энергопотребление (TDP) | 64 Вт | из 900 (Tesla S2050) |
Скорость текстурирования | 33.9 млрд/сек | из 779.2 (Radeon RX 6900 XTX) |
Производительность с плавающей точкой | 812.5 gflops | из 16384 (Radeon Pro Duo) |
Совместимость и размеры
Параметры, отвечающие за совместимость GeForce GTX 650 с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Шина | PCI Express 3.0 |
Интерфейс | PCIe 3.0 x16 |
Длина | 14.5 см |
Высота | 11.1 см |
Дополнительные разъемы питания | 1x 6-pin |
Оперативная память
Параметры установленной на GeForce GTX 650 памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.
Тип памяти | GDDR5 | |
Максимальный объём памяти | 1 Гб | из 128 (Radeon Instinct MI250X) |
Ширина шины памяти | 128-bit GDDR5 | из 8192 (Radeon Instinct MI250X) |
Частота памяти | 5.0 Гб/с | из 19500 (GeForce RTX 3090) |
Пропускная способность памяти | 80.0 Гб/с | из 14400 (Radeon R7 M260) |
Видеовыходы
Перечисляются имеющиеся на GeForce GTX 650 видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Видеоразъемы | 1x Dual Link DVI-I, 1x Dual Link DVI-D, 1x Mini HDMI |
Поддержка нескольких мониторов | 4 монитора |
HDMI | + |
HDCP | + |
Максимальное разрешение через VGA | 2048×1536 |
Аудио-вход для HDMI | внутренний |
Технологии
Здесь перечислены поддерживаемые GeForce GTX 650 технологические решения и API. Такая информация понадобится, если от видеокарты требуется поддержка конкретных технологий.
3D Blu-Ray | + |
3D Gaming | + |
3D Vision | + |
Поддержка API
Перечислены поддерживаемые GeForce GTX 650 API, включая их версии.
DirectX | 12 (11_0) | |
Шейдерная модель | 5.1 | |
OpenGL | 4.3 | из 4.6 (GeForce GTX 1080 (мобильная)) |
OpenCL | 1.2 | |
Vulkan | 1.1.126 | |
CUDA | + |
Тесты в бенчмарках
Это результаты тестов GeForce GTX 650 на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.
Общая производительность в тестах
Это наш суммарный рейтинг производительности. Мы регулярно улучшаем наши алгоритмы, но если вы обнаружите какие-то несоответствия, не стесняйтесь высказываться в разделе комментариев, мы обычно быстро устраняем проблемы.
Fire Strike — это бенчмарк DirectX 11 для игровых ПК. В нем есть два отдельных теста, демонстрирующих борьбу между гуманоидом и огненным существом, похоже, сделанным из лавы. Используя разрешение 1920×1080, Fire Strike демонстрирует достаточно реалистичную графику и довольно требователен к оборудованию.
Это очень распространенный бенчмарк, входящий в состав пакета Passmark PerformanceTest. Он дает видеокарте тщательную оценку, производя четыре отдельных теста для Direct3D версий 9, 10, 11 и 12 (последний по возможности делается в разрешении 4K), и еще несколько тестов, использующих DirectCompute.
Это специальный бенчмарк для измерения производительности видеокарты в OctaneRender, который является реалистичным движком GPU рендеринга, созданным компанией OTOY Inc., доступным либо как отдельная программа, либо как плагин для 3DS Max, Cinema 4D и многих других приложений. Он рендерит четыре различные статические сцены, а затем сравнивает время рендеринга с эталонной видеокартой, которой на данный момент является GeForce GTX 980. Этот бенчмарк не измеряет игровую производительность, и предназначен для профессиональных художников, работающих с 3D графикой.
Видео:GTX 650 - спасение или страдание?Скачать
Nvidia Geforce GTX 650:
В этой части мы изучим видеокарты, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала карта компании Gigabyte.
Платы
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (по 4 на каждой стороне PCB).
Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1500 (6000) МГц.
Сравнение с эталонным дизайном, вид спереди | |
---|---|
Gigabyte Geforce GTX 650 OC 1024 МБ 128-битной GDDR5 PCI-E | Reference card Nvidia Geforce GT 640 |
Сравнение с эталонным дизайном, вид сзади | |
---|---|
Gigabyte Geforce GTX 650 OC 1024 МБ 128-битной GDDR5 PCI-E | Reference card Nvidia Geforce GT 640 |
Почему эта карта сравнивается с GT 640? Потому что обе они основаны на одном ядре и имеют 128-битную шину обмена с памятью. Разница лишь в типе самой памяти: у GT 640 — GDDR3, а у GTX 650 — GDDR5, что сильно меняет ПСП вкупе с разницей в частотах работы. Как мы видим, отличия в основном касаются именно особенностей работы с разным типом памяти, а также у GTX 650 предусмотрен разъем для внешнего питания, ведь у GTX 650 частоты чуть выше и GDDR5 потребляет побольше, а также плата комплектуется восемью микросхемами памяти, хоть это и странно для 128-битной шины. Вероятно, дизайн предусматривает возможность установки суммарного объема памяти в 2 гигабайта, используя уже 2-гигабитные микросхемы памяти.
Видеокарта имеет набор гнезд вывода: HDMI, 2 DVI (оба Dual-Link и обладают возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 3 приемника с HDMI), ну и VGA (для владельцев старых мониторов). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком.
Максимальные разрешения и частоты:
- 240 Гц — максимальная частота обновления;
- 2048×1536@85 Гц — по аналоговому интерфейсу;
- 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).
Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.
Карта требует дополнительного питания, причем одним 6-контактным разъемом.
О системе охлаждения.
Кулер состоит из большого центрального алюминиевого радиатора и кожуха с большим вентилятором. Собственно, ничего особенного. Подобные СО мы уже видели многократно, они стандартны.
Микросхемы памяти без охлаждения.
СО получилась весьма малошумная. Максимальная частота вращения вентилятора ниже 1900 оборотов в минуту.
Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.
Gigabyte Geforce GTX 650 OC 1024 МБ 128-битной GDDR5 PCI-E | |
---|---|
После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 57 градусов, что говорит о том, что СО получилась очень эффективной.
Комплектация. Базовый комплект поставки должен включать в себя руководство пользователя и диск с драйверами и утилитами.
Gigabyte Geforce GTX 650 OC 1024 МБ 128-битной GDDR5 PCI-E | |
---|---|
Установка и драйверы
Конфигурация тестового стенда:
- Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
- процессор Intel Core i7-3960X (o/c 4 ГГц);
- системная плата Asus Sabertooth X79 на чипсете Intel X79;
- системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
- оперативная память 8 ГБ DDR3 SDRAM Corsair 1866 МГц;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
- 2 блока питания Enermax Platimax 1200 Вт.
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista c SP1.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).
Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
- Geforce GTX 650 со стандартными параметрами (далее GTX 650)
- Geforce GTX 650 Ti со стандартными параметрами (далее GTX 650 Ti)
- Geforce GTX 560 со стандартными параметрами (далее GTX 560)
- Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550 Ti)
- Radeon HD 7770 со стандартными параметрами (далее HD 7770)
- Radeon HD 7750 со стандартными параметрами (далее HD 7750)
Для сравнения результатов новой модели видеокарты Geforce GTX 650 эти решения были выбраны по следующим причинам. Geforce GTX 650 Ti является ближайшей к GTX 650 моделью, основанной на базе более мощного графического процессора GK106 архитектуры Kepler, поэтому будет интересно посмотреть, насколько новинка получилась медленнее. Сравнение с GTX 550 Ti и GTX 560 интересно по причине разных поколений и ценовых диапазонов видеокарт — мы узнаем, насколько увеличилась производительность модели новой линейки, по сравнению с предшественниками новинки.
Видеоплаты конкурирующей компании AMD были выбраны для наших тестов потому, что Radeon HD 7750 является одним из конкурентов новинки, хотя и имеет чуть меньшую цену, по сравнению с рекомендованной ценой анонсированной видеокарты Nvidia Geforce GTX 650. А вот вторая модель — Radeon HD 7770 — имеет уже несколько большую цену. Другими словами, прямого конкурента для Geforce GTX 650 снова нет, ими приходится считать сразу обе указанные видеокарты компании AMD.
Direct3D 9: тесты Pixel Shaders
Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим ниже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.
Тесты очень простые для современных GPU, и скорость в них часто упирается в производительность текстурирования или филлрейт. Поэтому они способны показать далеко не все возможности современных видеочипов, но всё же интересны с точки зрения устаревших игровых приложений, которых до сих пор достаточно много. Судя по нашим предыдущим сравнениям, производительность последних видеокарт в этих тестах ограничена чаще всего филлрейтом, хотя и влияние скорости текстурных модулей также есть.
Новая модель видеокарты от Nvidia в этом сравнении выступила весьма неплохо — кроме пары тестов, опередила Geforce GTX 560, хотя и уступает GTX 650 Ti довольно прилично. Но это и понятно, ведь эта модель имеет в основе GK106 и лидирует в этих тестах. Что касается сравнения с видеоплатами компании AMD, то новинка Geforce GTX 650 показала результат скорее на уровне Radeon HD 7770 (кроме пары самых сложных подтестов), а не более слабой HD 7750.
Ну и понятно, что Geforce GTX 550 Ti всё же осталась позади, хотя новинка не смогла опередить старую модель в одном из сложных тестов. Посмотрим на результаты ещё более сложных пиксельных программ промежуточных версий:
Тест Cook-Torrance более интенсивен вычислительно, скорость в нём зависит от количества ALU и их частоты, но также и от скорости TMU. Хотя данный тест исторически лучше подходил для графических решений компании AMD, но все новые платы Geforce на базе архитектуры Kepler в нём оказываются также довольно сильными.
Новинка от Nvidia показывает результат примерно посередине между HD 7770 и HD 7750. Причём, что в тесте освещения, больше зависящем от скорости ALU, что в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же. Неплохой результат сегодняшней героини в лице Geforce GTX 650, хотя от лидирующей в обоих тестах старшей модели GTX 650 Ti она отстала довольно сильно.
Что касается более старых видеокарт Nvidia, то GTX 650 смогла опередить GTX 560 и GTX 550 Ti в тесте Water (новинка явно быстра в текстурных задачах), а в тесте Cook-Torrance расположилась между ними, уступив GTX 560 из-за меньшей математической мощи, что полностью соответствует теории.
Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0
Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:
- Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
- Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.
Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:
Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится чуть лучше графической архитектуры Nvidia.
Это относится и к двум моделям Radeon, которые выбраны для сегодняшнего сравнения. В тесте «Frozen Glass» скорость сильно зависит от математической производительности, и Radeon HD 7770 снова оказывается быстрее новинки от Nvidia. В этом тесте она показывает результат на уровне чуть выше HD 7750 и GTX 550 Ti и отстаёт от GTX 560 и GTX 650 Ti, имеющих большую математическую мощь.
Во втором тесте «Parallax Mapping» новая видеокарта Nvidia показала производительность, близкую к уровню Radeon HD 7770, и оказалась заметно быстрее, чем HD 7750. Да и отставание от старшей GTX 650 Ti явно сократилось. Впрочем, догнать хотя бы GTX 560 так и не удалось. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:
В этот раз положение плат на чипах производства Nvidia явно улучшилось, и Geforce GTX 650 теперь в обоих тестах ближе к старшему из конкурентов от AMD и немного быстрее даже и GTX 560. Хотя старшая модель Nvidia всё так же далеко впереди. Современные чипы компании и в этих задачах явно работают довольно эффективно, и новая видеокарта Geforce GTX 650 в тестах показывает очень хороший сравнительный результат.
Но всё это были устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеро, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:
- Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
- Fur — процедурный шейдер, визуализирующий мех.
А вот эти тесты уже не ограничены производительностью текстурных выборок и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились и теперь во многих ценовых диапазонах именно они выигрывают.
Как и в этот раз. Хотя Geforce GTX 650 Ti является самой дорогой, и в сравнении она показала лучший результат, но Radeon HD 7770 отстаёт от неё совсем немного. Рассматриваемая нами сегодня модель Geforce GTX 650 очень сильно уступает своей старшей сестре, и это объяснимо с точки зрения теоретических показателей. Удивителен сравнительный результат новинки — она проиграла почти всем, кроме HD 7750 в одном из тестов. В этот раз новинка расположилась заметно ближе к Radeon HD 7750, а не к HD 7770.
Любопытно и то, почему так получилось, что GTX 650 уступила даже GTX 550 Ti, причём и в Fur, и в Steep Parallax Mapping. Понятно, что GTX 560 и уж тем более GTX 650 Ti остались далеко впереди. Единственно возможное объяснение — недостаток пропускной способности памяти, потому что по остальным теоретическим показателям GTX 650 явно быстрее GTX 550 Ti.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
В этом тесте производительность зависит в большей степени от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD не только сократила разницу с платами Nvidia, но с выпуском GCN и вовсе вырвалась вперёд. И сейчас уже именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ. Что мы и видим на диаграмме, где Radeon HD 7770 оказалась лидером, обогнав даже более дорогую Geforce GTX 650 Ti.
А вот рассматриваемая нами сегодня модель Geforce GTX 650 им серьёзно уступила, показав самый слабый результат, уступив и младшей плате из пары Radeon, и даже GTX 550 Ti! Вероятно, в этом виновата или сравнительно низкая пропускная способность памяти или недостаток филлрейта (производительность блоков ROP). Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
Но нет, в этот раз ситуация аналогична предыдущей, разве что GTX 650 смогла-таки опередить изрядно устаревшую GTX 550 Ti, результаты которой упали сильнее. Похоже, что при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, результаты плат AMD даже немного улучшились, по сравнению с показателями видеокарт компании Nvidia, и Radeon HD 7770 всё так же лидирует.
Протестированная нами сегодня плата компании Nvidia опередила разве что GTX 550 Ti, уступив обоим конкурентам: Radeon HD 7770 и HD 7750. Преимущество в сложных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления. Также отметим и сильный проигрыш модели GTX 650 своей старшей сестре — GTX 650 Ti. Бюджетный GK107 явно не очень хорош в данной задаче.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».
Диаграмма очень похожа на предыдущую (без включения SSAA), хотя старая модель Geforce GTX 550 Ti потеряла в скорости больше остальных. Решения Nvidia в этом тесте справляются всё так же хуже конкурирующих от AMD, и новая плата Geforce GTX 650 в обновленном D3D10-варианте теста без суперсэмплинга всё так же отстаёт даже от своего младшего соперника в виде Radeon HD 7750, не говоря уже о HD 7770, которая стала быстрейшей, обогнав даже GTX 650 Ti. Посмотрим, что изменит включение суперсэмплинга, который обычно вызывает сильное падение скорости на платах Nvidia.
Всё снова примерно так же, что и в «Fur». При включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — видеокарта Radeon HD 7770 явно улучшила свои относительные показатели.
Эта модель AMD всё так и остаётся лидером, а вот героиня нашего обзора продолжает уступать обеим платам Radeon. GTX 650 не может конкурировать с Radeon в этом тесте, так как графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают менее эффективно. Ну хоть в сравнении с GTX 550 Ti из предыдущего поколения новинка одержала победу, и то хорошо. Но Geforce GTX 650 Ti с Radeon HD 7770 далеко впереди.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты наших предельных математических тестов более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования. Архитектуры AMD последних лет в таких тестах ранее имели большое преимущество перед конкурирующими видеокартами Nvidia, но калифорнийская компания в архитектуре Kepler увеличила число потоковых процессоров, и пиковая математическая производительность свежих моделей Geforce значительно возросла.
Что мы и видим по результатам первого математического теста. Скорость видеокарт на диаграмме примерно соответствует теории, хотя и с некоторыми исключениями. Рассматриваемая Geforce GTX 650 показала результат, почти идентичный одному из прямых конкурентов в лице Radeon HD 7750, что полностью соответствует теории. Естественно, что HD 7770 оказалась впереди, но и она уступила Geforce GTX 650 Ti. Новинка GTX 650 хоть и обогнала старенькую GTX 550 Ti, но лишь немного.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
А вот во втором математическом тесте относительный результат новинки компании Nvidia оказался значительно ниже, и она уступила теперь обеим платам семейства AMD Radeon HD 7000. И еле-еле догоняет Geforce GTX 550 Ti. Подтверждается наш давний вывод о том, что эффективность вычислений архитектуры Kepler в нашем втором математическом тесте явно ниже, чем у предыдущей архитектуры Fermi. Поэтому новая модель GTX 650 стала самой медленной видеоплатой сравнения, хотя отставание от GTX 550 Ti невелико, но для нас важнее проигрыш прямым конкурентам от AMD.
Direct3D 10: тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.
Сразу же видна разница между результатами видеокарт на чипах Nvidia и решений AMD — налицо отличия в геометрических конвейерах. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первый же тест геометрии показал, что в таких задачах платы Nvidia лидируют.
И хотя сегодняшняя новинка Geforce GTX 650 имеет меньшее количество геометрических блоков, прилично отставая от GTX 650 Ti, это не мешает ей в борьбе со своими настоящими конкурентами — обе Radeon она обходит с запасом, равно как и GTX 550 Ti из предыдущего поколения. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры не изменились для устаревшей платы Nvidia и слегка улучшились для плат AMD и решений Nvidia современного поколения. Все видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX 650 всё так же медленнее, чем GTX 650 Ti, но при этом быстрее обеих видеоплат из семейства Radeon HD 7000. То же самое касается и старой платы на чипе архитектуры Fermi. Интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.
«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.
Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.
Относительные результаты остальных решений в разных режимах также примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.
Скорость рендеринга в этом тесте также ограничена в основном геометрической производительностью. И на этот раз Geforce GTX 650 показала скорость ближе к модели семейства Fermi и конкурирующим Radeon, чем к старшей модели GTX 650 Ti. Она лишь чуть-чуть обогнала их всех, заняв второе место. Но цифры могут серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».
Интересно, что обе платы Radeon показали близкие к скорости Geforce GTX 550 Ti результаты, и вся троица стала худшей в сравнении. В этом тесте важна скорость обработки геометрии, с которой дела у Nvidia обстоят явно лучше, но в бюджетных чипах Geforce геометрических блоков не так уж и много, поэтому Geforce GTX 650 Ti на базе GK106 значительно опережает все остальные решения, представленные на диаграмме.
Скорость в этом тесте явно упирается именно в производительность геометрических блоков, и сравнительно невысокий результат новой платы на базе чипа GK107 объясним тем, что он имеет лишь один движок растеризации и два движка Polymorph, что примерно соответствует тому, что имеют платы конкурента. Что может дать большее количество геометрических блоков, хорошо видно по результату GTX 650 Ti, чип которой имеет минимум вдвое большее количество блоков растеризации и обработки геометрии.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти, особенно в лёгком режиме. А результаты некоторых видеокарт Nvidia и вовсе бывают ограничены ещё чем-то непонятным. И между схожими по классу платами разница в этом тесте зачастую порой получается очень небольшой.
В этот раз получилось необычно. Geforce GTX 550 Ti в лёгком режиме показала явно странные результаты, хотя в сложном всё в порядке. Самой быстрой ожидаемо стала Geforce GTX 650 Ti, а вот все остальные платы (включая новую GTX 650, а также HD 7750 и HD 7770) весьма близки друг к другу, хотя скорость новинки можно признать неплохой. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:
Взаимное расположение карт на диаграмме изменилось мало — сравнительные результаты решений компании AMD явно ухудшились, и теперь обе Radeon уступают новой Geforce GTX 650, хотя и совсем немного. Скорость GTX 550 Ti ужасна в лёгком режиме и очень хороша в тяжёлом. Ну а наша новинка быстрее обеих плат компании AMD и сильно отстаёт от старшей сестры — GTX 650 Ti.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. В этот раз по каким-то странным причинам показатели новой модели Geforce GTX 650 оказались близки скорости GTX 550 Ti и эти платы можно назвать самыми медленными среди представленных. Скорость Radeon HD 7750 примерно соответствует показателям GTX 650 Ti, а старшая HD 7770 даже ещё быстрее (кроме лёгкого режима). Рассмотрим второй вариант этого же теста:
С усложнением задачи дела всех решений Nvidia стали только хуже. Особенно сильно видеокарты Geforce пострадали в лёгких режимах. Это позволило Radeon HD 7770 стать явным лидером сравнения, быстрейшим решением. Результаты сегодняшней новинки оказались ближе к скорости старшей GTX 650 Ti, но их обеих это не сильно спасает — обе Radeon всё равно быстрее, особенно в сложных условиях. Вероятно, этот провал можно объяснить недоработками в драйверах или сравнительно низкой ПСП.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Тест компании Futuremark хоть и не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт AMD и Nvidia в нём достаточно высока и сравнительные цифры моделей довольно близки к соответствующим теоретическим параметрам. Новая модель Geforce GTX 650 отстала от GTX 650 Ti чуть больше того, насколько должна бы по теории. Старшая из моделей Nvidia и по теории быстрейшая по текстурированию и в этом тесте так получилось.
Что касается сравнения скорости Geforce GTX 650 с парой конкурентов (Radeon HD 7750 и HD 7770) всё также более-менее соответствует теории — новинка от Nvidia по текстурной скорости обгоняет одного из своих конкурентов с меньшей ценой, уступая примерно столько же старшей модели HD 7770. Geforce GTX 550 Ti из предыдущего поколения новая плата хотя и обогнала, но незначительно. Feature Test 2: Color Fill
Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Тест производительности блоков ROP показывает несколько странный результат. Мы определили ранее, что цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест чаще измеряет скорее пропускную способность памяти, чем производительность ROP. Но даже в этом случае результат Geforce GTX 650 относительно GTX 650 Ti не совсем понятен — теоретически, разница должна быть меньше.
Что касается сравнения скорости GTX 650 с платами соперничающей компании AMD, то представленная сегодня модель показала достаточно высокую скорость заполнения сцены с учётом ПСП, опередив обоих конкурентов, так как Radeon HD 7750 и HD 7770 имеют одинаковую ПСП. В данном случае у новинки нет проблем с ограничением общей производительности пропускной способностью видеопамяти, как это иногда бывает в играх. И похоже, что GTX 650 в данном случае имеет достаточную ПСП. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.
Тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а много от чего сразу. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. В данном случае, больше важна математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage плата Geforce GTX 650 сильно уступила GTX 650 Ti, причём примерно столько же, сколько и должна по теории.
Хотя лучшей в сравнении стала модель на базе чипа GK106, но Radeon HD 7770 отстала от неё совсем немного. Ну а Geforce GTX 650 хотя и выигрывает у видеокарты среднего уровня из предшествующей серии GTX 550 Ti, но не может конкурировать даже со слабейшим Radeon компании AMD. К сожалению, недорогие решения Nvidia в подобных вычислительных задачах справляются с работой всё ещё заметно хуже решений компании AMD. Feature Test 4: GPU Cloth
Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому ситуация на диаграмме совершенно иная. Из-за влияния геометрических блоков получается, что все видеокарты производства Nvidia чувствуют себя в этом тестировании весьма неплохо, обгоняя соответствующие по цене платы Radeon. Соответственно, только Geforce GTX 550 Ti уступает обеим Radeon, да и то несильно.
А вот рассматриваемая нами сегодня модель Geforce GTX 650 в этот раз легко опережает обоих своих конкурентов от компании AMD. В данном случае низкая скорость Radeon вполне объяснима, так как в геометрических вычислениях важна тактовая частота и количество геометрических блоков. Это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих улучшенный геометрический конвейер. Кстати, новинка на базе чипа GK107 не слишком сильно отстала от старшей сестры GTX 650 Ti, основанной на GK106. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.
Это ещё один геометрический тест из 3DMark Vantage, и самый интересный вывод из данной диаграммы мы сделали уже давно — это единственный тест, в котором новые платы на базе чипа с архитектурой Kepler серьёзно уступают лучшим представителям архитектуры Fermi. В сегодняшнем случае Geforce GTX 550 Ti оказалась на одном уровне с GTX 650 Ti и заметно опередила как героиню нынешнего обзора, так и её конкурентов.
Если сравнивать скорость новой Geforce GTX 650 с производительностью её соперников, то, несмотря на улучшение позиций решений компании AMD, новинка Nvidia всё же осталась на уровне более дорогой Radeon HD 7770, хотя младшая модель отстаёт от них незначительно. В общем, синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывают, что платы Nvidia в них сильны и в целом опережают соперников в таких задачах. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.
В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько иное распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории, но ещё и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.
Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с такими задачами, и почти всегда показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Radeon HD 7770 показывает отличный результат, лишь немного отставая от лучшего решения в сравнении — более дорогой модели от компании Nvidia.
Рассматриваемая сегодня видеокарта Geforce GTX 650 показала скорость хоть и выше, чем Radeon HD 7750, но всё же совсем недалеко ушла от неё. У видеокарт на основе чипов архитектуры Kepler эффективность в этой задаче явно выше, поэтому и борьба с соответствующими по цене платами Radeon стала успешнее, да и модель из предыдущей линейки явно похуже справляется с нагрузкой.
Direct3D 11: Вычислительные шейдеры
Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.
Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.
Хоть это и не самый удачный пример для вычислительных шейдеров, но разницу в производительности в одной из конкретных задач он показывает. Разницы в скорости расчётов в вычислительном и пиксельном шейдерах для всех плат давно нет, как это было у видеокарт с GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP.
Новинка компании Nvidia в этом тесте заметно отстаёт от старшей модели GTX 650 с индексом Ti, но показывает схожий результат со скоростью своих конкурентов: Radeon HD 7770 и HD 7750. Забавно, но все они показали очень близкие цифры, и победителей просто нет. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.
В этом тесте результаты совершенно логично побеждает Geforce GTX 650 Ti, а следом идёт Radeon HD 7770. Младшие решения Nvidia и AMD идут позади, и новая модель GTX 650 показывает почти идентичный с Radeon HD 7750 результат в этом тесте. Больше похоже на то, что в этом тесте сказывается упор в ПСП, а не в скорость исполнения математических вычислений. Переходим к тестам производительности в задачах тесселяции, которые традиционно должны показать самую сильную сторону новой платы серии Geforce GTX 600.
Direct3D 11: Производительность тесселяции
Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.
Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.
Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:
В тесте простого бампмаппинга все платы упираются непонятно во что, и платы Nvidia показывают результат хуже, чем AMD. Новинка компании Nvidia не уступает старшей сестре и немного проигрывает своим соперникам в лице моделей Radeon HD 7770 и HD 7750, показавшим близкую скорость. А во втором подтесте с более сложными попиксельными расчётами всё совсем плохо для GTX 650. Его результаты показывают, что эффективность выполнения сложных математических вычислений в пиксельных шейдерах у чипов архитектуры GCN явно выше. В результате что Radeon HD 7770 опережает GTX 650 Ti, что HD 7750 оказывается быстрее представленной Geforce GTX 650 в этом подтесте.
В самом интересном тесте с тесселяцией у обеих видеокарт Radeon результаты также сильны. В данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём совсем не упирается в производительность блоков обработки геометрии. Поэтому платы компании AMD мало теряют в производительности и их скорости обработки треугольников вполне хватает, чтобы показывать результаты лучше, чем у Nvidia. Radeon HD 7770 и HD 7750 снова весьма близки и обгоняют как новинку компании Nvidia, так и старшее решение.
Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.
В этом примере применяется уже более сложная геометрия, и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Хотя все представленные в материале современные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia остаются более производительными, даже после того, как AMD частично исправила положение (в т. ч. сомнительными методами снижения степени разбиения треугольников драйвером).
Анонсированная сегодня видеоплата Geforce GTX 650 основана на чипе GK107, который имеет малое количество геометрических блоков, по сравнению с GK106 и тем более GK104, поэтому заметно уступает своей старшей сестре и находится на уровне конкурентов даже в сложных условиях. Впрочем, обе платы Radeon из соответствующего ценового диапазона очень неплохо выглядят во всех условиях этого сравнения.
Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.
Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.
Мы протестировали демо-программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, старшая из видеокарт компании AMD показывает результат даже лучше обеих Geforce, но при увеличении геометрической работы платы компании Nvidia сразу же начинают вырываться вперёд, а производительность Radeon заметно падает. Хотя в текущей архитектуре компании AMD геометрическая производительность чипов была улучшена, в соответствующих синтетических тестах они всё ещё продолжают проигрывать решениям Nvidia.
Поэтому, хотя новая бюджетная плата Geforce GTX 650 во всех режимах заметно уступает GTX 650 Ti на базе старшего чипа GK106, что объясняется малым количеством активных геометрических блоков в графическом процессоре GK107, но явный выигрыш у конкурирующих решений в виде Radeon HD 7770 и HD 7750 налицо, особенно в самых сложных условиях.
Выводы по синтетическим тестам
Результаты синтетических тестов новой модели Geforce GTX 650, основанной на графическом процессоре GK107 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia соответствует своему ценовому диапазону и при условии соответствующих розничных цен является одной из наиболее удачных видеокарт нижнего ценового сегмента.
По синтетическим тестам отставание новой модели от Geforce GTX 650 Ti оказалось достаточно велико, но это объясняется применением разных чипов: GK107 и GK106 для GTX 650 и GTX 650 Ti, соответственно. Ну и за исключением нескольких тестов, новинка вполне неплохо выступила по сравнению с конкурирующими моделями Radeon HD 7750 и HD 7770. Наш набор синтетических тестов показал, что производительность Geforce GTX 650 в среднем находится где-то между скоростью моделей Radeon HD 7770 и HD 7750. Но в играх, скорее всего, новинка покажет результаты ближе к младшей из Radeon, так как графический процессор GK107 относится к бюджетным решениям.
А у недорогих чипов просто не может не быть недостатков. Первый из них заключается в заметно меньшем количестве геометрических блоков, по сравнению с GK106, на котором основаны модели GTX 650 Ti и GTX 660. Но это вполне понятно в случае бюджетных чипов, тем более что в реальных DX11 играх скорость обработки геометрии не так уж важна — там просто нет слишком большого количества полигонов. В играх важнее математическая мощь и филлрейт, а также ПСП. И по этим показателям GTX 650 вполне соответствует своему классу — уровню Radeon HD 7750 и чуть выше.
В общем, исходя из теоретических данных и синтетических тестов, видеокарта Geforce GTX 650 — это неплохое предложение для игроков и энтузиастов, которые хотят заплатить чуть больше $100 за видеокарту соответствующего уровня. Удачные модели конкурента Radeon HD 7750 и HD 7770 получили очередного соперника, с которым им придётся бороться за внимание покупателей. В следующей части статьи мы проверим производительность нового решения в играх — будет интересно посмотреть на результаты Geforce GTX 650 в игровых приложениях.
💥 Видео
Что может GTX650 в 2020 году? Видеокарте 8 лет!Скачать
Тесты в играх видеокарты Nvidia GTX 650 2gb в 2020 году.Скачать
Обзор видеокарты nvidia GTX 650, но не абы какой, а на 2 гига GDDR5 памяти! Тест в играх. 2 лучше?Скачать
Совместима ли видеокарта с вашей материнской платой?Скачать
GTX650 Видеокарта из китая с Aliexpress (обзор распаковка замена термопасты)Скачать
GTX 650 TI В 2024 ГОДУ / ОБЗОР НА СТАРОЕ ЖЕЛЕЗОСкачать
На что способна GTX 650 Ti ?Скачать
Видеокарта ASUS GeForce GTX 650 DirectCU 1024MB GDDR5 (GTX650-DC-1GD5)Скачать
GTX 650 в какие игры можно поиграть?Скачать
Доступный гейминг?! Тест GTX650 с 1GB GDDR5 памяти с ценником в 2600 рублейСкачать
Видеокарта из китая GTX 650Скачать
Обзор видеокарты Nvidia Geforce GTX 650. Бюджетно - игровая карта из 2012. Тест в играх, в 2020.Скачать
Битва бомжекарт: GTX 650 vs GT 740 в 2023 году! На что хватит их силенок? Кто их тайный конкурент?Скачать
NVIDIA GeForce GTX 650 1 ГБ в 2021 году / Тест в играхСкачать
Обзор видеокарты Nvidia GeForce GTX 650 из Китая без тестирования на играхСкачать
Разбираем NVIDIA GeForce GTX 650.Скачать
Купил gtx 650 2 gb ,чистка и температура !Скачать
Опасные видеокарты после майнингаСкачать