Технологии не стоят на месте. Закон Мура, который уже подвергся колебаниям на процессорном рынке, долгое время «заставляет» производителей микросхем наращивать количество транзисторов на 1 мм2. Переходы на новые техпроцессыпомимо увеличения производительностиспособствовали и снижению потребления, что положительно сказывалось на требованиях к теплоотводу. И, если применение памятиHigh Bandwidth Memory (HBM) в видеокартах поколения Fiji способствовали появлению компактнойAMD Radeon R9 NANO, то переход на 16 нмпозволил появлению мощных компактных видеокарт, лишенных недостатковR9 NANO -слишком ограниченное потребление и всего 4 Гб набортной памяти. В нашу редакцию как раз попала такая видеокарта —MSI GeForce GTX 1070 AERO ITX 8G OC. Сочетая высокую мощность графического процессора и компактные размеры, сможет ли она нас удивить или, наоборот, разочаровать?
Упаковка и комплектация
ВидеокартаMSI GeForce GTX 1070 AERO ITX 8G OCпоставляется в миниатюрной картонной коробке. Честно, если бы раньше нам сказали, что в данной коробке находится мощная видеокарта,мы бы не поверили.
На лицевой части коробки, выполненной в черно-зеленых тонах, располагается название видеокарты. Сноска OC Edition в левом нижнем углу намекает, что частоты видеокарты былиувеличены по сравнению со стандартной версией.
Обратная сторона коробки акцентирует внимание на системе охлаждения видеокарты. Также здесь располагаются минимальные системные требования и технологии, которыми обладает видеокарта.
Вся комплектация ограничивается бумажной документацией и диском с программным обеспечением. Скромно, но уже не удивительно.
Внешний вид
Корпус радиатора сделан из относительно тонкого пластика, который закреплён на большой раме для придания прочности всей конструкции. При весе в 1 кг 80 г. назвать это изделие особенно лёгким язык не поворачивается.
Длина видеоадаптера составляет 284 мм. Высота – 135 мм, а ширина равна 35 мм, что и соответствует ширине двухслотовых карт. Диаметр каждого вентилятора составляет 95 мм. Крыльчатки вентиляторов оснащены шариковыми подшипниками.
Задняя сторона платы закрыта пластиной с вентиляционными отверстиями, но она не контактирует с PCB через какой-либо термоинтерфейс и никаким образом не влияет на систему охлаждения. К сожалению, из-за неё нужно предусмотреть дополнительные 5 мм пространства позади карты, что может быть критично в многокарточных конфигурациях.
Использование карты без её задней панели оказалось затруднительным из-за особенностей конструкции и крепления. Поэтому мы воздержались от демонтажа задней панели и тестировали вместе с ней, что ограничивало обзор при инфракрасном замере температур.
В верхней части карты находятся подсвечиваемый логотип MSI и сквозь отверстия корпуса радиатора мы видим три тепловые трубки (две 6-миллиметровые и одна 8 мм). Шести- и восьмиконтактные разъёмы питания расположены в конце карты и развёрнуты контактами вверх. Традиционная черно-красная цветовая схема от MSI известна всем, кто знаком с продукцией компании.
Сняв крышку, мы увидим продольно расположенные рёбра радиатора. В целом, это неплохое решение, которое позволяет организовать воздушный поток таким образом, чтобы он выходил из корпуса наружу через видеокарту, а не поднимался к процессору, как это происходит в случае поперечных рёбер радиатора.
На карте имеются: один разъем Dual-Link DVI-D, один порт HDMI 2.0b и три DisplayPort 1.4. Одновременно могут использоваться четыре из них. Кроме того, на кронштейне крепления к ПК присутствую обширная перфорация, предназначенная для вентиляции. Если бы производитель не оснастил видеоконтроллер почти не использующимся разъёмом DVI, то на кронштейне появилось бы свободное пространство, которое можно было бы использовать для дополнительных вентиляционных отверстий.
Дизайн видеокарты
ВидеокартаMSI GeForce GTX 1070 AERO ITX 8G OCпоражает с первого взгляда — трудно представить, что под такой миниатюрной системой охлаждения находится мощный графический процессор GP104.
Стоит только осознать, что длина нашей моделине превышает 175 мм. Это в среднем на 10 см меньше, чем привычные видеокарты данного класса.
Обратная сторона устройствапестрит элементной базой. Ограничение в размерах привело к усложнению компоновки, но инженеры компании MSI с этим справились. С другой стороны, наличие задней пластины с термопрокладками под ней положительно бы сказалось на температурном режиме, приукрасило внешний види защитило бы видеокарту от повреждения при установке. Не думаем, что это сильно бы повлияло на ее стоимость.
Здесь же и располагается наклейка с моделью видеокарты и ее серийным номером.
Корпуса Mini-ITX зачастую ограничивают и толщину видеокарт. ПоэтомуMSI GeForce GTX 1070 AERO ITX 8G OCвыполнена в двухслотовом дизайне.
На кожухе располагается надпись MSI, никакой подсветки нет. Да и кому она нужна при миниатюрной компоновке?
С обратной стороны просматриваются никелированные трубки и термопрокладки на микросхемах памяти.
На интерфейсной панели имеется по два видеовыхода HDMI 2.0 иDisplayPort 1.4, а также одинDual Link DVI-D. Сама панель хорошо перфорирована, что для такой миниатюрной карты скорее необходимость.
Выводы
Описать MSI GTX 1070 Gaming X 8G одновременно и сложно и просто, поскольку в ее создание вложено огромное количество инноваций, что выводит данное устройство в несомненные лидеры рынка видеокарт предназначенных для заядлых геймеров. В этой модели все сделано «по уму» и для пользователя: ее нельзя использовать вместо сковородки, потому что наличие хорошего теплоотвода и кулеров просто не допускает экстремальных температур и при этом работает она весьма тихо благодаря тому, что вентиляторы TORX 2.0 производя весьма мощный обдув, остаются практически бесшумными (в среднем уровень шума при максимальной нагрузке составляет около 30 дБа). А ведь отсутствие нежелательного шума — это не только залог успешной и комфортной игры, но и продуктивной работы.
На момент написания статьи цена на видеокарту MSI GTX 1070 Gaming X 8G в Москве составляет примерно 33 тыс. рублей, что, учитывая ее возможности, не представляется какой-то завышенной ценой, учитывая, что ее приобретение — это хорошее вложение средств, потому что она верой и правдой прослужит вам весьма и весьма долго.
Система охлаждения и печатная плата
При демонтаже системы охлаждения нужно учитывать то, что на одном винте установлена гарантийная пломба. И, несмотря на то, что сама компания MSI нарушение пломбы не считает поводом для лишения гарантии, да и отсутствие задней пластины позволяет без проблем выкрутить винт с пломбой без нарушения последней, проводить данную операцию бессмысленно — заводской термоинтерфейс нанесен хорошо, по консистенции напоминает Arctic MX-4 и его замена не принесла нам выигрыша по температуре.
Всего же необходимо открутить 6 винтов:4 вокруг — графического процессора и 2 — в районе подсистемы питания.
Печатная плата
Печатная плата видеокартыMSI GeForce GTX 1070 AERO ITX 8G OC— собственная разработка компании MSI. Отмечается, что при производстве применяется качественная элементная базаMILITARY CLASS 4.
Смена формата привела и к изменениям компоновки:графический процессор и микросхемы памяти были повернуты на 90о, а подсистема питания перенесена к интерфейсной панели.
В сердце видеокарты лежит графический процессор GP-104-200-A1, произведенный на 47 неделе 2016 года (конец ноября) в Тайване. Вокруг располагаются 8 микросхем памяти GDDR5 производства компании Micron с маркировкой6VA47-D9TCB.
Подсистема питания выполнена по системе 5+1: пять фаз отвечают за питание графического процессора, одна — микросхемпамяти. За управление напряжением отвечает ШИМ-контроллерuP9511P производстваuPISemiconductor. Данный факт радует — это обеспечивает нам как разблокированное управление напряжением (до 1.093 В), так и совместимость с многочисленными сторонними BIOS. В совокупности с одним разъемом дополнительного питания 8-pin — это шанс получить видеокарты.
Система охлаждения
Система охлаждения после раскручивания 6 винтов крепится только одним разъемом, предназначенным для подключения вентилятора.
Крупное никелированное основание отводит тепло от графического процессора и от микросхем памяти. На радиатор напаяна пластина, способствующая охлаждению цепей питания. По отпечатку на термопрокладках видно, что прижим плотный.
Множество алюминиевых ребер, расположенных вдоль карты, пронизываются тремя тепловыми трубками, две из которых диаметром 8 мм, одна — 6 мм.
Сам радиатор имеет несколько специфичную форму.
По заверениям производителя,технологияAirflow Controlизменяет направление воздушного потока нужным образом, обеспечивая максимальное охлаждение графического процессора.
На кожухе видеокарты закрепленвентилятор MSI TORX fanс маркировкой Power Logic PLD10010S12HH (12 В, 0.4 А) диаметром 100 мм.
Дисперсионные лопасти вентилятора способствуют созданию большего воздушного потока без изменения уровня шума. Еще радует то, что аналогичные вентиляторы устанавливаются на видеокарты серии Gaming, что улучшит совместимость BIOS.
Видеоускоритель Nvidia GeForce GTX 1070
75% от нового лидера игровой 3D-графики на ПК
Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство Особенности видеокарты
- Результаты синтетических тестов
Представляем базовый детальный материал с исследованием Nvidia GeForce GTX 1070.
Справочные материалы
- Руководство покупателя игровой видеокарты
- Справочник по AMD Radeon 300
- Справочник по Nvidia GeForce GTX 900 и Titan
- Декодирование видео силами видеокарт
- Методика тестирования в 3D-играх и настройки
Объект исследования
: Ускоритель трехмерной графики (видеокарта) Nvidia GeForce GTX 1070 8 ГБ 256-битной GDDR5 PCI-E
Сведения о разработчике
: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) около 5000 человек.
Часть 1: Теория и архитектура
Совсем недавно мы рассматривали видеокарту GeForce GTX 1080 — новейшее решение компании Nvidia, основанное на первом графическом процессоре архитектуры Pascal, вышедшее после длительного перерыва из-за застоя в разработке техпроцессов и ставшее наиболее производительным на рынке. Оно еще даже не успело появиться в магазинах нашей страны, как настало время для анонса еще одной модификации на этом же GPU — менее дорогого варианта на основе урезанного по производительности графического процессора той же модели.
Модель GeForce GTX 1070 стала второй видеокартой на базе первого графического процессора архитектуры Nvidia Pascal — GP104. Новинка поддерживает абсолютно все возможности архитектуры Pascal, описанные нами в базовом обзоре топовой версии, включая мультипроецирование — одновременную отрисовку в нескольких разных проекциях, позволяющую улучшить изображение на многомониторных конфигурациях и повысить производительность в среде виртуальной реальности. Из других интересных технологий можно отметить VRWorks Audio, служащую для точного расчета распространения звуковых волн при помощи GPU.
Графический процессор GP104 отличается от предыдущих чипов семейства Maxwell по большей части применением нового технологического процесса 16 нм, который позволил сделать более сложный чип, имеющий большее количество исполнительных блоков и работающий на высокой тактовой частоте. Как и в старшей модификации, графический процессор GeForce GTX 1070 работает на частотах выше 1,6 ГГц, но урезание по количеству функциональных блоков (а возможно также и использование менее скоростной GDDR5-памяти) привело к снижению типичного энергопотребления до 150 Вт. Это стало возможным в основном благодаря применению продвинутого технологического процесса 16 нм FinFET на фабриках TSMC при изготовлении видеочипа GP104, получившего большее количество транзисторов, по сравнению с аналогичными решениями архитектуры Maxwell.
Видеочип в составе видеокарты GeForce GTX 1070 имеет слегка сниженные характеристики производительности, он работает на высокой частоте, содержит 1920 потоковых вычислительных ядер и 120 блоков TMU при неизменных 64 блоках ROP. Это хоть и меньше, чем у GTX 1080, но привело к приличному росту общей производительности 3D-рендеринга, по сравнению с GPU предыдущего поколения. Сочетание архитектурных преимуществ Pascal, нового более «тонкого» техпроцесса, а также весьма быстрой GDDR5-памяти вылилось в преимущество в скорости над GeForce GTX 970 на величину порядка 50-70% (в среднем около 60%) по данным самой Nvidia. Возможно, цифра производителя GPU слишком оптимистична, реальный прирост скорости рендеринга в играх мы самостоятельно определим далее в нашем материале. Но в том, что GeForce GTX 1070 получилась очень быстрой, нет никаких сомнений.
Обычно между выпуском двух топовых моделей видеокарт, отличающихся производительностью и ценой, проходит больше времени, но в этот раз у Nvidia получился совсем короткий промежуток между днями их анонса и выпуска в продажу. И в непростых экономических условиях нашей страны это очень неплохо, ведь отдать более 50 тысяч рублей за видеокарту готовы далеко не все, а младшая модификация на основе графического процессора GP104, пусть и слегка урезанного по количеству функциональных блоков, будет стоить гораздо меньше, не так уж много уступая старшему решения по производительности, и полностью аналогичного по своим возможностям. Так что еще до появления новинки в рознице, можно с уверенностью утверждать, что GeForce GTX 1070 получит большую популярность среди покупателей. Благодаря меньшей розничной цене по сравнению с GTX 1080, новая модель сразу же занимает в своем ценовом диапазоне сильную позицию, и сегодня мы в этом убедимся.
Так как рассматриваемая сегодня новая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры «Pascal», имеющей много общего с предыдущей архитектурой «Maxwell», то перед прочтением данного материала советуем ознакомиться с нашими статьями о ранних видеокартах компании Nvidia:
- [17.05.16] Nvidia GeForce GTX 1080 — новый лидер игровой 3D-графики на ПК
- [01.06.15] Nvidia GeForce GTX 980 Ti — самый производительный однопроцессорный ускоритель игрового класса
- [22.04.15] Nvidia GeForce GTX Titan X — самый мощный однопроцессорный ускоритель
- [19.09.14] Nvidia GeForce GTX 980 — последователь GeForce GTX 680, обгоняющий даже GTX 780 Ti
- [12.03.14] Nvidia GeForce GTX 750 Ti — Maxwell начинает с малого… несмотря на Maxwell
Для начала мы рассмотрим подробные характеристики видеоплаты GeForce GTX 1070, основанной на урезанном графическом процессоре, уже известном нам под кодовым именем GP104.
Графический ускоритель GeForce GTX 1070 | |
Параметр | Значение |
Кодовое имя чипа | GP104 |
Технология производства | 16 нм FinFET |
Количество транзисторов | 7,2 млрд. |
Площадь ядра | 314 мм² |
Архитектура | Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др. |
Аппаратная поддержка DirectX | DirectX 12, с поддержкой уровня возможностей Feature Level 12_1 |
Шина памяти | 256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5 и GDDR5X памяти |
Частота графического процессора | 1506 (1683) МГц |
Вычислительные блоки | 15 активных (из 20 в чипе) потоковых мультипроцессоров, включающих 1920 (из 2560) скалярных ALU для расчетов с плавающей запятой в рамках стандарта IEEE 754-2008; |
Блоки текстурирования | 120 активных (из 160 в чипе) блоков текстурной адресации и фильтрации с поддержкой FP16- и FP32-компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов |
Блоки растровых операций (ROP) | 8 широких блоков ROP (64 пикселя) с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16- или FP32-формате буфера кадра. Блоки состоят из массива конфигурируемых ALU и отвечают за генерацию и сравнение глубины, мультисэмплинг и блендинг |
Поддержка мониторов | Интегрированная поддержка до четырех мониторов, подключенных по интерфейсам Dual Link DVI, HDMI 2.0b и DisplayPort 1.2 (1.3/1.4 Ready) |
Спецификации референсной видеокарты GeForce GTX 1070 | |
Параметр | Значение |
Частота ядра | 1506 (1683) МГц |
Количество универсальных процессоров | 1920 |
Количество текстурных блоков | 120 |
Количество блоков блендинга | 64 |
Эффективная частота памяти | 8000 (4×2000) МГц |
Тип памяти | GDDR5 |
Шина памяти | 256-бит |
Объем памяти | 8 ГБ |
Пропускная способность памяти | 256 ГБ/с |
Вычислительная производительность (FP32) | около 6,5 терафлопс |
Теоретическая максимальная скорость закраски | 96 гигапикселей/с |
Теоретическая скорость выборки текстур | 181 гигатекселей/с |
Шина | PCI Express 3.0 |
Разъемы | Один разъем Dual Link DVI, один HDMI и три DisplayPort |
Энергопотребление | до 150 Вт |
Дополнительное питание | Один 8-контактный разъем |
Число слотов, занимаемых в системном корпусе | 2 |
Рекомендуемая цена | $379—449 (США), 34 990 (Россия) |
Выпущенная сегодня модель видеокарты GeForce GTX 1070 получила вполне логичное наименование, аналогичное такому же решению из предыдущей серий GeForce. Оно отличается от своего прямого предшественника GeForce GTX 970 только измененной цифрой поколения. Новинка становится в текущей линейке компании на шаг ниже нынешнего топового решения GeForce GTX 1080, ставшего флагманом новой серии до выпуска решений на GPU еще большей мощности.
Рекомендованные цены на новую топовую видеоплату Nvidia составляют $379 и $449 для обычных версий партнеров Nvidia и специального издания Founders Edition, соответственно. По сравнению с топовой моделью, это очень хорошая цена с учетом того, что GTX 1070 уступает ей около 25% в худшем случае. И на момент анонса и выхода сегодняшняя новинка становится лучшим по производительности решением в своем классе. Российская рекомендованная цена менее привлекательна, так как в нашу цену вложены дополнительные расходы: налоги, транспортные и другие накладные расходы.
Анонсом второй модели видеокарты на основе чипа GP104 компания Nvidia бьет по защитным укреплениям конкурирующей компании AMD, которая пока что планирует скорый выпуск только меньших по мощности моделей. Судя по имеющейся официальной и неофициальной информации, у компании AMD на лето запланирован выпуск разве что менее мощных решений в рамках будущего поколения, с индексами до 480 и не более этого. Так что пока что у GeForce GTX 1070 и GTX 1080 прямых конкурентов просто не будет, а сравнивать младшую новинку пока что можно разве что с Radeon R9 390X и Fury.
У графического процессора GP104 в модификации GeForce GTX 1070 решили оставить полную 256-битную шину памяти, хотя применили не новый тип памяти GDDR5X, а очень быструю GDDR5, которая работает на высокой эффективной частоте в 8 ГГц. Объем установленной на видеокарту памяти с такой шиной может быть равен 4 или 8 ГБ, и, чтобы обеспечить максимальную производительность нового решения в условиях высоких настроек и разрешениях рендеринга, модель видеокарты GeForce GTX 1070 была также оснащена 8 ГБ видеопамяти, как и ее старшая сестра. Этого объема хватит для запуска любых 3D-приложений с максимальными настройками качества на несколько лет.
Специальное издание GeForce GTX 1070 Founders Edition
При анонсе GeForce GTX 1080 в начале мая было объявлено специальное издание видеокарты под названием Founders Edition, имеющее более высокую цену, по сравнению с обычными видеокартами партнеров компании. То же самое относится и к новинке. В этом материале мы снова расскажем о специальном издании видеокарты GeForce GTX 1070 под названием Founders Edition. Как и в случае старшей модели, Nvidia решила выпустить такой вариант референсной видеокарты производителя по более высокой цене. Они утверждают, что многие игроки и энтузиасты, покупающие дорогие видеокарты топового уровня, хотят продукт с соответствующим «премиальным» видом и ощущением от него.
Соответственно, именно для таких пользователей на рынок будет выпущена видеокарта GeForce GTX 1070 Founders Edition, которая спроектирована и выполнена инженерами Nvidia из премиальных материалов и компонентов, вроде алюминиевой крышки GeForce GTX 1070 Founders Edition, а также низкопрофильной задней пластины, прикрывающей оборотную сторону печатной платы и достаточно популярной среди энтузиастов.
Как вы можете видеть по фотографиям платы, GeForce GTX 1070 Founders Edition унаследовала ровно тот же индустриальный дизайн, присущий референсному варианту GeForce GTX 1080 Founders Edition. В обеих моделях применяется радиальный вентилятор, выбрасывающий нагретый воздух наружу, что очень полезно как в маленьких корпусах, так и многочиповых SLI-конфигурациях с ограниченным физически пространством. Выдув нагретого воздуха наружу вместо его циркуляции внутри корпуса позволяет снизить температурную нагрузку, повысить результаты разгона и продлить время жизни компонентам системы.
Под крышкой референсной системы охлаждения GeForce GTX 1070 скрывается алюминиевый радиатор специальной формы с тремя встроенными тепловыми трубками из меди, отводящими тепло от самого графического процессора. Тепло, отведенное тепловыми трубками, затем рассеивается при помощи алюминиевого радиатора. Ну и низкопрофильная металлическая пластина на оборотной стороне платы также предназначена для обеспечения лучших температурных характеристик. Она также имеет убираемую секцию для лучшего движения воздуха между несколькими видеокартами в SLI-конфигурациях.
Что касается системы питания платы, то GeForce GTX 1070 Founders Edition имеет четырехфазную систему питания, оптимизированную для стабильного снабжения энергией. Компания Nvidia уверяет, что использование специальных компонентов в GTX 1070 Founders Edition позволило повысить эффективность электроснабжения, стабильность и надежность по сравнению с GeForce GTX 970, обеспечив лучшие показатели при разгоне. В собственных тестах компании графические процессоры плат GeForce GTX 1070 легко превосходили значение в 1,9 ГГц, что близко к результатам старшей модели GTX 1080.
Видеокарта Nvidia GeForce GTX 1070 будет доступна в розничных магазинах начиная с 10 июня. Рекомендуемые цены на GeForce GTX 1070 Founders Edition и решения партнеров отличаются, и в этом заключается самый главный вопрос к этому специальному изданию. Если партнеры Nvidia будут продавать свои видеокарты GeForce GTX 1070 по цене, начиная от $379 (на рынке США), то Founders Edition референсного дизайна Nvidia будет стоить уже $449. Много ли найдется энтузиастов, готовых переплачивать за, скажем прямо, сомнительные преимущества референсного варианта? Время покажет, но мы считаем, что референсная плата интересна скорее как вариант, доступный к покупке в самом начале продаж, а позднее смысл его приобретения (да еще за большую цену!) уже сводится к нулю.
Остается добавить, что печатная плата референсной GeForce GTX 1070 схожа с таковой у старшей видеокарты и обе они отличаются от устройства предыдущих плат компании. Значение типичного энергопотребления для новинки составляет 150 Вт, что меньше значения для GTX 1080 почти на 20% и близко к потреблению энергии видеокартой предыдущего поколения GeForce GTX 970. Референсная плата Nvidia имеет уже привычный набор разъемов для присоединения устройств вывода изображения: один Dual-Link DVI, один HDMI и три DisplayPort. Причем, появилась поддержка новых версий HDMI и DisplayPort, о которой мы написали в обзоре модели GTX 1080.
Архитектурные изменения
Видеокарта модели GeForce GTX 1070 основана на чипе GP104, первенце нового поколения графической архитектуры Nvidia — Pascal. Эта архитектура взяла в основу решения, отработанные еще в Maxwell, но в ней есть и некоторые функциональные отличия, о которых мы подробно писали в обзоре топовой видеокарты GeForce GTX 1080.
Главным изменением новой архитектуры стал технологический процесс, по которому будут выполнены все новые графические процессоры. Применение техпроцесса 16 нм FinFET при производстве GP104 позволило значительно повысить сложность чипа при сохранении сравнительно невысокой площади и себестоимости, и первый же чип архитектуры Pascal имеет заметно большее количество исполнительных блоков, в том числе обеспечивающих новую функциональность, по сравнению с чипами Maxwell похожего позиционирования.
Видеочип GP104 по своему устройству схож с аналогичными решениями архитектуры Maxwell, и подробные данные об устройстве современных GPU вы можете найти в наших обзорах предыдущих решений компании Nvidia. Как и предыдущие графические процессоры, чипы новой архитектуры будут иметь разную конфигурацию вычислительных кластеров Graphics Processing Cluster (GPC), потоковых мультипроцессоров Streaming Multiprocessor (SM) и контроллеров памяти, и в GeForce GTX 1070 уже произошли некоторые изменения — часть чипа была заблокирована и неактивна (выделено серым):
Хотя в состав графического процессора GP104 входит четыре кластера GPC и 20 мультипроцессоров SM, в версии для GeForce GTX 1070 он получил урезанную модификацию с аппаратно отключенным одним кластером GPC. Так как каждый кластер GPC имеет выделенный движок растеризации и включает в себя пять мультипроцессоров SM, а каждый мультипроцессор состоит из 128 CUDA-ядер и восьми текстурных блоков TMU, то в этой версии GP104 активны 1920 CUDA-ядер и 120 блоков TMU из 2560 потоковых процессоров и 160 текстурных блоков, имеющихся физически.
Графический процессор, на котором основана видеокарта GeForce GTX 1070, содержит восемь 32-битных контроллеров памяти, дающих итоговую 256-битную шину памяти — ровно как в случае старшей модели GTX 1080. Подсистема памяти не была урезана для того, чтобы обеспечить достаточно высокую пропускную способность памяти с условием применения GDDR5-памяти в GeForce GTX 1070. К каждому из контроллеров памяти привязано по восемь блоков ROP и 256 КБ кэш-памяти второго уровня, поэтому чип GP104 и в этой модификации также содержит 64 блоков ROP и 2048 КБ кэш-памяти второго уровня.
Благодаря архитектурным оптимизациям и новому техпроцессу, графический процессор GP104 стал самым энергоэффективным графическим процессором на данный момент. Инженеры компании Nvidia смогли повысить тактовую частоту больше, чем они рассчитывали при переходе на новый техпроцесс, для чего им пришлось хорошо поработать, тщательно проверив и оптимизировав все узкие места предыдущих решений, не позволяющие им работать на более высокой частоте. Соответственно, GeForce GTX 1070 также работает на очень высокой частоте, более чем на 40% выше референсного значения для GeForce GTX 970.
Так как модель GeForce GTX 1070 является, по своей сути, просто чуть менее производительной GTX 1080 с GDDR5-памятью, то она поддерживает абсолютно все технологии, описанные нами в обзоре первенца новой линейки компании Nvidia. Чтобы получить больше деталей об архитектуре Pascal, равно как и поддерживаемых ей технологиях, вроде улучшенных блоков вывода и обработки видеоданных, поддержки асинхронных вычислений Async Compute, технологии мультипроецирования Simultaneous Multi-Projection, изменениях в многочиповом рендеринге SLI и новом типе синхронизации Fast Sync, стоит ознакомиться с этим материалом.
Высокопроизводительная GDDR5-память и ее эффективное использование
Мы уже писали об изменениях в подсистеме памяти у графического процессора GP104, на котором основаны модели GeForce GTX 1080 и GTX 1070 — контроллеры памяти, имеющиеся в составе этого GPU, поддерживают как новый тип видеопамяти GDDR5X, о котором подробно написано в обзоре GTX 1080, так и старую добрую GDDR5-память, известную нам вот уже несколько лет.
Чтобы не слишком много потерять в пропускной способности памяти в младшей модели GTX 1070 по сравнению со старшей GTX 1080, в ней оставили активными все восемь 32-битных контроллеров памяти, получив полноценный 256-битный общий интерфейс видеопамяти. Кроме этого, видеокарту оснастили самой высокоскоростной GDDR5-памятью, которая только была доступна на рынке — с эффективной частотой работы в 8 ГГц. Все это обеспечило ПСП в 256 ГБ/с, в отличие от 320 ГБ/с у старшего решения — примерно на столько же были урезаны и вычислительные возможности, так что баланс был соблюден.
Не забываем, что хотя пиковая теоретическая пропускная способность важна для производительности графических процессоров, нужно обращать внимание и на эффективность ее использования. В процессе рендеринга, множество разных узких мест может ограничивать общую производительность, не давая использовать всю имеющуюся ПСП. Чтобы минимизировать количество таких узких мест, в графических процессорах применяется специальное сжатие информации без потерь, повышающее эффективность операций чтения и записи данных.
В архитектуре Pascal было внедрено уже четвертое поколение дельта-сжатия информации буферов, позволяющее GPU более эффективно использовать имеющиеся возможности шины видеопамяти. Подсистема памяти в GeForce GTX 1070 и GTX 1080 использует улучшенные старые и несколько новых техник по сжатию данных без потерь, предназначенные для снижения требований к ПСП. Это снижает количество записываемых данных в память, улучшает эффективность использования L2-кэша и уменьшает количество данных, пересылаемых между разными точками GPU, вроде TMU и фреймбуфера.
Более подробно о новых алгоритмах внутричипового дельта-сжатия без потерь информации написано в обзоре GeForce GTX 1080, а нам остается добавить, что по средним оценкам Nvidia, улучшенное сжатие приносит 20%-ный рост эффективности использования пропускной способности памяти в играх — в дополнение к очень быстрой GDDR5-памяти, примененной в GeForce GTX 1070.
GPU Boost 3.0 и особенности разгона
Большинство партнеров компании Nvidia уже анонсировали фабрично разогнанные решения на основе GeForce GTX 1080 и GTX 1070. А многие из производителей видеокарт создают и специальные утилиты для разгона, позволяющие использовать новую функциональность технологии GPU Boost 3.0. Одним из примеров таких утилит является EVGA Precision XOC, которая включает автоматический сканер для определения кривой соотношения напряжений и частот — в этом режиме для каждого из значений напряжения при помощи запуска теста стабильности находится стабильная частота, при которой GPU обеспечивает рост производительности. Впрочем, эту кривую можно изменять и вручную.
Технологию GPU Boost мы хорошо знаем по предыдущим видеокартам компании Nvidia. В своих графических процессорах они применяют эту аппаратную особенность, предназначенную для увеличения рабочей тактовой частоты GPU в режимах, когда он еще не достиг пределов по энергопотреблению и тепловыделению. В графических процессорах Pascal этот алгоритм претерпел несколько изменений, основным из которых стала более тонкая установка турбо-частот, в зависимости от напряжения.
Если раньше разница между базовой частотой и турбо-частотой была фиксированной, то в GPU Boost 3.0 появилась возможность установки смещений турбо-частот для каждого напряжения по отдельности. Теперь турбо-частота может устанавливаться для каждого из индивидуальных значений напряжения, что позволяет полностью выжимать все возможности разгона из GPU. Мы подробно писали об этой возможности в обзоре GeForce GTX 1080, и для этого можно использовать утилиты EVGA Precision XOC и MSI Afterburner.
Так как в методике разгона с выходом видеокарт с поддержкой GPU Boost 3.0 изменились некоторые детали, то Nvidia пришлось сделать дополнительные пояснения в инструкции по разгону новинок. Существуют разные методики разгона с различными переменными характеристиками, влияющими на итоговый результат. Для каждой конкретной системы может лучше подойти какой-то определенный метод, но основа всегда примерно одинакова.
Многие из оверклокеров для проверки стабильности системы используют бенчмарк Unigine Heaven 4.0, который отлично загружает графический процессор работой, имеет гибкие настройки и может быть запущен в оконном режиме вместе с окном утилиты для разгона и мониторинга рядом, вроде EVGA Precision или MSI Afterburner. Впрочем, такой проверки достаточно лишь для начальных прикидок, а для крепкого подтверждения стабильности разгона, его необходимо проверить в нескольких игровых приложениях, потому что разные игры предполагают отличающуюся нагрузку на различные функциональные блоки GPU: математические, текстурные, геометрические. Бенчмарк Heaven 4.0 также удобен для задачи разгона потому, что в нем есть закольцованный режим работы, в котором удобно менять настройки разгона и есть бенчмарк для оценки прироста скорости.
Nvidia советует при разгоне новых видеокарт GeForce GTX 1080 и GTX 1070 запускать окна Heaven 4.0 и EVGA Precision XOC совместно. Сначала желательно сразу же повысить скорость вращения вентилятора. И для серьезного разгона можно сразу выставлять значение скорости на 100%, что сделает работу видеокарты очень громкой, но максимально охладит GPU и остальные компоненты видеокарты, снизив температуру на минимально возможный уровень, предотвратив тротлинг (снижение частот из-за роста температуры GPU выше определенного значения).
Далее нужно установить целевое значение питания (Power Target) также на максимум. Эта настройка позволит обеспечить графический процессор максимально возможным количеством энергии, повысив уровень энергопотребления и целевую температуру GPU (GPU Temp Target). В некоторых целях, второе значение можно отделить от изменения Power Target, и тогда эти настройки можно будет настраивать индивидуально — для достижения меньшего нагрева видеочипа, например.
Следующим шагом идет увеличение значения прироста частоты видеочипа (GPU Clock Offset) — оно означает, насколько большей будет турбо-частота при работе. Это значение повышает частоту для всех значений напряжения и приводит к большей производительности. Как обычно, при разгоне нужно проверять стабильность при повышении частоты GPU небольшими шагами — от 10 МГц до 50 МГц на шаг до того, как будет отмечено зависание, ошибка драйвера или приложения или даже визуальные артефакты. При достижении такого лимита следует снизить значение частоты на шаг вниз и еще раз проверить стабильность и производительность при разгоне.
Кроме частоты GPU, можно также увеличить и частоту видеопамяти (Memory Clock Offset), что особенно важно в случае GeForce GTX 1070, оснащенной GDDR5-памятью, которая обычно неплохо разгоняется. Процесс в случае частоты работы памяти в точности повторяет то, что делается при нахождении стабильной частоты GPU, единственная разница в том, что шаги можно делать крупнее — добавлять сразу по 50-100 МГц к базовой частоте.
Кроме описанных выше шагов, можно увеличить и предел напряжения (Overvoltage), ведь более высокая частота графического процессора часто достигается при повышенном напряжении, когда работающие нестабильно части GPU получают дополнительное питание. Правда, потенциальным минусом повышения данного значения является возможность повреждения видеочипа и ускоренного выхода его из строя, поэтому нужно использовать повышение напряжения с особой осторожностью.
Любители разгона используют несколько отличающиеся методики, изменяя параметры в разном порядке. Например, некоторые оверклокеры разделяют опыты по нахождению стабильной частоты GPU и памяти, чтобы они не мешали друг другу, а потом тестируют комбинированный разгон и видеочипа и микросхем памяти, но это уже — несущественные детали индивидуального подхода.
Судя по мнениям в форумах и комментариях к статьям, некоторым пользователям не пришелся по вкусу новый алгоритм работы GPU Boost 3.0, когда частота GPU сначала задирается очень высоко, зачастую выше турбо-частоты, но потом, под воздействием роста температуры GPU или возросшего энергопотребления выше установленного предела, она может опуститься до значительно меньших значений. Это просто специфика работы обновленного алгоритма, нужно привыкнуть к новому поведению динамически изменяемой частоты GPU, но никаких негативных последствий оно не несет.
Выводы по теоретической части
Видеокарта GeForce GTX 1070 стала второй после GTX 1080 моделью в новой линейке компании Nvidia, основанной на графических процессорах семейства Pascal. Новый технологический процесс 16 нм FinFET и оптимизации архитектуры позволили представленной видеокарте достичь высокой тактовой частоты, в чем ей помогает и новое поколение технологии GPU Boost. Даже несмотря на урезанное количество функциональных блоков в виде потоковых процессоров и текстурных модулей, их количество осталось достаточным для того, чтобы GTX 1070 стала самым выгодным и энергоэффективным решением.
Установка на младшую из пары выпущенных моделей видеокарт Nvidia на чипе GP104 памяти стандарта GDDR5, в отличие от нового типа GDDR5X, которым отличается GTX 1080, не мешает ей достичь высоких показателей производительности. Во-первых, в Nvidia решили не урезать шину памяти модели GeForce GTX 1070, а во-вторых, на нее поставили самую быструю GDDR5-память с эффективной частотой в 8 ГГц, что лишь чуть ниже 10 ГГц у применяемой в старшей модели GDDR5X. Учитывая еще и улучшенные алгоритмы дельта-сжатия, эффективная пропускная способность памяти графического процессора стала выше этого же параметра у аналогичной модели предыдущего поколения GeForce GTX 970.
Несмотря на то, что Pascal во многом архитектурно повторяет решения Maxwell, и эти графические архитектуры не слишком сильно отличаются друг от друга, в GP104 были внесены многочисленные улучшения по возможностям вывода изображения на устройства отображения, улучшена функциональность блоков кодирования и декодирования видеоданных, было улучшено асинхронное исполнение различных типов вычислений на GPU, внесены изменения в многочиповый рендеринг и внедрен новый метод синхронизации Fast Sync. Отдельно выделим VRWorks Audio — возможность качественного обсчета звука, учитывающую многочисленные отражения звуковых волн с использованием аппаратной трассировки лучей и технологию мультипроецирования Simultaneous Multi-Projection, которая помогает повысить производительность в системах виртуальной реальности и получить корректное отображение сцен на многомониторных системах.
Многое из новых технологий — задел на будущее, и все это относится к обеим видеокартам Nvidia семейства Pascal, а конкретно модель GeForce GTX 1070 хороша тем, что предлагает очень высокую производительность и поддержку новых возможностей и алгоритмов при значительно меньшей цене, по сравнению со старшей моделью, анонсированной чуть ранее. Если приобретение GTX 1080 за 55 000 себе смогут позволить единицы энтузиастов, то выложить 35 000 за лишь на четверть менее производительное решение ровно с теми же возможностями сможет уже куда больший круг потенциальных покупателей. Именно сочетание сравнительно низкой цены и высокой производительности и делает GeForce GTX 1070, пожалуй, самым выгодным приобретением на данный момент.
В следующих частях нашего материала мы как раз оценим производительность новой видеокарты Nvidia GeForce GTX 1070 на практике, сравнив ее скорость с показателями самых мощных одночиповых видеосистем компании Nvidia и AMD, в том числе и старшей моделью GeForce GTX 1080, сравнение с которой станет самым интересным. И перед тем, как перейти к игровым тестам, мы сначала рассмотрим данные, полученные в нашем наборе синтетических тестов.
Nvidia GeForce GTX 1070 — Часть 2: особенности карты и синтетические тесты →
Средняя текущая цена (количество предложений) в московской рознице: | |
Рассматриваемые карты | Конкуренты |
GTX 1070 — $530 (на 01.06.16) | GTX 980 Ti — $655 (на 01.06.16) |
GTX 1070 — $530 (на 01.06.16) | GTX 980 — $495 (на 01.06.16) |
GTX 1070 — $530 (на 01.06.16) | R9 Fury — $584 (на 01.06.16) |
Благодарим компанию Nvidia Russia
и лично
Ирину Шеховцову
за предоставленную на тестирование видеокарту
Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair |
Технические характеристики и особенности видеокарты
Наименование | Nvidia GeForce GTX 1070 | MSI GeForce GTX 1070 AERO ITX 8G OC |
Графический процессор | GP104-200-A1 | GP104-200-A1 |
Техпроцесс | 16 нм | 16 нм |
Размер ядра | 314 мм2 | 314 мм2 |
Базовая тактовая частота | 1506 МГц | 1531МГц |
Тактовая частота с ускорением | 1683 МГц | 1721 МГц |
Количество ядер CUDA | 1920 | 1920 |
Количество текстурных блоков | 120 | 120 |
Количество блоков растеризации | 64 | 64 |
Тип памяти | GDDR5 | GDDR5 |
Быстродействие памяти | 8 Гбит/с | 8 Гбит/с |
Объем памяти | 8 Гб | 8 Гб |
Полоса пропускания шины памяти | 256 бит | 256 бит |
Дополнительные разъемы питания | 8 | 8 |
Потребляемая мощность | 150 Вт | 150 Вт |
Размеры (ДхВхШ) | 267х111х40 мм | 175 x 129 x 40 мм |
Видеовыходы | Dual Link DVI-D(1 шт), DP 1.4 (3 шт),HDMI 2.0b (1 шт) | Dual Link DVI-D (1 шт),DP 1.4 (2 шт),HDMI 2.0b (2 шт) |
Отличий технических характеристик от GeForce GTX 1070 в референсном исполнении у MSI GeForce GTX 1070 AERO ITX 8G OCпрактически нет. С помощью программы TechPowerUp GPU-Z 2.2.0 мы узнаем о некоторых из них:
В предустановленной версии BIOS 86.04.50.40.0A базовая частота была увеличена на 25 МГц от референсных, бустовая- на 38 МГц. Частота памяти осталась без изменений.
Но не обошлось без ложки дегтя. Производитель, учитывая габариты видеокарты и ее предназначение (установка в компактные корпуса), лимиты потребления оставил скромными — 151 Вт с возможностью расширения до 170 Вт.
Наша практика показывает, что графическому процессоруGP104-200-A1 в некоторых сценариях столь жестких лимитов будет не хватать, что ограничит разгон и производительность. С одной стороны, для видеокарты с дополнительным питание 8-pin лимиты потребления можно смело увеличивать до 225 Вт (75 Вт — слот PCI-E, 150 Вт — 8-pin), с другой- это увеличило бы потребление и нагрев видеокарты, что в компактном корпусе недопустимо.
Несмотря на габариты системы охлаждения и наличие всего одного вентилятора, видеокарта MSI GeForce GTX 1070 AERO ITX 8G OCобладает функцией ZERO FROZR. До ~50оС (в нашем случае — до 55оС) вентиляторсистемы охлаждения видеокарты находится в остановленном состоянии.
Частота графического процессора при бездействии опускается до 139 МГц, памяти — до 202 МГц (808 МГц эффективная).
График соответствия частот и напряжений при температуре 30-40оС выглядит следующим образом:
Как мы видим, в обычных условиях (без превышения лимитов потребления) графический процессор может достигать 1936 МГц с последующим снижением частоты при росте температуры. Нагрузка в виде рендера в программеTechPowerUp GPU-Z 2.2.0 подтверждает это — частота видеокарты достигает 1936 МГц при напряжении 1.063 В.
При достижении температуры 55оС вентиляторвидеокарты начинает вращение на 900 оборотах в минуту.Если нагрузка оказывается слабой или кратковременной, то температура начинает снижаться, и42оС вентиляторостанавливается.
С помощью программыMSI Afterburner 4.4.0 Beta 16мы установили вращение вентилятора на максимальное значение. При этом он раскручивался до 2300 оборотов в минуту, а шум, исходящий от системного блока, был умеренным.
Тесты в бенчмарках
3DMark Cloud Gate GPU: 106934
Лучше, чем NVIDIA GeForce RTX 2070 Max-Q, но хуже NVIDIA GeForce RTX 2060.
3DMark Cloud Gate Standard Score: 30229.5
Лучше, чем NVIDIA GeForce GTX 1060 6GB, но хуже NVIDIA GeForce RTX 2060 Max-Q.
3DMark Fire Strike Graphics: 18255
Лучше, чем NVIDIA GeForce GTX 1080 Max-Q, но хуже NVIDIA RTX A3000 Mobile.
3DMark Fire Strike Score: 14984
Лучше, чем NVIDIA GeForce GTX 1660 SUPER, но хуже NVIDIA Quadro RTX 4000 Max-Q.
3DMark Ice Storm GPU: 463865
Лучше, чем NVIDIA GeForce RTX 2070 Super Max-Q, но хуже AMD Radeon RX 6800M.
3DMark Time Spy Graphics: 5896
Лучше, чем NVIDIA GeForce GTX 1080 Max-Q, но хуже AMD Radeon RX 5600M.
3DMark Time Spy Score: 5679
Лучше, чем NVIDIA GeForce GTX 1080 Max-Q, но хуже NVIDIA GeForce GTX 1660 Ti Mobile.
3DMark Vantage P: 50995
Лучше, чем NVIDIA GeForce RTX 2060 Max-Q, но хуже NVIDIA GeForce RTX 2080 Max-Q.
3DMark06: 37799.5
Лучше, чем NVIDIA GeForce RTX 2080 Max-Q, но хуже NVIDIA GeForce RTX 2080 SUPER.
3DMark11 P: 19449
Лучше, чем NVIDIA GeForce RTX 2070 Max-Q, но хуже NVIDIA GeForce GTX 1660 Ti.
3DMark11 P GPU: 24652
Лучше, чем NVIDIA Quadro RTX 5000, но хуже NVIDIA Quadro RTX 4000.
Cinebench R10 32Bit OpenGL: 6835
Лучше, чем NVIDIA GeForce RTX 2070 Super Max-Q, но хуже NVIDIA Quadro P3000.
Cinebench R15 OpenGL 64Bit: 136.03
Лучше, чем AMD Radeon RX Vega 64, но хуже NVIDIA Quadro P1000.
ComputeMark v2.1 Normal, Score: 13488.5
Лучше, чем NVIDIA GeForce GTX 1070 SLI (мобильная), но хуже NVIDIA Quadro RTX 4000.
LuxMark v2.0 64Bit Sala GPUs-only: 4444.5
Лучше, чем NVIDIA GeForce GTX 1660 Ti, но хуже NVIDIA GeForce GTX 1660 SUPER.
Passmark: 13352
Лучше, чем NVIDIA Quadro RTX 4000, но хуже AMD Radeon RX Vega 56.
SPECviewperf 12 — 3ds Max: 169
Лучше, чем AMD Radeon VII, но хуже AMD Radeon RX 5700 XT.
SPECviewperf 12 — Maya: 132
Лучше, чем NVIDIA GeForce GTX 1660 SUPER, но хуже NVIDIA GeForce RTX 2080 SUPER.
SPECviewperf 12 — Showcase: 82
Лучше, чем NVIDIA GeForce GTX 1070 Mobile, но хуже NVIDIA Quadro RTX 3000.
Unigine Heaven 4.0: 2815
Лучше, чем NVIDIA GeForce GTX TITAN X, но хуже NVIDIA Quadro P4000.
Unigine Valley 1.0 Extreme HD DirectX: 92.6
Лучше, чем NVIDIA GeForce RTX 2060, но хуже AMD Radeon RX 6600.
Тестовый стенд
- Материнская плата:ASUS ROG CROSSHAIR VI HERO (BIOS 9920);
- Процессор: AMD Ryzen 7 1800X в разгоне до 3900 МГц при напряжении 1.285 В;
- Система охлаждения:EK-XLC Predator 240 Ryzen Edition;
- Термоинтерфейс: Arctic Cooling MX-4;
- Оперативная память: 2 x 8 Гбайт KFA2 HOF Hall Of Fame (HOF4CXLBS4000M19SF162K,3466 МГц 14-14-14-14-28 CR1, singlerank Samsung B-Die);
- Видеокарта:MSI GeForce GTX 1070 AERO ITX 8G OC / Nvidia GeForce GTX 10708 Гбайт GDDR5;
- Блок питания:Aerocool HIGGS-750W мощностью 750 Ватт;
- Системный накопитель:SSD Plextor m7v128 Гбайт;
- Корпус:Thermaltake View 31 TG.
Тестирование системы охлаждения и разгон
Тестирование системы охлаждения проводилось в тесте устойчивости Fire Strike из пакета Futuremark 3DMark. Комнатная температура находилась в диапазоне24-26оС, боковая крышка корпуса была закрыта, дополнительное охлаждение отсутствовало.
И в данном случае мы сталкиваемся с тем, о чем писали выше — нехватка лимитов потребления, как следствие — напряжение не превышало 1.031 В, частота в пике достигала всего 1898 МГц и опускалась с ростом температуры и для удержания в рамках Power Limit. Температура графического процессора в данных условиях не поднималась выше 70оС, вентиляторв пике раскручивалсядо 1600 оборотов в минуту. Для такой маленькой видеокарты результат отличный, но стоит понимать, что в тесном корпусе температуры будут несколько выше.
На данных установках было проведено тестирование в популярных синтетических тестах.
Futuremark 3DMark
3DMark — этосамый популярный пакет тестовых приложений, используемый как оверклокерами всего мира, так и пользователями, стремящимися выяснить графическую и процессорную производительность своего компьютера.
Тест состоит из четырех сцен, две из которых выявляют мощность видеокарты (общий балл Graphics score), одна — процессорную производительность (Physics score), последняя сцена определяет комплексную производительность системы (Combined Score). Именно наGraphics score нужно акцентировать внимание в случае тестов видеокарты.
Тест проводит симуляцию игровой нагрузки в разрешении FHD (Firestrike), QHD (Firestrike Extreme) и 4K (Firestrike Ultra). Тестовое приложение Time Spy позволяет определит производительность видеокарты и процессора в API DirectX 12.
Unigine Superposition Benchmark
Еще одно «молодое» тестовое приложение, пришедшее на заменуUnigine Heaven иUnigine Valley (которые, к слову, еще не утратили своей популярности). Как можно видеть, даже в разрешении FHD и установках Extreme для видеокарты создается колоссальная нагрузка.
Разгон
Даже для такой маленькой видеокарты не исключается разгон. Учитывая, что графический процессор здесь ничем не отличается от установленных на самые навороченные видеокарты, компенсация низкого заводского разгона (мы бы даже сказалипрактически полное его отсутствие) вполне возможна с помощью ручного разгона. Ограничителямив данном случае будутмалые лимиты мощности в BIOS, система охлаждения и микросхемы памяти Micron.
С помощью программыMSI Afterburner 4.4.0 Beta 16мы увеличили лимиты потребления до максимально возможных, напряжение жес учетом ограниченного Power Limitне увеличивалось.
В данном случае удалось добиться 2062 МГц в пике, в конечном итоге частота опускалась до 1999 МГц. Частота памяти была увеличена до 2250 МГц (9000 МГц эффективная).Напряжение не превышало 1.025 В, чтобы удержать карту в рамках лимитов мощности. В данных условиях температура видеокарты выросла до 73оС, вращение вентилятора повысилось до 1700 оборотов в минуту.
Однако, как известно, видеокарты поколения Pascal часто показывают возможность работы на высоких частотах при низком напряжении. Пользуясь данным знанием, мы уменьшили рабочее напряжение до 0.993 В. В данных условиях частоту графического процессора удалось поднять до 2038 МГц, частота видеопамяти осталась без изменений.
Температура и обороты вентилятора не изменились, но моменты превышения лимита мощности, как и снижения частоты, стали появляться реже. В итоге мы получили увеличение средней рабочей частоты и улучшение ее стабильности.
Установив вращение вентилятора до максимального значения, мы также провели тест устойчивости Firestrike.
Частота графического процессора поднималась до 2050 МГц, температура графического процессора не превысила 64оС, а график частоты стал еще прямее.
В данных условиях мы получили увеличение производительности в Firestrike и Time Spyна 11%, в Firestrike Extreme и Firestrike Ultraна 12%.
Увеличение производительности — приятное, особенно, если учесть небольшой нагрев и отсутствие шума. Но мы не избавились от основной проблемы — лимитов потребления. Для этого проведем некоторое исследование.
Установка сторонней версии BIOS
При поиске стороннего BIOS наш выбор пал наMSI GeForce GTX 1070 GAMING Z 8G. Данная видеокарта обладает высоким заводским разгоном ивысокими лимитами потребления относительно героини нашего обзора. Также в сети есть версия BIOS с исправлениями для памяти Micron.
В итогена видеокарту былустановленBIOS версии 86.04.50.00.29
Базовая частота в ней увеличена до 1633 МГц, частота ускорения — до 1835 МГц. Частоту микросхем памяти также не обошли стороной и увеличили до 2025 МГц (8100 МГц эффективная). И самое главное — лимиты потребления составляют 230 Вт с возможностью расширения до 291 Вт!
Это то, что нам нужно. Даже нет необходимости сдвигать ползунок Power Limit в сторону увеличения.
Без разгона частота ядра достигала 2025 МГц даже при 46оС! То есть мы практически достигли максимальных частот для родной версии BIOS без какого-либо разгона. Однако, разница в системах охлаждения позволила отодвинуть планку старта вентиляторов наMSI GeForce GTX 1070 GAMING Z 8G до ~62оС. Для нашей видеокарты это — неприемлемо, поэтому с помощью MSI Afterburner мы изменили кривую оборотов вентилятора следующим образом.
Без разгона мы получили следующие результаты в тесте устойчивости Firestrike:
Максимальная частота видеокарты достигала 2012 МГц, напряжение — 1.062 В, а лимиты потребления не превысили 45.5% по мониторингу. Как итог — сброса частоты, как и упора в Power Limit, не было. То, чего мы так ждали.
Некоторое изменение работы вращения вентилятора привело к снижению максимальной температуры до 69оС, однако вентилятор вращался в пике уже на 1900 оборотах в минуту. Стоит признать, что шум от единственного вентилятора при этом был приемлемым.
Но вернемся к цели нашего эксперимента — поиску максимального разгона для нашего экземпляра видеокарты. И нас он не разочаровал.
Без увеличения напряжения (которое мало, что давало, кроме нагрева), частота графического процессора была увеличена до 2152 МГц, а частота микросхем памяти — до 2275 МГц (9100 МГц эффективная).
При 1800 оборотах в минуту графический процессор прогрелся до 72оС, что является хорошим результатом для полноценных карт, не говоря уже о формате ITX.
Увеличение производительности даже относительно результатов, полученных в разгоне на родной версии BIOS, нельзя назвать незаметным.
Мы получили увеличение производительности в Firestrike на 3%, в Firestrike Extreme,Firestrike Ultra и Time Spy — на 4%.
Если бы графическая память имела больший разгонный потенциал (достаточно было бы микросхем Samsung), то результаты были бы еще лучше. Однакопо отношению к заводским настройкам прирост выглядит куда более внушительным:
⇡#Тестовая конфигурация, инструментарий и методика тестирования
Тестовая платформа получила обновления в виде нового процессора, новой материнской платы и оперативной памяти, поэтому теперь тестирование производительности видеокарт будет проводиться на системе следующей конфигурации:
- системная плата: ASUS X99-A II (Intel X99 Express, LGA2011-v3, BIOS 0801 от 30.06.2016);
- центральный процессор: Intel Core i7-6900K (14 нм, Broadwell-E, R0, 3,2 ГГц, 1,1 В, 8 × 256 Kбайт L2, 20 Мбайт L3);
- система охлаждения CPU: Phanteks PH-TC14PЕ (2 Corsair AF140, ~900 об/мин);
- термоинтерфейс: ARCTIC MX-4 (8,5 Вт/(м·К);
- оперативная память: DDR4 4 × 4 Гбайт Corsair Vengeance LPX 2800 МГц (CMK16GX4M4A2800C16) (XMP 2800 МГц/16-18-18-36_2T/1,2 В или 3000 МГц/16-18-18-36_2T/1,35 В);
- видеокарты: Gigabyte GeForce GTX 1080 G1 Gaming 8 Гбайт 1722-1861(1950)/10008 МГц;
- NVIDIA GeForce GTX 980 Ti 6 Гбайт 1000-1076(1189)/7012 МГц;
- MSI GeForce GTX 1070 Gaming X 8 Гбайт 1607-1797(2000)/8108 МГц;
- Inno3D iChill GeForce GTX 980 Ultra HerculeZ X4 Air Boss 4 Гбайт 1266-1367(1394)/7200 МГц;
- Sapphire NITRO R9 390 OC Tri-X 8 Гбайт 1040/6000 МГц;
- NVIDIA GeForce GTX 1060 6 Гбайт 1506-1709(1886)/8008 МГц;
О конкурентах. Во-первых, в качестве верхнего для GeForce GTX 1070 ориентира по производительности в тестирование была включена оригинальная Gigabyte GeForce GTX 1080 G1 Gaming на своих номинальных частотах. Во-вторых, прямым конкурентом по стоимости GeForce GTX 1070, как это ни странно, является прежний флагман – GeForce GTX 980 Ti, который также был включён в наш сегодняшний тест в лице эталонной версии NVIDIA.
В-третьих, не сильно меньше MSI GeForce GTX 1070 Gaming X стоят и два следующих участника сегодняшнего тестирования: Inno3D iChill GeForce GTX 980 Ultra HerculeZ X4 Air Boss и Sapphire NITRO R9 390 OC Tri-X.
Что касается видеокарты AMD, то для сравнения с GeForce GTX 1070, исходя из её розничной стоимости, в тестирование корректнее было бы включить AMD Radeon R9 Fury или даже Fury X, но эти видеокарты, к сожалению, у тестеров в дефиците (как и, впрочем, большинство моделей на GPU AMD), поэтому пришлось ограничиться тем, что есть в доступе.
Наконец, пятой видеокартой для сравнения с MSI GeForce GTX 1070 Gaming X стала пока ещё самая новая NVIDIA GeForce GTX 1060 в эталонном исполнении.
Её включение в тестирование обусловлено необходимостью оценить разницу в производительности между GeForce GTX 1070 и GTX 1060. Добавим, что пределы по питанию и температуре на всех видеокартах были увеличены до максимально возможных, а в драйверах GeForce был выставлен приоритет максимальной производительности.
Для снижения зависимости производительности видеокарт от скорости платформы 14-нм восьмиядерный процессор при множителе 40, опорной частоте 100 МГц и активированной на третий уровень функции Load-Line Calibration был разогнан до 4,0 ГГц при повышении напряжения в BIOS материнской платы до 1,21 В.
При этом 16 гигабайт оперативной памяти функционировали на частоте 3,2 ГГц с таймингами 16-16-16-26 CR1 при напряжении 1,35 В. Тестирование, начатое 12 сентября 2016 года, было проведено под управлением операционной системы Microsoft Windows 10 Professional со всеми обновлениями на указанную дату и с установкой следующих драйверов:
- чипсет материнской платы Intel Chipset Drivers – 10.1.1.35 WHQL от 09.09.2016;
- Intel Management Engine Interface (MEI) – 11.6.0.1023 WHQL от 12.09.2016;
- драйверы видеокарт на графических процессорах NVIDIA – GeForce 372.70 WHQL от 30.08.2016;
- драйверы видеокарты на графическом процессоре AMD – AMD Radeon Software Crimson 16.9.2 от 21.09.2016 (видеокарта Sapphire тестировалась последней, поэтому драйверы свежее даты начала тестов).
Производительность видеокарт была проверена в разрешениях 1920 × 1080 и 2560 × 1440 пикселей. Для тестов использовались два режима качества графики: Quality + AF16x – качество текстур в драйверах по умолчанию с включением анизотропной фильтрации уровня 16х и Quality + AF16x + MSAA 4х(8х) с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания степени 4x или 8x, в случаях, когда среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. В отдельных играх, в силу специфики их игровых движков, были использованы иные алгоритмы сглаживания, что будет указано далее в методике и на диаграммах. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если же данные настройки в играх отсутствовали, то параметры изменялись в панели управления драйверов GeForce. Там же была принудительно отключена вертикальная синхронизация (V-Sync). Кроме указанного, никаких дополнительных изменений в настройки драйверов не вносилось.
Видеокарты были протестированы в одном графическом бенчмарке и четырнадцати играх, обновлённых до последних версий на дату начала подготовки материала. Список тестовых приложений выглядит следующим образом (игры и далее результаты тестирования в них расположены в порядке их официального выхода):
- 3DMark (DirectX 9/11) – версия 2.1.2973, тестирование в сценах Fire Strike, Fire Strike Extreme, Fire Strike Ultra и Time Spy;
- Crysis 3 (DirectX 11) – версия 1.3.0.0, все настройки качества графики на максимум, степень размытости средняя, блики включены, режимы с FXAA и с MSAA 4x, двойной последовательный проход заскриптованной сцены из начала миссии Swamp продолжительностью 105 секунд;
- Metro: LastLight (DirectX 11) – версия 1.0.0.15, использовался встроенный в игру тест, настройки качества графики и тесселяция на уровне Very High, технология Advanced PhysX в двух режимах тестирования, тесты с SSAA и без сглаживания, двойной последовательный прогон сцены D6;
- Battlefield 4 (DirectX 11) – версия 1.2.0.1, все настройки качества графики на Ultra, двойной последовательный прогон заскриптованной сцены из начала миссии TASHGAR продолжительностью 110 секунд;
- Thief (DirectX 11) – версия 1.7 build 4158.21, настройки качества графики на максимальный уровень, технологии Paralax Occlusion Mapping и Tessellation активированы, двойной последовательный прогон встроенного в игру бенчмарка;
- Sniper Elite III (DirectX 11) – версия 1.15a, настройки качества на уровне Ultra, V-Synс отключён, тесселяция и все эффекты активированы, тесты с SSAA 4x и без сглаживания, двойной последовательный прогон встроенного в игру бенчмарка;
- GrandTheftAutoV (DirectX 11) – build 791.1, настройки качества на уровне Very High, игнорирование предложенных ограничений включено, V-Synс отключена, FXAA активировано, NVIDIA TXAA выключено, MSAA для отражений выключено, мягкие тени NVIDIA;
- DiRT Rally (DirectX 11) – версия 1.22, использовался встроенный в игру тест на трассе Okutama, настройки качества графики на максимальный уровень по всем пунктам, Advanced Blending – On; тесты с MSAA 8x и без сглаживания;
- Batman: ArkhamKnight (DirectX 11) – версия 1.6.2.0, настройки качества на уровне High, Texture Resolutioin normal, Anti-Аliasing on, V-Synс отключена, тесты в двух режимах – с активацией двух последних опций NVIDIA GameWorks и без них, двойной последовательный прогон встроенного в игру теста;
- TomClancy‘sRainbowSix: Siege (DirectX 11) – версия 4.2, настройки качества текстур на уровне Very High, Texture Filtering – Anisotropic 16X и прочие максимальные настройки качества, тесты с MSAA 4x и без сглаживания, двойной последовательный прогон встроенного в игру теста.
- RiseoftheTombRaider (DirectX 12) – версия 1.0 build 668.1_64, все параметры на уровень Very High, Dynamic Foliage – High, Ambient Occlusion – HBAO+, тесселяция и прочие методики улучшения качества активированы, по два цикла теста встроенного бенчмарка (сцена Geothermal Valley) без сглаживания и с активацией SSAA 4.0;
- FarCryPrimal (DirectX 11) – версия 1.3.3, максимальный уровень качества, текстуры высокого разрешения, объёмный туман и тени на максимум, встроенный тест производительности без сглаживания и с активацией SMAA;
- TomClancy’sTheDivision (DirectX 11) – версия 1.3, максимальный уровень качества, все параметры улучшения картинки активированы, Temporal AA – Supersampling, режимы тестирования без сглаживания и с активацией SMAA 1X Ultra, встроенный тест производительности, но фиксация результатов FRAPS;
- Hitman(DirectX 12) – версия 1.4.3, встроенный тест при настройках качества графики на уровне «Ультра», SSAO включено, качество теней Ультра, защита памяти отключена;
- DeusEx: MankindDivided(DirectX 12) – версия 1.7 build 551.7, все настройки качества вручную выставлены на максимальный уровень, тесселяция и глубина резкости активированы, не менее двух последовательных прогонов встроенного в игру бенчмарка.
Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1 %. Если отклонения прогонов тестов превышали 1 %, то тестирование повторялось ещё как минимум один раз, чтобы получить достоверный результат. Результаты тестов производительности
На диаграммах результаты тестирования видеокарт на графических процессорах NVIDIA выделены зелёной заливкой, а единственная видеокарта на графическом процессоре AMD отражена характерной для данного производителякрасной гаммой. Для выделения показателей производительности MSI GeForce GTX 1070 Gaming X мы выбрали тёмно-бирюзовый цвет. Добавим, что на диаграммах в каждом режиме качества результаты тестов отсортированы сверху вниз в порядке убывания стоимости видеокарт.
- 3DMark
- Crysis 3
- Metro: LastLight
- Battlefield 4
- Thief
- Sniper Elite III
- Grand Theft Auto V
- DiRTRally
- Batman: ArkhamKnight
- Tom Clancy’s Rainbow Six: Siege
- Rise of the Tomb Raider
- Far Cry Primal
- Tom Clancy’s The Division
- Hitman
- Deus Ex: Mankind Divided
Поскольку Deus Ex: Mankind Divided впервые появилась в нашем тестовом наборе, то приведём настройки, при которых данная игра будет тестироваться сегодня и в последующих статьях.
А теперь результаты.
Дополним построенные диаграммы итоговой таблицей с результатами тестов с выведенными средним и минимальным значением числа кадров в секунду по каждой видеокарте.
На очереди сводные диаграммы и анализ результатов.
Игровая производительность
Игровые тесты проводились в разрешениях 1920×1080 и2560х1440 с максимальными настройками графики, изменялись только настройкисглаживания в зависимости от разрешения. Использовался только API DirectX 11, тестирование проводилось во встроенных игровых приложениях. Настройки видеокарты были заводскими.
В итоге были получены следующие результаты:
Для столь миниатюрной видеокарты данные результаты очень впечатляющие.