Pcie 2.0 x1

NVMe-накопители в разных режимах работы интерфейса PCI Express: практическое исследование масштабируемости интерфейса в задачах передачи данных

Если спросить, какой интерфейс следует использовать для твердотельного накопителя с поддержкой протокола NVMe, то любой человек (вообще знающий, что такое NVMe) ответит: конечно PCIe 3.0 x4! Правда, с обоснованием у него, скорее всего, возникнут сложности. В лучшем случае получим ответ, что такие накопители поддерживают PCIe 3.0 x4, а пропускная способность интерфейса имеет значение. Иметь-то имеет, однако все разговоры об этом начались только тогда, когда некоторым накопителям на некоторых операциях стало тесно в рамках «обычного» SATA. Но ведь между его 600 МБ/с и (столь же теоретическими) 4 ГБ/с интерфейса PCIe 3.0 x4 — просто пропасть, причем заполненная массой вариантов! А вдруг и одной линии PCIe 3.0 хватит, поскольку это уже в полтора раза больше SATA600? Масла в огонь подливают производители контроллеров, грозящиеся в бюджетной продукции перейти на PCIe 3.0 x2, а также тот факт, что у многих пользователей и такого-то нет. Точнее, теоретически есть, но высвободить их можно, лишь переконфигурировав систему или даже что-то в ней поменяв, чего делать не хочется. А вот купить топовый твердотельный накопитель — хочется, но есть опасения, что пользы от этого не будет совсем никакой (даже морального удовлетворения от результатов тестовых утилит).

Но так это или нет? Иными словами, нужно ли действительно ориентироваться исключительно на поддерживаемый режим работы — или все-таки на практике можно поступиться принципами? Именно это мы сегодня и решили проверить. Пусть проверка будет быстрой и не претендующей на исчерпывающую полноту, однако полученной информации должно оказаться достаточно (как нам кажется) хотя бы для того, чтобы задуматься… А пока вкратце ознакомимся с теорией.

PCI Express: существующие стандарты и их пропускная способность

Начнем с того, что́ представляет собой PCIe и с какой скоростью этот интерфейс работает. Часто его называют «шиной», что несколько неверно идеологически: как таковой шины, с которой соединены все устройства, нет. На деле имеется набор соединений «точка—точка» (похожий на многие другие последовательные интерфейсы) с контроллером в середине и присоединенными к нему устройствами (каждое из которых само по себе может быть и концентратором следующего уровня).

Первая версия PCI Express появилась почти 15 лет назад. Ориентация на использование внутри компьютера (нередко — и в пределах одной платы) позволила сделать стандарт скоростным: 2,5 гигатранзакции в секунду. Поскольку интерфейс последовательный и дуплексный, одна линия PCIe (x1; фактически атомарная единица) обеспечивает передачу данных на скоростях до 5 Гбит/с. Однако в каждом направлении — лишь половина от этого, т. е. 2,5 Гбит/с, причем это полная скорость интерфейса, а не «полезная»: для повышения надежности каждый байт кодируется 10 битами, так что теоретическая пропускная способность одной линии PCIe 1.x составляет примерно 250 МБ/с в каждую сторону. На практике нужно еще передавать служебную информацию, и в итоге правильнее говорить о ≈200 МБ/с передачи пользовательских данных. Что, впрочем, на тот момент времени не только покрывало потребности большинства устройств, но и обеспечивало солидный запас: достаточно вспомнить, что предшественница PCIe в сегменте массовых системных интерфейсов, а именно шина PCI, обеспечивала пропускную способность в 133 МБ/с. И даже если рассматривать не только массовую реализацию, но и все варианты PCI, то максимумом были 533 МБ/с, причем на всю шину, т. е. такая ПС делилась на все подключенные к ней устройства. Здесь же 250 МБ/с (поскольку и для PCI приводится обычно полная, а не полезная пропускная способность) на одну линию — в монопольном использовании. А для устройств, которым нужно больше, изначально была предусмотрена возможность агрегирования нескольких линий в единый интерфейс, по степеням двойки — от 2 до 32, т. е. предусмотренный стандартом вариант х32 в каждую сторону мог передавать уже до 8 ГБ/с. В персональных компьютерах х32 не использовался из-за сложности создания и разведения соответствующих контроллеров и устройств, так что максимумом стал вариант с 16 линиями. Использовался он (да и сейчас используется) в основном видеокартами, поскольку большинству устройств столько не требуется. Вообще, немалому их количеству и одной линии вполне достаточно, но некоторые применяют с успехом и х4, и х8: как раз по накопительной теме — RAID-контроллеры или SSD.

Время на месте не стояло, и около 10 лет назад появилась вторая версия PCIe. Улучшения касались не только скоростей, но и в этом отношении был сделан шаг вперед — интерфейс начал обеспечивать 5 гигатранзакций в секунду с сохранением той же схемы кодирования, т. е. пропускная способность удвоилась. И еще раз она удвоилась в 2010 году: PCIe 3.0 обеспечивает 8 (а не 10) гигатранзакций в секунду, но избыточность уменьшилась — теперь для кодирования 128 бит используется 130, а не 160, как ранее. В принципе, и версия PCIe 4.0 с очередным удвоением скоростей уже готова появиться на бумаге, но в ближайшее время в железе мы ее массово вряд ли увидим. На самом деле и PCIe 3.0 до сих пор в массе платформ используется совместно с PCIe 2.0, потому что и производительность последней для многих сфер применения просто… не нужна. А где нужна — работает старый добрый метод агрегации линий. Только каждая из них стала за прошедшие годы вчетверо быстрее, т. е. PCIe 3.0 х4 — это PCIe 1.0 x16, самый быстрый слот в компьютерах середины нулевых. Именно этот вариант поддерживают топовые контроллеры SSD, и именно его рекомендуется использовать. Понятно, что если такая возможность есть — много не мало. А если ее нет? Будут ли возникать какие-то проблемы, и если да, то какие? Вот с этим-то вопросом нам и предстоит разобраться.

Методика тестирования

Провести тесты с разными версиями стандарта PCIe несложно: практически все контроллеры позволяют использовать не только поддерживаемый ими, но и все более ранние. Вот с количеством линий — сложнее: нам хотелось непосредственно протестировать и варианты с одной-двумя линиями PCIe. Используемая нами обычно плата Asus H97-Pro Gamer на чипсете Intel H97 полного набора не поддерживает, но кроме «процессорного» слота х16 (который обычно и используется) на ней есть еще один, работающий в режимах PCIe 2.0 х2 или х4. Вот этой тройкой мы и воспользовались, добавив к ней еще и режим PCIe 2.0 «процессорного» слота, дабы оценить, есть ли разница. Все-таки в этом случае между процессором и SSD посторонних «посредников» нет, а вот при работе с «чипсетным» слотом — есть: собственно чипсет, фактически соединяющийся с процессором тем же PCIe 2.0 x4. Можно было добавить еще несколько режимов работы, но основную часть исследования мы все равно собирались провести на другой системе.

Дело в том, что мы решили воспользоваться случаем и заодно проверить одну «городскую легенду», а именно поверие о полезности использования топовых процессоров для тестирования накопителей. Вот и взяли восьмиядерный Core i7-5960X — родственника обычно применяемого в тестах Core i3-4170 (это Haswell и Haswell-E), но у которого ядер в четыре раза больше. Кроме того, обнаруженная в закромах плата Asus Sabertooth X99 нам сегодня полезна наличием слота PCIe x4, на деле способного работать как х1 или х2. В этой системе мы протестировали три варианта х4 (PCIe 1.0/2.0/3.0) от процессора и чипсетные PCIe 1.0 х1, PCIe 1.0 х2, PCIe 2.0 х1 и PCIe 2.0 х2 (во всех случаях чипсетные конфигурации отмечены на диаграммах значком (c)). Есть ли смысл сейчас обращаться к первой версии PCIe, с учетом того, что вряд ли найдется хоть одна плата с поддержкой только этой версии стандарта, способная загрузиться с NVMe-устройства? С практической точки зрения — нет, а вот для проверки априори предполагаемого соотношения PCIe 1.1 х4 = PCIe 2.0 х2 и подобных оно нам пригодится. Если проверка покажет, что масштабируемость шины соответствует теории, значит, и неважно, что нам не удалось пока получить практически значимые способы подключения PCIe 3.0 x1/х2: первый будет идентичен как раз PCIe 1.1 х4 или PCIe 2.0 х2, а второй — PCIe 2.0 х4. А они у нас есть.

В плане ПО мы ограничились только Anvil’s Storage Utilities 1.1.0: разнообразные низкоуровневые характеристики накопителей она измеряет неплохо, а ничего другого нам и не нужно. Даже наоборот: любое влияние других компонентов системы является крайне нежелательным, так что низкоуровневая синтетика для наших целей безальтернативна.

В качестве «рабочего тела» мы использовали Patriot Hellfire емкостью 240 ГБ. Как было установлено при его тестировании, это не рекордсмен по производительности, но его скоростные характеристики вполне соответствуют результатам лучших SSD того же класса и той же емкости. Да и более медленные устройства на рынке уже есть, причем их будет становиться все больше. В принципе, можно будет повторить тесты и с чем-нибудь более быстрым, однако, как нам кажется, необходимости в этом нет — результаты предсказуемы. Но не станем забегать вперед, а посмотрим, что же у нас получилось.

Результаты тестов

Тестируя Hellfire, мы обратили внимание на то, что максимальную скорость на последовательных операциях из него можно «выжать» лишь многопоточной нагрузкой, так что это тоже надо принимать во внимание на будущее: теоретическая пропускная способность на то и теоретическая, что «реальные» данные, полученные в разных программах по разным сценариям, будут больше зависеть не от нее, а от этих самых программ и сценариев — в том случае, конечно, когда не помешают обстоятельства непреодолимой силы 🙂 Как раз такие обстоятельства мы сейчас и наблюдаем: выше уже было сказано, что PCIe 1.x x1 — это ≈200 МБ/с, и именно это мы и видим. Две линии PCIe 1.x или одна PCIe 2.0 — вдвое быстрее, и именно это мы и видим. Четыре линии PCIe 1.x, две PCIe 2.0 или одна PCIe 3.0 — еще вдвое быстрее, что подтвердилось для первых двух вариантов, так что и третий вряд ли будет отличаться. То есть в принципе масштабируемость, как и предполагалось, идеальная: операции линейные, флэш с ними справляется хорошо, так что интерфейс имеет значение. Флэш перестает справляться хорошо на PCIe 2.0 x4 для записи (значит, подойдет и PCIe 3.0 x2). Чтение «может» больше, но последний шаг дает уже полутора-, а не двукратный (каким он потенциально должен быть) прирост. Также отметим, что заметной разницы между чипсетным и процессорным контроллером нет, да и между платформами тоже. Впрочем, LGA2011-3 немного впереди, но на самую малость.

Все ровно и красиво. Но шаблоны не рвет: максимум в этих тестах составляет лишь немногим больше 500 МБ/с, а это вполне по силам даже SATA600 или (в приложении к сегодняшнему тестированию) PCIe 1.0 х4 / PCIe 2.0 х2 / PCIe 3.0 х1. Именно так: не стоит пугаться выпуску бюджетных контроллеров под PCIe х2 или наличию лишь такого количества линий (причем версии стандарта 2.0) в слотах М.2 на некоторых платах, когда больше-то и не нужно. Иногда и столько не нужно: максимальные результаты достигнуты при очереди в 16 команд, что для массового ПО не типично. Чаще встречается очередь с 1-4 командами, а для этого обойтись можно и одной линией самого первого PCIe и даже самым первым SATA. Впрочем, накладные расходы и прочее имеют место быть, так что быстрый интерфейс полезен. Однако излишне быстрый — разве что не вреден.

А еще в этом тесте по-разному ведут себя платформы, причем с единичной очередью команд — принципиально по-разному. «Беда» вовсе не в том, что много ядер — плохо. Они тут все равно не используются, разве что одно, и не настолько, чтоб вовсю развернулся буст-режим. Вот и имеем разницу где-то в 20% по частоте ядер и полтора раза по кэш-памяти — она в Haswell-E работает на более низкой частоте, а не синхронно с ядрами. В общем, топовая платформа может пригодиться разве что для вышибания максимума «йопсов» посредством максимально многопоточного режима с большой глубиной очереди команд. Жаль только, что с точки зрения практической работы это совсем уж сферическая синтетика в вакууме 🙂

На записи положение дел принципиально не изменилось — во всех смыслах. Но, что забавно, на обеих системах самым быстрым оказался режим PCIe 2.0 х4 в «процессорном» слоте. На обеих! И при многократных проверках/перепроверках. Тут уж поневоле задумаешься, нужны ли эти ваши новые стандарты или лучше вообще никуда не торопиться…

При работе с блоками разного размера теоретическая идиллия разбивается о то, что повышение скорости интерфейса все же имеет смысл. Результирующие цифры такие, что хватило бы пары линий PCIe 2.0, но реально в таком случае производительность ниже, чем у PCIe 3.0 х4, пусть и не в разы. И вообще тут бюджетная платформа топовую «забивает» в куда большей степени. А ведь как раз такого рода операции в основном в прикладном ПО и встречаются, т. е. эта диаграмма — наиболее приближенная к реальности. В итоге нет ничего удивительного, что никакого «вау-эффекта» толстые интерфейсы и модные протоколы не дают. Точнее, переходящему с механики — дадут, но ровно такой же, какой ему обеспечит любой твердотельный накопитель с любым интерфейсом.

Итого

Для облегчения восприятия картины по больнице в целом мы воспользовались выдаваемым программой баллом (суммарным — по чтению и записи), проведя его нормирование по «чипсетному» режиму PCIe 2.0 x4: на данный момент именно он является наиболее массово доступным, поскольку встречается даже на LGA1155 или платформах AMD без необходимости «обижать» видеокарту. Кроме того, он эквивалентен PCIe 3.0 x2, который готовятся освоить бюджетные контроллеры. Да и на новой платформе AMD АМ4, опять же, именно этот режим как раз можно получить без влияния на дискретную видеокарту.

Итак, что мы видим? Применение PCIe 3.0 x4 при наличии возможности является, безусловно, предпочтительным, но не необходимым: NVMe-накопителям среднего класса (в своем изначально топовом сегменте) он приносит буквально 10% дополнительной производительности. Да и то — за счет операций в общем-то не столь уж часто встречающихся на практике. Для чего же в данном случае реализован именно этот вариант? Во-первых, была такая возможность, а запас карман не тянет. Во-вторых, есть накопители и побыстрее, чем наш тестовый Patriot Hellfire. В-третьих, есть такие области деятельности, где «атипичные» для настольной системы нагрузки — как раз вполне типичные. Причем именно там наиболее критично быстродействие системы хранения данных или, по крайней мере, возможность сделать ее часть очень быстрой. Но к обычным персональным компьютерам это все не относится.

В них, как видим, и использование PCIe 2.0 x2 (или, соответственно, PCIe 3.0 х1) не приводит к драматическому снижению производительности — лишь на 15-20%. И это несмотря на то, что потенциальные возможности контроллера в этом случае мы ограничили в четыре раза! Для многих операций и такой пропускной способности достаточно. Вот одной линии PCIe 2.0 уже недостаточно, поэтому контроллерам имеет смысл поддерживать именно PCIe 3.0 — и в условиях жесткой нехватки линий в современной системе это будет работать неплохо. Кроме того, полезна ширина х4 — даже при отсутствии поддержки современных версий PCIe в системе она все равно позволит работать с нормальной скоростью (пусть и медленнее, чем могло бы потенциально), если найдется более-менее широкий слот.

В принципе, большое количество сценариев, в которых узким местом оказывается собственно флэш-память (да, это возможно и присуще не только механике), приводит к тому, что четыре линии третьей версии PCIe на этом накопителе обгоняют одну первой примерно в 3,5 раза — теоретическая же пропускная способность этих двух случаев различается в 16 раз. Из чего, разумеется, не следует, что нужно спешно бежать осваивать совсем медленные интерфейсы — их время ушло безвозвратно. Просто многие возможности быстрых интерфейсов могут быть реализованы лишь в будущем. Или в условиях, с которыми обычный пользователь обычного компьютера никогда в жизни непосредственно не столкнется (за исключением любителей меряться известно чем). Собственно, и всё.

Что такое шина PCI Express?

В далеких 2000-х, когда состоялся переход с устаревающего стандарта PCI (расш. — взаимосвязь периферийных компонентов) на PCI Express, у последнего было одно огромное преимущество: вместо последовательной шины, которой и была PCI, использовалась двухточечная шина доступа. Это означало, что каждый отдельный порт PCI и установленные в него карты, могли в полной мере использовать максимальную пропускную способность не мешая друг другу, как это происходило при подключении к PCI. В те времена количество периферийных устройств, вставляемых в карты расширения, было предостаточно. Сетевые карты, аудио карты, ТВ-тюнеры и так далее — все требовали достаточное количество ресурсов ПК. Но в отличие от стандарта PCI, использовавшего для передачи данных общую шину с подключением параллельно нескольких устройств, PCI Express, если рассматривать в общем, является пакетной сетью с топологией типа звезда.

PCI Express x16, PCI Express x1 и PCI на одной плате

С точки зрения непрофессионала, представьте свой настольный ПК в качестве небольшого магазина с одним, двумя продавцами. Старый стандарт PCI был как гастроном: все ожидали в одной очереди, чтобы их обслужили, испытывая проблемы со скоростью обслуживания с ограничением в лице одного продавца за прилавком. PCI-E больше похож на гипермаркет: каждый покупатель движется за продуктами по своему индивидуальному маршруту, а на кассе сразу несколько кассиров принимают заказ.

Очевидно, что гипермаркет по скорости обслуживания выигрывает в несколько раз у обычного магазина, благодаря тому, что магазин не может себе позволить пропускную способность больше чем один продавец с одной кассой.

Также и с выделенными полосами передачи данных для каждой карты расширения или встроенными компонентами материнской платы.

Влияние количества линий на пропускную способность

Теперь, чтобы расширить нашу метафору с магазином и гипермаркетом, представьте, что каждый отдел гипремаркета имеет своих кассиров, зарезервированных только для них. Вот тут-то и возникает идея нескольких полос передачи данных.

PCI-E прошел множество изменений со времени своего создания. В настоящее время новые материнские платы обычно используют уже 3 версию стандарта, причем более быстрая 4 версия становится все более распространенной, а версия 5 ожидается в 2019 году. Но разные версии используют одни и те же физические соединения, и эти соединения могут быть выполнены в четырех основных размерах : x1, x4, x8 и x16. (x32-порты существуют, но крайне редко встречаются на материнских платах обычных компьютерах).

Различные физические размеры портов PCI-Express позволяют четко разделить их по количеству одновременных соединений с материнской платой: чем больше порт физически, тем больше максимальных подключений он способен передать на карту или обратно. Эти соединения еще называют линиями. Одну линию можно представить как дорожку, состоящею из двух сигнальных пар: одна для отправки данных, а другая для приема.

Различные версии стандарта PCI-E позволяют использовать разные скорости на каждой полосе. Но, вообще говоря, чем больше полос находится на одном PCI-E-порту, тем быстрее данные могут перетекать между периферийной и остальной частью компьютера.

Возвращаясь к нашей метафоре: если речь идёт об одном продавце в магазине, то полоса x1 и будет этим единственным продавцом, обслуживающим одного клиента. У магазина с 4-мя кассирами — уже 4 линии х4. И так далее можно расписать кассиров по количеству линий, умножая на 2.

Различные карты PCI Express

Типы устройств, использующих PCI Express x2, x4, x8, x12, x16 и x32

Для версии PCI Express 3.0 общая максимальная скорость передачи данных составляет 8 ГТ/с, В реальности же скорость для версии PCI-E 3 чуть меньше одного гигабайта в секунду на одну полосу.

Таким образом, устройство, использующее порт PCI-E x1, например, маломощная звуковая карта или Wi-Fi-антенна смогут передавать данные с максимальной скоростью в 1 Гбит/с.

Карта, которая физически подходит в более крупный слот — x4 или x8, например, карта расширения USB 3.0, сможет передавать данные в четыре или восемь раз быстрее соответственно.

Скорость передачи портов PCI-E x16 теоретически ограничивается максимальной полосой пропуская в размере около 15 Гбит/с. Этого более чем достаточно в 2017 года для всех современных графических видеокарт, разработанных NVIDIA и AMD.

Большинство дискретных видеокарт используют слот PCI-E x16

Протокол PCI Express 4.0 позволяет использовать уже 16 ГТ/с, а PCI Express 5.0 будет задействовать 32 ГТ/с.

Но в настоящее время не существует компонентов, которые смогли бы использовать такое количество полос с максимальной пропускной способностью. Современные топовые графические карты обычно используют x16 стандарта PCI Express 3.0. Нет смысла использовать те же полосы и для сетевой карты, которая на порту x16 будет использовать только одну линию, так как порт Ethernet способен передавать данные только до одного гигабита в секунду (что, около одной восьмой пропускной способности одной PCI-E полосы — помните: восемь бит в одном байте).

На рынке можно найти твердотельные накопители PCI-E, которые поддерживают порт x4, но они, похоже, скоро будут вытеснены быстро развивающимся новым стандартом M.2. для твердотельных накопителей, которые также могут использовать шину PCI-E. Высококачественные сетевые карты и оборудование для энтузиастов, такие как RAID-контроллеры, используют сочетание форматов x4 и x8.

Размеры портов и линий PCI-E могут различаться

Это одна из наиболее запутанных задач по PCI-E: порт может быть выполнен размером в форм-факторе x16, но иметь недостаточное количество полос для пропуска данных, например, всего например x4. Это связано с тем, что даже если PCI-E может нести на себе неограниченное количество отдельных соединений, все же существует практический предел пропускной способности полосы пропускания чипсета. Более дешевые материнские платы с более бюджетными чипсетами могут иметь только один слот x8, даже если этот слот может физически разместить карту форм-фактора x16.

Кроме того, материнские платы, ориентированные на геймеров, включают до четырех полных слотов PCI-E с x16 и столько же линий для максимальной пропускной способности.

Очевидно, это может вызывать проблемы. Если материнская плата имеет два слота размером x16, но один из них имеет только полосы x4, то подключение новой графической карты снизит производительность первой аж на 75%. Это, конечно, только теоретический результат. Архитектура материнских плат такова, что Вы не увидите резкого снижения производительности.

Правильная конфигурация двух графических видео карт должна задействовать именно два слота x16, если Вы хотите максимального комфорта от тандема двух видеокарт. Выяснить сколько линий на Вашей материнской плате имеет тот или иной слот поможет руководство на оф. сайте производителя.

Иногда производители даже помечают на текстолите материнской платы рядом со слотом количество линий

Нужно знать, что более короткая карта x1 или x4 может физически вписаться в более длинный слот x8 или x16. Конфигурация контактов электрических контактов делает это возможным. Естественно, если карта физически больше, чем слот, то вставить ее не получится.

Поэтому помните, при покупке карт расширения или обновления текущих необходимо всегда помнить как размер слота PCI Express, так и количество необходимых полос.

Стандартным интерфейсом для подключения видеокарт на данный момент является шина PCI-Express (PCIe или PCI-E), которая пришла на смену AGP.

PCI-Express 16x и PCI-Express 2.0 – наиболее используемые интерфейс для подключения дискретных видеокарт. Основное различием между этими версиями в том, что в версии 2.0 была увеличена максимальная пропускная способность до 8 Гбит/с в каждом направлении, а также увеличивает возможности энергоподачи до 300 Вт, для этого на видеокарты устанавливается 2 x 4-штырьковый разъем питания.

PCI-Express реализован в различных версиях, отличающихся пропускной способностью: 1x, 2x, 4x, 8x, 16x и 32х. Видеоинтерфейс PCI-E 16x обеспечивает пропускную способность равную 4 Гб/с в каждом направлении. Также были реализации PCI-Exp 8x (в бюджетных SLI- или CrossFire-решениях) и PCI-E 4x (или PCI-Express Lite).

Конечно, чем выше пропускная способность видеокарты, тем выше производительность и FPS в играх. Однако, у видеоинтерфейса AGP пропускная способность была практически такой же, как и у ранних версиях PCI-Express, и преимущество последнего было в масштабировании, а значит можно было подключить одновременно до четырех видеокарт.

Стандарт PCI-Express обеспечивает мощность питания: по напряжению 3,3 В до 3 А, по 12 В – до 5,5 А. Таким образом всего до 76 Вт отдаваемой видеокарте мощности. Но даже этого некоторым видеокартам не хватает и на них устанавливают один или несколько дополнительных 6-контактных разъема PCI-Express, при этом каждый способен дополнительно обеспечить ток по шине 12 В – до 6 А, а значит всего 72 или 144 Вт мощности. Значит PCI-Express 1.1 может обеспечить питание видеокарты, которые потребляют до 220 Вт электроэнергии.

Видеостандарт AGP имеет до 42 Вт отдаваемой мощности, так как по шине питания 3,3 В видеокарта потребляет до 6 А, по 5 В – до 2 А, по 12 В – 1А.

PCI Express 2.0 против 1.0a: тесты одиночных видеокарт и CrossFire

Читатели в форумах активно интересуются новым интерфейсом PCI Express 2.0. Хватит ли дня него чипсета Intel P35, или X38 будет лучшим выбором? Какой прирост производительности можно ожидать от подобного обновления? Могут ли современные видеокарты выиграть от увеличения пропускной способности интерфейса PCI Express?

Многие считают, что чипсет Intel 975 с «урезанным» интерфейсом PCIe не позволяет современной конфигурации на двух картах HD38x0 раскрыться в полную силу. И такую систему уже нельзя считать современной. В этом есть определённая доля истины. Мы провели сравнительные тесты на чипсете X38 и обнаружили, что в некоторых специфических тестах, которые фокусируются на высоких разрешениях CrossFire, прирост производительности действительно есть. В лучшем случае мы получили до 20% прироста.

В данном тесте мы проверим производительность всех современных видеокарт с интерфейсом PCI Express 2.0, таких как nVidia GeForce 8800 GT и 8800 GTS 512, а также ATI Radeon HD 3850 и 3870. Мы добавили в тест и ATI Radeon HD2900XT. Хотя эта видеокарта относится к классу PCIe 1.1, она остаётся самым быстрым предложением AMD, поэтому она идеально подойдёт для сравнения производительности старой и новой платформ.

Сравнение графических чипов

В данный тест мы добавили наиболее свежие видеокарты nVidia и конфигурации SLI. Напомним, что только nVidia GeForce 8800 GT и 8800 GTS 512, а также ATI Radeon HD3850 и HD3870 уже оснащены интерфейсом PCI Express 2.0.

Видеокарты nVidia

Видеокарта и чип Кодовое название Память Блок шейдеров Частота GPU Частота памяти
GeForce 8800 Ultra ОС G80 768 Мбайт GDDR3 4.0, 1 512 МГц 660 МГц 2300 МГц
GeForce 8800 GTX G80 768 Мбайт GDDR3 4.0, 1 350 МГц 576 МГц 1 800 МГ
GeForce 8800 GTS ОС SLI G92 512 Мбайт GDDR3 4.0, 1 825 МГц 730 МГц 1944 МГц
GeForce 8800 GTS ОС G92 512 Мбайт GDDR3 4.0, 1 825 МГц 730 МГц 1944 МГц
GeForce 8800 GT ОС SLI G92 512 Мбайт GDDR3 4.0, 1 650 МГц 660 МГц 1 900 МГц
GeForce 8800 GT ОС G92 512 Мбайт GDDR3 4.0, 1 650 МГц 660 МГц 1900 МГц

Видеокарты AMD

Видеокарта и чип Кодовое название Память Блок шейдеров Частота GPU Частота памяти
Radeon HD3870 ОС CF RV670 512 Мбайт GDDR4 4.1 800 МГц 2 252 МГц
Radeon HD3870 ОС RV670 512 Мбайт GDDR4 4.1 800 МГц 2 252 МГц
Radeon HD3850 ОС CF RV670 256 Мбайт GDDR3 4.1 690 МГц 1 658 МГц
Radeon HD3850 ОС RV670 256 Мбайт GDDR3 4.1 690 МГц 1 658 МГц
Radeon HD2900 XT CF R600 512 Мбайт GDDR3 4.0 743 МГц 1 656 МГц
Radeon HD2900 XT R600 512 Мбайт GDDR3 4.0 743 МГц 1 656 МГц

В таблице указана эффективная частота памяти (DDR), физическая будет в два раза меньше. OC — разогнанная карта. SLI — соответствующий режим совместной работы карт nVidia. CF — соответствующий режим CrossFire совместной работы карт AMD.

Одиночные карты nVidia, одиночные карты AMD и две в CrossFire

CPU Intel Core 2 Extreme X6800, 2,93 ГГц, FSB1066
Материнская плата Intel D975XBX2, PCIe 1.0a, чипсет Intel 975X
Память 2×1 Гбайт, Vitesta DDR2 800 4-4-4-12 533 МГц
Жёсткий диск Hitachi 2 x 120 Гбайт SATA, кэш 8 Мбайт
DVD Gigabyte GO-D1600C
LAN Intel 1000 Pro
Звук Intel High Definition Audio
Блок питания Seasonic M12 600 Вт

Одиночные карты nVidia, одиночные карты AMD и две в CrossFire

CPU Intel Core 2 Extreme X6800, 2,93 ГГц, FSB1066
Материнская плата Asus P5E3 Deluxe, PCIe 2.0, чипсет Intel X38
Память 2×1 Гбайт, Ballistix DDR3 800 5-5-5-16 800 МГц
Звук Intel High Definition Audio
Блок питания CoolerMaster RS-850-EMBA 850 Вт

Две видеокарты nVidia в SLI

CPU Intel Core 2 Extreme X6800, 2,93 ГГц, FSB1066
Материнская плата nVidia 680i SLI, чипсет nVidia 680i SLI

Драйверы и система

Видеокарта ATI Catalyst 7.11
nVidia Forceware 169.12, 8800 GTS 512 MSI 169.06
ОС Windows Vista Enterprise
DirectX 10
Драйвер чипстеа Intel 975BX2 Intel 8.2.0.1014, X38 Intel 8.3.1.1009

Слоты PCI Express x16, x8 и x4

Материнская плата, которую мы использовали для тестов в прошлом году, была построена на чипсете 975 и предоставляла слоты PCI Express с числом линий x16, x8 и x4. По очевидным причинам, если вы используете в системе одну видеокарту, то на материнской плате лучше использовать самый быстрый слот PCI Express. В случае нашей 975BX2 этот слот располагался ближе к CPU и обеспечивал полное число линий x16.

Часто скорость слота PCIe можно узнать по маркировке на материнской плате. Например, слот x16 может быть маркирован, как поддерживающий скорость x8. Это достаточно важная информация для пользователей CrossFire. Когда используются две видеокарты AMD в режиме CrossFire, то линии x16 разбиваются на два слота x8.


Первый слот PCI Express поддерживает полную скорость x16, его и следует использовать для видеокарты.


Второй слот PCI Express поддерживает x8. В режиме CrossFire первый слот тоже переход в конфигурацию x8.


Третий слот для видеокарт лучше не использовать — он даёт всего x4 линии PCIe.

На рынке есть дешёвые материнские платы, поддерживающие слоты AGP и PCI Express, да и вы можете встретиться со слотами, которые дают скорость всего x4. Мы уже проводили тесты в нескольких современных играх на разных скоростях и в разных разрешениях. Результаты x8 наглядно показывают, что конфигурация CrossFire уже будет испытывать падение производительности, поскольку чипсет 975 даёт два интерфейса только в режиме x8.

Производительность одиночных видеокарт — HD2900 XT (512 Мбайт), PCIe 1.0a x4, x8 и x16 fps Процент
HD2900 XT (512 Мбайт) PCIe 1.0a x4 1209,4 67,3
HD2900 XT (512 Мбайт) PCIe 1.0a x8 1673,6 93,1
HD2900 XT (512 Мбайт) PCIe 1.0a x16 1796,8 100,0
Производительность одиночных видеокарт — 8800 GTS (512 Мбайт), PCIe 1.0a x4, x8 и x16 fps Процент
8800 GTS (512 Мбайт) ОС PCIe 1.0a x4 1678,1 75,1
8800 GTS (512 Мбайт) ОС PCIe 1.0a x8 2063,6 92,3
8800 GTS (512 Мбайт) ОС PCIe 1.0a x16 2235,3 100,0

В приведённой таблице интерфейс x16 взят за 100%. Видеокарты AMD и nVidia теряют около 7-8 процентов производительности при переходе к слоту x8. Теоретически в конфигурации CrossFire падение производительности будет в два раза выше. При перестановке видеокарты в слот x4 падение 3D-производительности ещё более выражено. Как видим, скорость GeForce 8800 GTS 512 снижается на 25 процентов, а ATI HD2900 XT — на целых 33 процента.

Если посмотреть на цены современных видеокарт и падение производительности из-за медленных соединений, то на материнской плате лучше не экономить. Падение производительности на 25-33% вряд ли приемлемо.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *