Архив метки: NvidiaGeForce GTX 970

Nvidia довелося детально пояснити, чому GeForce GTX 970 не може працювати швидко з усіма 4 ГБ пам’яті


 
Як ми вже повідомляли , нещодавно стало відомо , що швидкість роботи 3D- карти Nvidia GeForce GTX 970 з пам’яттю радикально падає на рубежі 3,5 ГБ. Компанія Nvidia відразу ж запевнила, що розробники вже розбираються з ситуацією і постараються вирішити проблему якомога швидше . Незабаром було опубліковано повідомлення , в якому Nvidia пояснила повільну роботу 3D-карт GeForce GTX 970 з частиною пам’яті компромісом при проектуванні GPU. При цьому опис ситуації практично виключало надію на виправлення оновленням прошивки або драйвера. Втім, за словами виробника , зниження продуктивності є незначним.
Однак обмежитися цим не вдалося – активність власників 3D-карт і тематичних ресурсів змусила виробника опублікувати додаткові технічні дані , остаточно пояснюють суть проблеми. Конфігурація GeForce GTX 970 включає 13 потокових процесорів (SMM в термінах Nvidia ) з 16 можливих у GM204 , кожен з яких має 128 ядер CUDA. Процесори звертаються до відеопам’яті через кеш -пам’ять , при цьому потоки даних проходять через комутатор , який має в повній конфігурації вісім портів для підключення до кеш-пам’яті другого рівня. Як виявилося, GeForce GTX 970 має всього сім портів, що видно на ілюстрації , де сірим показані відключені блоки. Відсутній порт означає менший об’єм кеш -пам’яті і менше число блоків растрових операцій .
 
Таким чином , всупереч інформації, поширеної в момент випуску GTX 970 , число блоків ROP одно не 64, а 56 , а об’єм кеш-пам’яті L2 дорівнює 1792 КБ, а не 2048 КБ , як у GTX 980. Уточнимо, що вузьким місцем є не число ROP, оскільки 13 потокових процесорів в будь-якому випадку можуть видати тільки 52 пікселя за такт , тоді як 56 блоків ROP можуть обробити 56 пікселів . В GTX 980 кожен блок L2 / ROP прямо звертається до 32- розрядному контролеру пам’яті та сегменту пам’яті розміром 512 МБ. В GTX 970 довелося підключити до одного порту два сегменти . Якби при цьому всі контролери працювали з усією пам’яттю , цей перевантажений ділянку привів би до уповільнення роботи підсистеми пам’яті в два рази. Уникнути такої ситуації вдалося , розділивши пам’ять на два сегменти розміром 3,5 і 0,5 ГБ. Робота з першим виконується, як в GTX 980 , а другий працює в сім разів повільніше.

Очевидно, що зазначена особливість GPU має апаратний характер, проявляється у всіх примірниках 3D-карт GeForce GTX 970 і не може бути виправлена ​​за допомогою ПЗ . Ймовірно, Nvidia коштувало розповісти про неї раніше.
Джерело: PC Perspective
PC Perspective