Что такое интегрированный контроллер памяти. Оперативная память. Тактовая частота RAM

Не так давно на рынке появились процессоры семейства AMD64, в основе которых лежит новое ядро ревизии E. Это ядро, изготавливаемое с использованием технологического процесса с нормами производства 90 нм, а также с применением технологий SOI (Silicon on Insulator) и DSL (Dual Stress Liner) нашло применение сразу в нескольких линейках процессоров от AMD. Сферы применения ядра ревизии E весьма различны. Его можно встретить как в процессорах Athlon 64 и Athlon 64 FX, где оно обозначается кодовыми именами Venice и San Diego; в двухъядерных CPU семейства Athlon 64 X2, где его называют Toledo или Manchester; а также в процессорах Sempron, где это ядро именуется Palermo.

Разрабатывая и доводя до стадии массового производства новые ядра, компания AMD стремится не только к повышению предельных тактовых частот своих процессоров, но и к улучшению их характеристик. Ядро ревизии E стало очередным этапом на этом пути: с его внедрением процессоры Athlon 64 и их производные приобрели новые свойства. Наиболее заметным усовершенствованием стало появление в процессорах AMD поддержки инструкций SSE3, которые имелись в продуктах конкурента со времени начала выпуска CPU с 90 нм ядром Prescott. Кроме этого, традиционной доводке подвергся и интегрированный контроллер памяти.

Тесты показали, что поддержка SSE3 команд даёт очень немного. Приложений, эффективно использующих эти инструкции, на сегодняшний день крайне мало, да и сам набор SSE3 вряд ли может претендовать на звание полноценного подмножества команд.

Поэтому, на этот раз мы решили уделить большее внимание изменениям, внесённым в интегрированный контроллер памяти процессоров с ядром ревизии E. Следует заметить, что в более ранних ядрах своих CPU AMD не только увеличивала производительность контроллера памяти, но и расширяла его совместимость с различными комбинациями различных модулей памяти. Ядро ревизии D, известное в первую очередь благодаря процессорам Athlon 64 с кодовым именем Winchester, в этом плане явилось своеобразным рубежом. Во-первых, в процессорах Winchester по сравнению с предшественниками несколько увеличилась производительность контроллера памяти. Во-вторых, процессоры с ядром Winchester стали способны работать с модулями DDR400 SDRAM, установленными сразу во все четыре слота DIMM на материнской плате. Казалось бы, оптимум достигнут, однако, инженеры AMD посчитали иначе. Процессоры AMD с ядром ревизии E располагают ещё более совершенным контроллером памяти.

Куда же были направлены усилия инженеров на этот раз? Естественно, определенные оптимизации были вновь сделаны для увеличения производительности котроллера памяти. Так, тесты процессоров с ядром Venice продемонстрировали их небольшое превосходство над аналогами с ядром Winchester. Кроме того, снова улучшилась совместимость. Процессоры AMD с ядром ревизии E стали способны нормально функционировать при установке в систему нескольких модулей памяти различной организации и объёма, что, несомненно, значительно упрощает выбор комплектующих для дальнейшего апгрейда. Также, процессоры, в основе которых лежит новое ядро, теперь могут без проблем работать и с четырьмя двухсторонними модулями DDR400 SDRAM. Ещё одним интересным свойством процессоров с ядром ревизии E стало появление новых делителей, задающих частоту памяти. Благодаря этому новые CPU от AMD теперь безо всяких оговорок поддерживают DDR SDRAM, работающую на частотах, превышающих 400 МГц.

реклама

В этом материале мы рассмотрим некоторые из перечисленных выше особенностей интегрированного контроллера памяти ядра ревизии E, ибо, как нам кажется, они того явно заслуживают.

Работа с четырьмя двухсторонними модулями DDR400 SDRAM

Интегрированный контроллер памяти процессоров Athlon 64 – достаточно капризный узел. Различные неприятные моменты, связанные с его функционированием стали выясняться с момента появления процессоров с поддержкой двух каналов памяти. Выяснилось, что из-за достаточно высокой электрической нагрузки, которую накладывают модули памяти на контроллер, Athlon 64 имеет определённые проблемы при работе с четырьмя модулями DIMM. Так, при установке в систему на базе Athlon 64 четырёх модулей памяти, CPU может сбрасывать их частоту, увеличивать тайминги или не работать вообще.

Впрочем, справедливости ради следует отметить, что серверный аналог Athlon 64, Opteron, подобных проблем лишён благодаря использованию более дорогих регистровых модулей. Однако, применение таких модулей в настольных системах неоправданно, и поэтому пользователям необходимо мириться с некоторыми ограничениями, возникающими при установке в систему более двух модулей DIMM.

Впрочем, постепенно описанные проблемы всё же решаются. В то время как старые процессоры Athlon 64, основанные на ядрах, производимых по 130 нм технологии, не могли работать с четырьмя двухсторонними модулями DDR400 SDRAM на частоте 400 МГц вообще и снижали их частоту до 333 МГц, современные процессоры с 90 нм ядрами предлагают пользователям несколько лучшие варианты. Уже в ядре ревизии D, известном нам по кодовому имени Winchester, стала возможна работа с четырьмя двухсторонними модулями DDR400 SDRAM, при условии установки тайминга Command Rate в 2T.

Памятью называется устройство, предназначенное для записи (хранения) и считывания информации.

В памяти контроллера хранятся:

  1. обслуживающие программы изготовителя,
  2. программы пользователя,
  3. конфигурация контроллера,
  4. блоки данных (значения переменных, таймеров, счетчиков, меркеров и др.).

Свойства памяти. Память характеризуется:

  1. Объем памяти (KВ, MВ или GВ).
  2. Скорость или время обращения к памяти.
  3. Энергозависимость. Поведение после отключения питания .

Рис. 3.4 Виды памяти (рисунок автора) .

Оперативная память (RAM - random access memory ).

Преимущество.

Является самой скоростной полупроводниковой электронной памятью, предназначенной для кратковременного хранения информации.

Недостаток.

Основным свойством этой памяти является энергозависимость, т.е.потеря данных после отключения электрического питания.

Для буферизации оперативной памяти в некоторых контроллерах используют аккумуляторы или электрические конденсаторы большой емкости, способные сохранять электрический заряд до нескольких дней.

Элементом оперативной памяти является электронный триггер (статическая память) или электрический конденсатор (динамическая память).

Рис. 3.5 Триггер - основной элемент RAM памяти (рисунок автора) .

Динамическая память требует циклической подзарядки конденсаторов, однако, она более дешевая по сравнению со статической памятью.

Матрица памяти представляет собой совокупность отдельных ячеек памяти – триггеров.

1 ряд матрицы содержит 8 ячеек памяти (8 Bit соответствует 1 Byte).

Каждая ячейка памяти имеет свой уникальный адрес (№ ряда «точка» № бита).

Ряды (биты) нумеруются справа налево от «0» до «7».

Строки (байты) нумеруются сверху вниз, начиная с «0».

Рис. 3.6 Матрица памяти (рисунок автора) .

Постоянная память (ROM - read only memory ) предназначена для продолжительного хранения информации. Основным отличием от оперативной памяти является то, что она способна сохранять информацию без источника питания , т.е. является энергонезависимой.

Эта память, в свою очередь, подразделяется на два типа: однократно (ROM) – и многократно перепрограммируемую (PROM) .

Перепрограммируемую память записывает пользователь с помощью программаторов. Для этого необходимо предварительно стереть содержимое памяти.

К старому типу перепрограммируемой памятиотноситься ЕPROM - память, стираемая ультрафиолетовыми лучами (EPROM - erasable programmable read only memory ).

Рис. 3.7 Память ЕPROM стирается ультрафиолетовыми лучами (источник http://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB:Eprom.jpg) .

EEPROM (Electrically Erasable Programmable Read-Only Memory ) - электрически стираемое перепрограммируемое постоянное запоминающее устройство (ЭСППЗУ), один из видов энергонезависимой памяти (таких как PROM и EPROM ). Память такого типа может стираться и заполняться данными до миллиона раз.

На сегодняшний день классическая двух - транзисторная технология EEPROM практически полностью вытеснена NOR флэш-памятью. Однако название EEPROM прочно закрепилось за этим сегментом памяти независимо от технологии.

Рис. 3.8 Программирование флеш-памяти.

(источник http://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB:Flash_programming_ru.svg ).

Флеш-память (flash memory ) - разновидность твердотельной полупроводниковой энергонезависимой перезаписываемой памяти.

Она может быть прочитана сколько угодно раз (в пределах срока хранения данных, типично - 10-100 лет), но писать в такую память можно лишь ограниченное число раз (максимально - около миллиона циклов). Не содержит подвижных частей, так что, в отличие от жестких дисков, более надёжна и компактна.

Благодаря своей компактности, дешевизне и низкому энергопотреблению флэш-память широко используется в цифровых портативных устройствах.

Условное деление областей памяти контроллера

Контроллер предоставляет следующие области памяти для хранения программы пользователя, данных и конфигурации.

Загрузочная память – это энергонезависимая память для программы пользователя,

данных и конфигурации. При загрузке проекта в контроллер он сначала сохраняется в загрузочной памяти. Эта память находится или на карте памяти (если она имеется), или непосредственно встроена. Информация энергонезависимой памяти сохраняется также и при отключении питания. Карта памяти поддерживает больший объем памяти, чем память, встроенная в контроллер.

Рабочая память – это энергозависимая память. Контроллер копирует некоторые элементы проекта из загрузочной памяти в рабочую память. Эта область памяти теряется при отключении питания, а при возвращении питания контроллер ее восстанавливает.

Сохраняемая память – это энергонезависимая память для ограниченного количества значений рабочей памяти. Эта память служит для выборочного сохранения важной информации пользователя при потере питания. При исчезновении питания у контроллера имеется достаточно времени для сохранения значений ограниченного числа адресов памяти. При включении питания эти сохраняемые значения восстанавливаются.


Восстановление информации

Рис. 3.9 Фазы восстановления информации (рисунок автора).

1. Информация о состоянии процесса управления, сохраненная в оперативную память, называется образом процесса управления POU . Т.е. все физические клеммы блока входа- выхода имеют виртуальных двойников (триггеры) в памяти контроллера. Обычно, для увеличения скорости обмена информацией, процессор обращается за информацией в оперативную память (а не к физическим клеммам входа/ выхода). Запись результатов обработки программы из образа процесса в клеммы выхода производится циклично.

2. После отключения питающего напряжения (напряжение падает ниже критического уровня) важнейшая информация сохраняется обратно из RAM в EEPROM. Области данных, подлежащих сохранению, определяет пользователь.

  • Что называется матрицей памяти?
  • Сколько ячеек памяти в одном ряду матрицы памяти?
  • Как нумеруются столбцы матрицы памяти (направление и диапазон)?
  • На какие основные типы подразделяется память контроллера (назовите только два типа)?
  • Какими преимуществами обладает один тип памяти перед другим (два ответа)?
  • На какие типы подразделяется оперативная память контроллера (2)?
  • На какие типы подразделяется постоянная память по кратности программирования (2)?
  • На какие типы подразделяется перепрограммируемая постоянная память по способу стирания (2)?
  • Откуда появляется информация в RAM при включение питания контроллера?
  • Пропадает ли вся информация из RAM при выключении питания (если не пропадает, то куда и какая информация сохраняется)?
  • Как называется информация о состоянии клемм входа/ выхода в оперативной памяти?
  • С каким блоком памяти, в основном, работает процессор?

  • Привет, Гиктаймс! Модернизация оперативной памяти - самый элементарный вид апгрейда в ПК, но лишь до тех пор, пока вам везёт, и вы не наткнулись на одну из многочисленных несовместимостей железа. Рассказываем, в каких случаях набор крутой оперативной памяти не «заведётся» на старом ПК, почему на некоторых платформах нарастить ОЗУ можно только с помощью «избранных» модулей и предупреждаем о других характерных причудах железа.


    Об оперативной памяти мы знаем, что её много не бывает, и что, в зависимости от древности компьютера, выбирать приходится из очень старой DDR, старой DDR2, зрелого возраста DDR3 и современной DDR4. На этом руководство уровня «ну, вы главное покупайте, а там оно как-нибудь будет работать, или обменяете, если что» можно было бы завершить - пришло время рассмотреть приятные и не очень частности в подборе железа. То есть, случаи, когда:

    • должно ведь работать, но почему-то не работает
    • апгрейд нерентабелен или его лучше произвести «многоходовочкой»
    • модернизацию хочется провести «малой кровью» в соответствии с потенциалом ПК

    Проконтролируйте, где находится контроллер

    Если вы занимаетесь апгрейдом устаревшего компьютера не только из «любви к искусству», но и из практичных соображений, есть смысл сначала оценить, насколько жизнеспособна аппаратная платформа, прежде чем вкладывать в неё средства. Наиболее архаичные из актуальных - чипсеты для Socket 478 (Pentium IV, Celeron), которые простираются от платформ с поддержкой SDRAM PC133 (чипсет Intel 845, например), сквозь мейнстримные варианты на базе DDR, вплоть до поздних, разительно более современных чипсетов с поддержкой DDR2 PC2-5300 (Intel 945GC и др.).


    Раньше контроллеры находились вне процессора, а теперь, так уж сложилось, работают изнутри

    На этом фоне альтернативы из лагеря AMD того же времени выглядят менее пестро: все чипсеты под Socket 754, который приютил Athlon 64, представителей микроархитектуры K8, поддерживают память DDR, этот же тип памяти поддерживали процессоры для Socket 939 (Athlon 64 и первые двухъядерники Athlon 64 X2). Причем контроллер памяти в случае с чипами AMD был встроен в процессор - сейчас таким подходом никого не удивишь, однако Intel целенаправленно сохранял контроллер в чипсете, как раз для того, чтобы комбинировать процессоры для одного и того же сокета с новыми типами ОЗУ.

    По этой причине последующие чипы AMD для сокета AM2/AM2+ с контроллером ОЗУ под крышкой процессора работали только с DDR2, а Intel с её «долгожителем» Socket 775 растянул удовольствие с DDR по самые помидоры DDR3! В более современных платформах оба производителя процессоров перешли на интегрированный в кристалл СPU контроллер и подобные фокусы поддержкой разномастной RAM отошли в прошлое.

    Когда сменить чипсет дешевле, чем раскошеливаться на старую память

    Этот громоздкий список нужен не для того, чтобы впечатлить читателей широтой и обилием чипсетов устаревших ПК, а для немного неожиданного маневра в апгрейде. Суть этого нехитрого маневра заключается в том, что иной раз рациональнее будет приобрести материнскую плату с поддержкой более дешёвой и современной памяти, нежели раскошеливаться на уже раритетную ОЗУ предыдущего поколения.

    Потому что один и тот же объём памяти DDR2 на вторичном рынке окажется минимум на 50% дороже, чем сопоставимая по ёмкости память DDR3. Не говоря уже о том, что DDR3 ещё не снята с конвейера, поэтому её можно приобрести в новом состоянии, недорогим комплектом.
    А ещё с новыми чипсетами появляется возможность расширить ОЗУ до актуальных и сегодня величин. Например, если сравнить цены в российской рознице, то 8 гигабайт (2x 4 Gb) памяти DDR2 с частотой 800 МГц обойдутся вам эдак в 10 тысяч рублей, а такой же объём памяти стандарта DDR3 с частотой 1600 МГц (Kingston Value RAM KVR16N11/8, например) - в 3800-4000 рублей. С учётом продажи-покупки материнской платы для старого ПК затея выглядит разумно.

    Реалии модернизации компьютеров с «нативной» поддержкой DDR и DDR2 всем давно известны:

    • модули памяти с различными таймингами и частотой чаще всего умудряются сработаться, а «выравнивание» происходит либо по профилю SPD в менее производительном модуле, либо (что хуже), материнская плата выбирает стандартный для себя профиль работы с RAM. Как правило, с минимально допустимой тактовой частотой.
    • число модулей, в идеале, должно быть равно числу каналов . Две планки памяти объёмом 1 Гбайт каждая в старом ПК будут работать быстрее, нежели четыре модуля объёмом 512 Мбайт. Меньше модулей - ниже нагрузка на контроллер, выше эффективность.


    Два канала в контроллере - два модуля памяти для максимальной производительности. Остальное - компромиссы между ёмкостью и скоростью
    • в двухканальном режиме эффективнее работают модули равного объёма . Иными словами 1 Гбайт + 1 Гбайт окажутся лучше, чем 1 Гбайт + 512 Мбайт + 512 Мбайт.
    • оцените производительность платформы до покупки памяти . Потому что некоторые чипсеты не раскрывают потенциал даже своего «допотопного» типа RAM. Например, платформа Intel 945 Express оборудована двухканальным контроллером DDR2 с поддержкой частоты до 667 МГц. А это значит, что купленные вами модули DDR2 PC6400 платформа распознает, но модули будут ограничены в быстродействии и станут работать только в качестве PC2-5300, «идентичных натуральным».


    Сокет Intel LGA775 - один из вариантов, когда купить материнскую плату с поддержкой DDR3 проще и дешевле, чем апгрейдить память с платформой в рамках старой версии DDR

    И, вроде бы, этого списка нюансов достаточно, чтобы захотеть «перетянуть» компьютер на базе LGA775 на чипсет с поддержкой DDR3. Однако, вы таки будете смеяться, да только в модернизации старой платформы с помощью новой ОЗУ тоже есть свои нюансы.

    В дебютных платформах с поддержкой DDR3 (чипсеты Intel x4x и x5x и аналоги AMD того же времени) контроллеры способны работать только модулями старого образца. Абсурдная ситуация? Да, но факт остаётся фактом.

    Дело в том, что старые системы не владеют «языком общения» с модулями, которые оснащены чипами памяти высокой плотности. На бытовом уровне это означает, что вот этот модуль, у которого 4 гигабайта «размазаны» на восемь чипов на лицевой стороне печатной платы, работать в старом ПК не сможет. А старый модуль, у которого этот же объём реализован на 16 чипах (по 8 с каждой стороны) при аналогичном объёме и частоте будет работоспособен.

    Такие проблемы с совместимостью характерны, например, для десктопного Intel G41 Express (тот самый, что тянет на себе немалую долю выживших Core 2 Duo или Core 2 Quad) или мобильного Intel HM55 (ноутбуки на базе первого поколения Intel Core на базе микроархитектуры Nehalem).

    Иногда производители материнских плат/ноутбуков выпускают новые версии BIOS для того, чтобы научить старые платформы работать с новыми ревизиями ОЗУ, но чаще всего ни о какой долговременной поддержке старого оборудования речи не идёт. И, к сожалению, ни о каких спецсериях памяти для владельцев «устаревших, но не совсем» ПК речи не идёт - производство памяти ушло вперёд и поворачивать его вспять очень дорого.

    Чтобы не забивать голову такими понятиями, как «плотность чипа памяти», на бытовом уровне владельцам старых ПК советуют искать Double-sided DIMM , двусторонние модули памяти, которые с бОльшей вероятностью будут совместимы с дебютными платформами на базе DDR3. В модельной линейке Kingston подходящим вариантом будет HyperX Blu KHX1333C9D3B1K2/4G - 4-гигабайтный модуль DDR3 для десктопов с шестнадцатью модулями памяти на борту. Его не так легко найти в продаже, но хочешь 16 Гбайт на старом ПК - умей вертеться.

    И да, «лучшие из архаичных» чипсеты, такие как Intel P35 Express, например, тоже довольствуются поддержкой DDR3 на частоте 1333 вместо типичных для бюджетных платформ современности 1600 МГц.


    HyperX Blu KHX1333C9D3B1K2 - один из немногочисленных способов заполучить 16 Гбайт ОЗУ в старых ПК

    Нет разнообразия - нет проблем

    После долговременного «оплота сопротивления» с контроллером памяти в северном мосту платформ Intel эксперименты прекратились. Все новые платформы Intel и AMD предусматривали контроллер под крышкой самого CPU. Это, конечно, плохо с точки зрения долгожительства платформы (нельзя проделать трюк и «пересесть» на новый тип памяти со старым процессором), но производители RAM подстроились и, как видите, память DDR3 не утратила свою популярность даже в 2017 году. Её носителями сегодня являются следующие платформы:
    AMD Intel
    am3 lga1366
    am3+ lga1156
    fm1 lga1155
    fm2 lga1150
    fm2+ lga2011

    Список архитектур процессоров на базе этих платформ намного более обширный! А вот многообразия в выборе памяти - меньше, точнее его почти нет. Единственное исключение - процессоры AMD для сокета AM3, которые, на радость экономным покупателям, совместимы с сокетом AM2, AM2+. Соответственно, «красные» оборудовали такие процессоры универсальным контроллером, который поддерживает и память DDR2 (для AM2+), и DDR3. Правда, чтобы «раскочегарить» DDR3 на Socket AM3 до частоты 1333 и 1600 МГц, придётся дополнительно повозиться с настройками.


    Примерно так соотносились новые компьютеры на базе DDR3 и конкурирующих типов памяти в недавнем прошлом

    Принципы подбора памяти в случае с платформами на базе DDR3 таковы:

    • для FM1, FM2 и FM2+ , если речь идёт об APU с мощной интегрированной графикой, можно и нужно выбирать наиболее производительную оперативную память. Даже старенькие чипы на базе FM1 способны совладать с DDR3 на частоте 1866 МГц, а чипы на микроархитектуре Kaveri и её «рестайлинге» Godavari в некоторых случаях выжимают все соки даже из экстремально разогнанной DDR3 на частоте 2544 МГц! И это не «кукурузные», а действительно полезные в реальных сценариях работы мегагерцы. Поэтому оверклокерская память таким компьютерам просто необходима.


    Прирост производительности в APU AMD в зависимости от частоты RAM (источник: ferra.ru)

    Начать стоит, к примеру, с модулей HyperX HX318C10F - они уже «в базе» работают при 1866 МГц и CL10, а в разгоне придутся как раз кстати чувствительным к тактовой частоте гибридным процессорам AMD.


    Гибридные процессоры AMD остро нуждаются в высокочастотной памяти

    • «антикварные» процессоры Intel на платформах LGA1156 и её серверного собрата LGA1366 способны оседлать высокочастотную DDR3 только в случае корректно подобранного множителя. Сам Intel гарантирует стабильную работу исключительно в рамках диапазоне «до 1333 МГц». Кстати, не забывайте о том, что помимо поддержки регистровой памяти с ECC, серверные платформы LGA1366 и LGA2011 предлагают трёх- и четырёхканальные контроллеры DDR3. И остаются, пожалуй, единственными кандидатами на апгрейд ОЗУ до 64 Гбайт, потому что не-регистровые модули памяти объёмом 16 Гбайт в природе почти не встречаются. Зато в LGA2011 разгон памяти стал легко осуществим вплоть до 2400 МГц.
    • практически все процессоры на базе микроархитектур Sandy Bridge и Ivy Bridge (LGA1155) поддерживают оперативную память с частотой до 1333 МГц. Поднять частоту тактового генератора и получить таким образом «лёгкий» разгон в этом поколении Intel Core уже нельзя. Но модели с разблокированным множителем и «правильной» материнской платой способны выйти далеко за рамки пресловутых 1333 МГц, поэтому для Z-чипсетов и процессоров с суффиксом K есть смысл потратиться на модули HyperX Fury HX318C10F - штатные 1866 МГц «гонибельны» практически до предельных для Bridge-процессоров величин. Мало не покажется!
    • LGA1150 , носитель чипов на базе микроархитектур Haswell и Broadwell стала последней из «гражданских» платформ Intel с поддержкой DDR3, но в методах взаимодействия с ОЗУ почти не изменилась со времён Sandy Bridge и Ivy Bridge. Разве что поддержка массовых моделей DDR3 с частотой 1600 МГц наконец воплотилась в жизнь. Если же говорить о разгоне, то теоретический максимум для процессоров с разблокированными множителями при оверклокерских матплатах составляет 2933 МГц! Максимум есть максимум, но с поддержкой профилей XMP в современных модулях DDR3 достичь высоких частот на стареющим типе памяти уже не сложно.
    Кстати, именно в эпоху LGA1150 усилиями разработчиков ноутбуков в обиход вошла память DDR3L (хотя её производство стартовало ещё в 2008 году). Она потребляет чуть меньше энергии (1,35В против 1,5В в «просто» DDR3), совместима со всеми старыми чипсетами, которые вышли до её распространения на рынке. А вот устанавливать DDR3 при 1,5В в ноутбуки, которым «по зубам» только DDR3L уже нежелательно - память либо не будет работать вообще, либо сработается с компьютером некорректно.

    DDR4 - самая быстрая, самая элементарная в апгрейде и покупке память

    Язык не поворачивается назвать память DDR4 SDRAM новинкой - всё-таки процессоры Intel Skylake , первые массовые CPU с DDR4 на борту, вышли ещё 2015 году и успели заиметь «рестайлинг» в лице чуть более оптимизированных и эффективных в разгоне Kaby Lake . А в 2016 году платформу с поддержкой DDR4 продемонстрировала AMD. Правда, всего лишь продемонстрировала, потому что сокет AM4 предназначен для процессоров AMD «наконец-то серьёзная конкуренция» RyZEN, которые только-только рассекретили.


    DDR4 ещё совсем юн, но для того, чтобы раскрыть потенциал четырёхканальных контроллеров платформы Intel LGA 2011-v3, уже сейчас нужна оверклокерская память

    С выбором памяти для сверхновых платформ всё предельно просто - частота массовых модулей DDR4 стартует с 2133 МГц (они достижимы и на DDR3, но «в прыжке»), а объём - с 4 Гбайт. Но покупать «стартовую» конфигурацию DDR4 сегодня настолько же недальновидно, как довольствоваться DDR3 с частотой 800 МГц на заре её появления.

    Встроенный в процессоры на базе платформы LGA1151 контроллер памяти двухканальный, а это значит, что по-хорошему нужно уложиться в пару модулей, ёмкости которых хватит для современных игр. Сегодня такой объём составляет 16 Гбайт (нет, мы не шутим - с 8 Гбайт ОЗУ в 2017 году уже не получится «ни в чём себе не отказывать»), а что касается тактовой частоты, правильным мейнстримом стала память DDR4-2400.

    В серверных/экстремальных процессорах для платформы LGA 2011-v3 контроллер памяти уже четырёхканальный, а из всех разновидностей ОЗУ де-юре поддерживается только DDR4-2133, но разгон памяти на базе чипсета Intel X99 с Intel Core i7 Extreme даётся не легко, а очень легко. Ну а компьютеру для максималистов нужна память для максималистов - например, «жэстачайшая» HyperX Predator DDR4 HX432C16PB3K2 с тактовой частотой 3200 МГц. Согласно принципу «гулять так гулять» укомплектовывать платформу LGA 2011-v3 нужно всеми четырьмя модулями - только в этом случае четырёхканальный контроллер сможет реализовать весь скоростной потенциал подсистемы памяти.

    Чтобы не зубрить правила и исключения

    Что можно добавить к описанным выше нюансам выбора? Много чего: специфические моноблоки неттопы с нереференсным дизайном комплектующих, ноутбуки одной и той же модели с абсолютно разным потенциалом для апгрейда, отдельные капризные модели материнских плат и другие «грабли», на которые легко наткнуться, если вы не следили за тенденциями в железе на форумах энтузиастов.

    На этот случай Kingston предлагает онлайн-конфигуратор . С его помощью можно подобрать гарантированно совместимую и эффективную оперативную память для десктопов, рабочих станций, неттопов, ультрабуков, серверов, планшетов и других устройств.
    Есть резон сверить совместимость начинки ПК с памятью, которую вы присмотрели для покупки, чтобы не возвращаться в магазин и пояснять консультантам, что «память-то работоспособная, но моему компьютеру нужна DDR3-1600, которая не совсем обычная DDR3-1600».

    Не бросайте стариков на произвол судьбы!

    Вам не показалось - модернизация памяти и вправду тем хлопотнее, чем старее компьютер. Эта статья не охватывает все возможные трудности и частности в выборе памяти (это почти невозможно физически, и вы бы утомились одолевать сводку подобных мелочей целиком) Но это не повод отправлять всё ещё работоспособное железо на свалку истории.


    Зажечь можно в любом возрасте

    Потому что устаревшие с наших оверклокерско-энтузиастских колоколен ПК всё ещё могут сослужить добрую службу менее амбициозным пользователям или переквалифицироваться в домашний сервер/медиацентр, а уж очередную песню «бессмертному» Sandy Bridge, который отметил шестилетие и всё ещё хорош, сегодня исполнять не будем. Высокого вам быстродействия и попутного ветра в модернизации ПК!

    Быстрая оперативная память - это хорошо, а быстрая оперативная память со скидкой - ещё лучше! Поэтому не упустите возможность приобрести до 8 марта любой из комплектов памяти HyperX Savage DDR4 и HyperX Predator DDR4 со скидкой 10% по промокоду DDR4FEB в Юлмарте. Памяти много не бывает, а производительной и крутой памяти для новых платформ ПК - тем более!

    Для получения дополнительной информации о продукции Kingston и HyperX обращайтесь на официальный сайт компании . В выборе своего комплекта HyperX поможет

    Кажется, что Intel в этом отношении догоняет AMD. Но, как часто бывает, когда гигант что-то делает, то и шаг вперёд получается гигантским. Если у Barcelona используется два 64-битных контроллера памяти DDR2, топовая конфигурация Intel включает целых три контроллера памяти DDR3. Если установить память DDR3-1333, которую Nehalem тоже будет поддерживать, это даст пропускную способность до 32 Гбайт/с в некоторых конфигурациях. Но преимущество встроенного контроллера памяти кроется не только в пропускной способности. Он существенно снижает задержки доступа к памяти, что не менее важно, учитывая, что каждый доступ стоит несколько сотен тактов. В контексте настольного использования снижение задержек встроенного контроллера памяти можно приветствовать, однако полное преимущество от более масштабируемой архитектуры будет заметно в многосокетных серверных конфигурациях. Раньше при добавлении CPU доступная пропускная способность оставалась прежней, однако теперь каждый новый дополнительный процессор увеличивает пропускную способность, поскольку каждый CPU обладает собственной памятью.

    Конечно, чудес ожидать не следует. Перед нами конфигурация Non Uniform Memory Access (NUMA), то есть доступ к памяти будет обходиться по тем или иным накладным расценкам, в зависимости от того, где данные располагаются в памяти. Понятно, что доступ к локальной памяти будет производиться с самыми низкими задержками и самой высокой пропускной способностью, поскольку доступ к удалённой памяти происходит через промежуточный интерфейс QPI, снижающий производительность.


    Нажмите на картинку для увеличения.

    Влияние на производительность предсказать сложно, поскольку всё зависит от приложения и операционной системы. Intel утверждает, что падение производительности при удалённом доступе по задержкам составляет около 70%, а пропускная способность снижается в два раза по сравнению с локальным доступом. По информации Intel, даже при удалённом доступе через интерфейс QPI, задержки будут ниже, чем на предыдущих поколениях процессоров, где контроллер находился на северном мосту. Однако это касается только серверных приложений, которые уже довольно долгое время разрабатываются с учётом конфигураций NUMA.

    Иерархия памяти в Conroe была очень простой; Intel сконцентрировалась на производительности общего кэша L2, который стал лучшим решением для архитектуры, которая нацеливалась, главным образом, на двуядерные конфигурации. Но в случае с Nehalem инженеры начали с нуля и пришли к такому же заключению, что и конкуренты: общий кэш L2 не очень хорошо подходит для "родной" четырёхъядерной архитектуры. Разные ядра могут слишком часто "вымывать" данные, необходимые другим ядрам, что приведёт к слишком многим проблемам с внутренними шинами и арбитражем, пытаясь обеспечить все четыре ядра достаточной пропускной способностью с сохранением задержек на достаточно низком уровне. Чтобы решить эти проблемы, инженеры оснастили каждое ядро собственным кэшем L2. Поскольку он выделен на каждое ядро и относительно мал (256 кбайт), получилось обеспечить кэш очень высокой производительностью; в частности, задержки существенно улучшились по сравнению с Penryn - с 15 тактов до, примерно, 10 тактов.

    Затем есть огромная кэш-память третьего уровня (8 Мбайт), отвечающая за связь между ядрами. На первый взгляд архитектура кэша Nehalem напоминает Barcelona, но работа кэша третьего уровня очень отличается от AMD - она инклюзивная для всех нижних уровней иерархии кэша. Это означает, что если ядро попытается получить доступ к данным, и они отсутствуют в кэше L3, то нет необходимости искать данные в собственных кэшах других ядер - там их нет. Напротив, если данные присутствуют, четыре бита, связанные с каждой строчкой кэш-памяти (один бит на ядро) показывают, могут ли данные потенциально присутствовать (потенциально, но без гарантии) в нижнем кэше другого ядра, и если да, то в каком.

    Эта техника весьма эффективна для обеспечения когерентности персональных кэшей каждого ядра, поскольку она уменьшает потребность в обмене информацией между ядрами. Есть, конечно, недостаток в виде потери части кэш-памяти на данные, присутствующие в кэшах других уровней. Впрочем, не всё так страшно, поскольку кэши L1 и L2 относительно маленькие по сравнению с кэшем L3 - все данные кэшей L1 и L2 занимают, максимум, 1,25 Мбайт в кэше L3 из доступных 8 Мбайт. Как и в случае Barcelona, кэш третьего уровня работает на других частотах по сравнению с самим чипом. Следовательно, задержка доступа на данном уровне может меняться, но она должна составлять около 40 тактов.

    Единственные разочарования в новой иерархии кэша Nehalem связаны с кэшем L1. Пропускная способность кэша инструкций не была увеличена - по-прежнему 16 байт на такт по сравнению с 32 у Barcelona. Это может создать "узкое место" в серверно-ориентированной архитектуре, поскольку 64-битные инструкции крупнее, чем 32-битные, тем более что у Nehalem на один декодер больше, чем у Barcelona, что сильнее нагружает кэш. Что касается кэша данных, его задержка была увеличена до четырёх тактов по сравнению с тремя у Conroe, облегчая работу на высоких тактовых частотах. Но закончим мы на положительной новости: инженеры Intel увеличили число промахов кэша данных L1, которые архитектура может обрабатывать параллельно.

    TLB

    Уже многие годы процессоры работают не с физическими адресами памяти, а с виртуальными. Среди других преимуществ такой подход позволяет выделять программе больше памяти, чем есть в компьютере, сохраняя только необходимые на данный момент данные в физической памяти, а всё остальное - на жёстком диске. Это означает, что каждый доступ к памяти виртуальный адрес нужно переводить в физический адрес, и для сохранения соответствия приходится использовать огромную таблицу. Проблема в том, что эта таблица получается столь большой, что на чипе её хранить уже не получается - она размещается в основной памяти, причём её можно даже сбрасывать на жёсткий диск (часть таблицы может отсутствовать в памяти, будучи сброшенной на HDD).

    Если для каждой операции работы с памятью требовался бы такой этап перевода адресов, то всё работало бы слишком медленно. Поэтому инженеры вернулись к принципу физической адресации, добавив небольшую кэш-память напрямую на процессор, которая хранит соответствие для нескольких недавно запрошенных адресов. Кэш-память называется Translation Lookaside Buffer (TLB). Intel полностью переделала TLB в новой архитектуре. До сих пор Core 2 использовал TLB первого уровня очень маленького размера (16 записей), но очень быстрый и только для загрузок, а также больший кэш TLB второго уровня (256 записей), который отвечал за загрузки, отсутствующие в TLB L1, а также и записи.

    Nehalem теперь оснастился полноценным двухуровневым TLB: кэш TLB первого уровня разделён для данных и инструкций. Кэш TLB L1 для данных может хранить 64 записи для маленьких страниц (4K) или 32 записи для больших страниц (2M/4M), а кэш TLB L1 для инструкций может хранить 128 записей для маленьких страниц (как и в случае Core2), а также семь для крупных. Второй уровень состоит из унифицированного кэша, который может хранить до 512 записей и работает только с маленькими страницами. Цель такого улучшения заключается в увеличении производительности приложений, которые используют большие массивы данных. Как и в случае двухуровневой системы предсказания ветвлений, перед нами ещё одно свидетельство серверной ориентации архитектуры.

    Давайте на время вернёмся к SMT, поскольку эта технология тоже влияет на TLB. Кэш L1 TLB для данных и TLB L2 динамически распределяются между двумя потоками. Напротив, кэш L1 TLB для инструкций статически распределяется для малых страниц, а выделенный для больших страниц полностью копируется - это вполне понятно, учитывая его малый размер (семь записей на поток).

    Доступ к памяти и предварительная выборка

    Оптимизированный невыровненный доступ к памяти (Unaligned Memory Access)

    В архитектуре Core доступ к памяти приводил к ряду ограничений по производительности. Процессор был оптимизирован для доступа к адресам памяти, выровненным по 64-байтным границам, то есть по размеру одной строчки кэша. Для невыровненных данных доступ был не только медленный, но и выполнение невыровненных инструкций считывания или записи было более накладным, чем в случае выровненных инструкций, независимо от реального выравнивания данных памяти. Причина заключалось в том, что эти инструкции приводили к генерации нескольких микроопераций на декодерах, что снижало пропускную способность с данными типами инструкций. В итоге компиляторы избегали генерировать инструкции подобного типа, подставляя вместо них последовательность инструкций, которые менее накладны.

    Так, чтение из памяти, при котором происходил перехлёст двух строчек кэша, замедлялось примерно на 12 тактов, по сравнению с 10 тактами для записи. Инженеры Intel оптимизировали подобный тип обращений, чтобы он выполнялся быстрее. Начнём с того, что теперь нет падения производительности при использовании невыровненных инструкций чтения/записи в случаях, когда данные выровнены в памяти. В других случаях Intel тоже оптимизировала доступ, снизив падение производительности по сравнению с архитектурой Core.

    Больше блоков предварительной выборки с более эффективной работой

    В архитектуре Conroe Intel особенно гордилась аппаратными блоками предсказания. Как вы знаете, блок предсказания - это механизм, который следит за характером доступа к памяти и пытается предсказать, какие данные потребуются через несколько тактов. Цель заключается в том, чтобы упреждающим образом загрузить данные в кэш, где они будут располагаться ближе к процессору, и вместе с тем максимально использовать доступную пропускную способность тогда, когда процессору она не нужна.

    Данная технология даёт замечательные результаты с большинством настольных приложений, но в серверной среде она часто приводила к потере производительности. Есть несколько причин подобной неэффективности. Во-первых, доступы к памяти часто сложнее предсказать в серверных приложениях. Доступ к базе данных, например, отнюдь не линейный - если в памяти запрашивается какой-либо элемент данных, то это не значит, что следующим будет соседний элемент. Это ограничивает эффективность блока предварительной выборки. Но основной проблемой была пропускная способность памяти в многосокетных конфигурациях. Как мы уже говорили раньше, она уже была "узким местом" для нескольких процессоров, но, помимо этого, блоки предварительной выборки приводили к дополнительной нагрузке на этом уровне. Если микропроцессор не выполняет доступ к памяти, то включались блоки предварительной выборки, пытаясь использовать пропускную способность, по их предположению, свободную. Однако блоки не могли знать, нужна ли эта пропускная способность другому процессору. Это означало, что блоки предварительной выборки могли "отбирать" у процессора пропускную способность, которая и так была "узким местом" в таких конфигурациях. Чтобы решить эту проблему, Intel не нашла ничего лучше, как отключить блоки предварительной выборки в таких ситуациях - вряд ли самое оптимальное решение.

    Как утверждает Intel, эта проблема уже решена, однако компания не даёт никаких деталей по поводу работы новых механизмов предварительной выборки. Всё, что компания говорит: теперь не нужно отключать блоки для серверных конфигураций. Впрочем, даже Intel ничего не изменила, преимущества от новой организации памяти и, вследствие этого, большая пропускная способность должны нивелировать негативное влияние блоков предварительной выборки.

    Заключение

    Conroe стал серьёзным фундаментом для новых процессоров, и Nehalem построен как раз на нём. Здесь используется такая же эффективная архитектура, но теперь она намного более модульная и масштабируемая, что должно гарантировать успех в разных рыночных сегментах. Мы не говорим о том, что Nehalem революционизировал архитектуру Core, но новый процессор революционизировал платформу Intel, которая теперь стала достойным соответствием для AMD по дизайну, а по реализации Intel успешно обошла конкурента.


    Нажмите на картинку для увеличения.

    Со всеми улучшениями, сделанными на данном этапе (интегрированный контроллер памяти, QPI), неудивительно видеть, что изменения исполнительного ядра не такие значительные. Но возвращение Hyper-Threading можно считать серьёзной новостью, да и ряд небольших оптимизаций тоже должны обеспечить заметный прирост производительности по сравнению с Penryn на равных частотах.

    Вполне очевидно, что самый серьёзный прирост будет в тех ситуациях, где основным "узким местом" была оперативная память. Если вы прочитали статью целиком, то наверняка заметили, что именно на эту область инженеры Intel уделили максимум внимания. Кроме добавления встроенного контроллера памяти, который, без сомнения, даст наибольший прирост касательно операций доступа к данным, есть и множество других улучшений, как крупных, так и мелких - новая архитектура кэша и TLB, невыровненный доступ к памяти и блоки предварительной выборки.

    Учитывая всю теоретическую информацию, мы с нетерпением ждём, как улучшения отразятся на реальных приложениях после выхода новой архитектуры. Мы посвятим этому несколько статей, так что оставайтесь с нами!

    Память

    Память - это устройство для хранения информации. Она состоит из оперативного и постоянного запоминающего устройств. Оперативное запоминающее устройство называется ОЗУ , постоянное запоминающее устройство - ПЗУ .

    ОЗУ- энергозависимая память

    ОЗУ предназначена для записи, считывания и хранения программ (системных и прикладных), исходных данных, промежуточных и окончательных результатов. Доступ к элементам памяти прямой. Другое название – RAM (Random Access Memory) память с произвольным доступом. Все ячейки памяти объединены в группы по 8 бит (1 байт) и каждая такая группа имеет адрес, по которому к ней можно обратиться. ОЗУ используется для временного хранения данных и программ. При выключении компьютера, информация в ОЗУ стирается. ОЗУ - энергозависимая память. В современных компьютерах объем памяти обычно составляет от 512 Мбайт до 4 Гигабайт. Современные прикладные программы часто требуют для своего выполнения 128–256, а то и 512 Мбайта памяти, в противном случае программа просто не сможет работать.

    Оперативная память может строиться на микросхемах динамического (Dinamic Random Access Memory – DRAM ) или статического (Static Random Access Memory –SRAM ) типа. Статический тип памяти обладает существенно более высоким быстродействием, но значительно дороже динамического. Для регистровой памяти (МПП и КЭШ-память) используются SRAM, а ОЗУ основной памяти строится на базе DRAM-микросхем.

    ПЗУ - энергонезависимая память.

    В англоязычной литературе ПЗУ называется Read Only Memory, ROM (память только для чтения). Информация в ПЗУ записывается на заводе-изготовителе микросхем памяти, и в дальнейшем изменить ее значение нельзя. В ПЗУ хранится информация, которая не зависит от операционной системы.

    В ПЗУ находятся:


    • Программа управления работой самого процессора

    • Программы управления дисплеем, клавиатурой, принтером, внешней памятью

    • Программы запуска и остановки ЭВМ (BIOS – Base Input / Outout Sysytem)

    • Программы тестирования устройств, проверяющие при каждом включении компьютера правильность работы его блоков (POST -Power On SelfTest)

    • Информация о том, где на диске находится операционная система .

    CMOS - энергонезависимая память

    CMOS RAM - энергонезависимая память компьютера. Эта микросхема многократной записи имеет высокую плотность размещения элементов (каждая ячейка имеет размер в 1 байт) и малое потребление энергии – для нее вполне достаточно мощности батареи компьютера. Получила название от технологии создания на основе комплементарных металло-оксидных полупроводников (complementary metal-oxide semiconductor - CMOS). CMOS RAM является собой базу данных для хранения информации о конфигурации ПК. Программа запуска компьютера Setup BIOS используется для установки и хранения параметров конфигурации в CMOS RAM. При каждой загрузке системы для определения ее конфигурации проводится считывание параметров, хранящихся в микросхеме CMOS RAM. Более того, поскольку некоторые параметры запуска компьютера можно менять, то все эти вариации хранятся в CMOS. Программа установки BIOS SETUP при записи сохраняет в ней свою системную информацию, которую впоследствии сама же и считывает (при загрузке ПК). Несмотря на явную связь между BIOS и CMOS RAM, это абсолютно разные компоненты.



    Ключевые слова настоящей лекции

    контроллеры, чипсет, порты, USB, COM, LPT, BIOS POST, CMOS, Boot, устройства В/В,

    (controller - регулятор, управляющее устройство) - устройство управления разнообразными устройствами компьютера.

    Чипсет (chipset)

    Набор микросхем, спроектированных для совместной работы с целью выполнения набора каких-либо функций. Так, в компьютерах чипсет, размещенный на материнской плате, выполняет роль связующего компонента, обеспечивающего совместное функционирование подсистем памяти, центрального процессора (ЦП), ввода-вывода и других. Матери́нская пла́та (motherboard, MB , также используется название mainboard - главная плата; сленг. мама , мать , материнка ) - это сложная многослойная печатная плата, на которой устанавливаются основные компоненты персонального компьютера (центральный процессор, контроллер ОЗУ и собственно ОЗУ, загрузочное ПЗУ, контроллеры базовых интерфейсов ввода-вывода), чипсет, разъёмы (слоты) для подключения дополнительных контроллеров, использующих шины USB, PCI и PCI-Express.

    Северный мост (Northbridge; в отдельных чипсетах Intel, контроллер-концентратор памяти Memory Controller Hub, MCH) - системный контроллер чипсета на материнской плате платформы x86, к которому в рамках организации взаимодействия подключены:

    через Front Side Bus - микропроцессор ,

    через шину контроллера памяти - оперативная память ,

    через шину графического контроллера - видеоадаптер ,

    через внутреннюю шину подсоединяется южный мост .

    Южный мост (Southbridge; функциональный контроллер; контроллер-концентратор ввода-вывода I/O Controller Hub, ICH). Обычно это одна микросхема на материнской плате, которая через Северный мост связывает с центральный процессором «медленные» (по сравнению со связкой «ЦП-ОЗУ») взаимодействия (например разъёмы шин для подключения периферийных устройств).

    AGP (от англ. Accelerated Graphics Port, ускоренный графический порт) - разработанная в 1997 году компанией Intel, специализированная 32-битная системная шина для видеокарты.

    PCI (англ. Peripheral component interconnect, дословно - взаимосвязь периферийных компонентов) - шина ввода/вывода для подключения периферийных устройств к материнской плате компьютера.

    Ultra DMA (Direct memory access, Прямой доступ к памяти). Разные версии ATA известны под синонимами IDE, EIDE, UDMA, ATAPI; ATA (англ. Advanced Technology Attachment - присоединение по передовой технологии) - параллельный интерфейс подключения накопителей (жёстких дисков и оптических приводов) к компьютеру. В 1990-е годы был стандартом на платформе IBM PC; в настоящее время вытесняется своим последователем - SATA и с его появлением получил название PATA (Parallel ATA).

    USB (англ. Universal Serial Bus - «универсальная последовательная шина», произносится «ю-эс-би» или «у-эс-бэ») - последовательный интерфейс передачи данных для среднескоростных и низкоскоростных периферийных устройств в вычислительной технике. Для подключения периферийных устройств к шине USB используется четырёхпроводный кабель, при этом два провода (витая пара) в дифференциальном включении используются для приёма и передачи данных, а два провода - для питания периферийного устройства. Благодаря встроенным линиям питания USB позволяет подключать периферийные устройства без собственного источника питания (максимальная сила тока, потребляемого устройством по линиям питания шины USB, не должна превышать 500 мА).

    LPT -порт (стандартного устройства принтера «LPT1» Line Printer Terminal или Line PrinTer) в операционных системах семейства MS-DOS. IEEE 1284 (порт принтера, параллельный порт)

    COM -порт («ком-порт» Communication port, Serial port, серийный порт, последовательный порт) - двунаправленный последовательный интерфейс, предназначенный для обмена битовой информацией. Последовательным данный порт называется потому, что информация через него передаётся по одному биту, бит за битом (в отличие от параллельного порта).

    PS/2 - разъем, применяемый для подключения клавиатуры и мыши. Впервые появился в 1987 году на компьютерах IBM PS/2 и впоследствии получил признание других производителей и широкое распространение в персональных компьютерах и серверах рабочих групп. серия персональных компьютеров компании IBM на процессорах серий Intel 80286 и Intel 80386, выпускавшаяся с апреля 1987 года. /2 – версия компьютера.