Закон мура в транзисторах что нового. Закон мура приказал долго жить. Распространение закона Мура

Зависимость числа транзисторов на кристалле микропроцессора от времени. Обратите внимание, что вертикальная ось имеет логарифмическую шкалу, то есть кривая соответствует экспоненциальному закону - количество транзисторов удваивается примерно каждые 2 года.

Мур высказал предположение, что число транзисторов на кристалле будет удваиваться каждые 24 месяца. При анализе графика роста производительности запоминающих микросхем им была обнаружена закономерность: появление новых моделей микросхем наблюдалось спустя примерно одинаковые периоды (18-24 мес.) после предшественников, при этом количество транзисторов в них возрастало каждый раз приблизительно вдвое. Гордон Мур пришел к выводу, что при сохранении этой тенденции мощность вычислительных устройств за относительно короткий промежуток времени может вырасти экспоненциально.

Это наблюдение получило название закон Мура. Существует масса схожих утверждений, которые характеризуют процессы экспоненциального роста, также именуемых «законами Мура». К примеру, менее известный «второй закон Мура», введённый в 1998 году Юджином Мейераном , который гласит, что стоимость фабрик по производству микросхем экспоненциально возрастает с усложнением производимых микросхем. Так, стоимость фабрики, на которой корпорация Intel производила микросхемы динамической памяти ёмкостью 1 Кбит, составляла 4 млн. $, а оборудование по производству микропроцессора Pentium по 0,6-микрометровой технологии c 5,5 млн. транзисторов обошлось в 2 млрд. $. Стоимость же Fab32, завода по производству процессоров на базе 45-нм техпроцесса, составила 3 млрд. $.

По поводу эффектов, обусловленных законом Мура, в журнале «В мире науки» как-то было приведено такое интересное сравнение:

«Если бы авиапромышленность в последние 25 лет развивалась столь же стремительно, как промышленность средств вычислительной техники, то сейчас самолёт Boeing 767 стоил бы 500 долл. и совершал облёт земного шара за 20 минут, затрачивая при этом пять галлонов (~18,9 л) топлива. Приведенные цифры весьма точно отражают снижение стоимости, рост быстродействия и повышение экономичности ЭВМ». - Журнал «В мире науки» (1983, № 10) (русское издание «Scientific American»)

В 2007 году Мур заявил, что закон, очевидно, скоро перестанет действовать из-за атомарной природы вещества и ограничения скорости света.

Одним из физических ограничений на миниатюризацию электронных схем является также Принцип Ландауэра, согласно которому логические схемы, не являющиеся обратимыми, должны выделять теплоту в количестве, пропорциональном количеству стираемых (безвозвратно потерянных) данных. Возможности по отводу теплоты физически ограничены.

Параллелизм и закон Мура

В последнее время, чтобы получить возможность задействовать на практике ту дополнительную вычислительную мощность, которую предсказывает закон Мура, стало необходимо задействовать параллельные вычисления. На протяжении многих лет, производители процессоров постоянно увеличивали тактовую частоту и параллелизм на уровне инструкций, так что на новых процессорах старые однопоточные приложения исполнялись быстрее без каких либо изменений в программном коде. Сейчас по разным причинам производители процессоров предпочитают многоядерные архитектуры, и для получения всей выгоды от возросшей производительности ЦП программы должны переписываться в соответствующей манере. Однако, по фундаментальным причинам, это возможно не всегда.

2012: Опровержение закона Мура

Исследователи из Университета Нового Южного Уэльса (University of New South Wales) совершили очередной прорыв в развитии компьютерной отрасли: им впервые удалось создать рабочий транзистор на базе одного атома.

С 1954 года, когода научный сотрудник Texas Instruments Джордж Тиль (George Teal) создал первый кремниевый транзистор, инновационные решения позволили постепенно уменьшать и уменьшать размер этих электронных компонентов, что привело к созданию компьютеров и мобильных устройств современного типа.

Одно устройство может содержать миллиарды транзисторов, которые работают вместе для выполнения простых двоичных вычислений. Чем больше транзисторов находится на единицу площади, тем быстрее производятся расчеты и тем больше информации компьютеры могут обработать и сохранить, одновременно затрачивая меньше энергии.

В прошлом уже были созданы одноатомные транзисторы. Но к сегодняшнему дню в их использовании была достигнута погрешность в 10 нанометров (нанометр равен одной миллиардной метра). Но для одноатомного транзистора, чтобы он мог использоваться в реальных устройствах, требуется расположение одного атома точно на кремниевом чипе. По данным журнала о нанотехнологиях Nature Nanotechnology, именного этого и удалось достичь исследователям.

Они использовали сканирующий туннельный микроскоп (устройство, которое позволяет исследователям видеть атомы и обеспечить точность манипуляций с ними) ученые проделали узкий канал в кремниевой базе. Затем был применен газ фосфин, с помощью которого был помещен отдельный атом фосфора между двумя электродами в нужной области. Когда электрический ток проходит через такое устройство, оно усиливает и передает электрический сигнал, что и является основным принципом работы любого транзистора.

Так что достижение ученых из Австралии приблизило человечество еще на один шаг к созданию квантовых компьютеров. Удивительно также и то, что команда бросила вызов закону Мура (основывается на публикации Гордона Мура (Gordon Moore) в журнале Electronics Magazine в 1965 году). Согласно этому закону, число транзисторов, размещающихся на одной схеме, удваивается каждые 18-24 месяцев. Так что, по прогнозам Мура, одноатомные транзисторы должны появиться не раньше 2020 года. Однако это произошло на 8 лет раньше.

Мишель Симмонс (Michelle Simmons), директор ARC Centre for Quantum Computation and Communications и глава исследовательской группы, заявил: «Мы решили 10 лет назад, что создадим одноатомный транзистор так быстро, как это будет возможно, и тем самым опровергнем этот закон. И вот мы сделали это в 2012 году».

Однако до реального использования таких транзисторов пройдет еще 15-20 лет. Дело в том, что работающий образец функционирует только при температуре минус 391 градус в пределах лаборатории, так что является всего лишь доказательством концепции.

2015: Intel верит в дальнейшее соблюдение закона Мура

На конференции International Solid-State Circuits Conference (ISSCC), которая с 22 по 26 февраля 2015 года прошла в Сан-Франциско, участники полупроводниковой отрасли рассказали о своих достижениях и планах в части освоения «тонких» технологических норм. Добраться до 10 нм чипмейкеры смогут при помощи нынешних технологий, но дальнейшее развитие осложнится, поэтому производителям потребуются новые решения.

По словам ведущего специалиста Intel Марка Бора (Mark Bohr), несмотря на всеобщую борьбу с растущими расходами на полупроводниковые пластины, компания продолжает увеличивать в микросхемах плотность транзисторов и снижать себестоимость каждого из них, и делает это быстрее в случае с 14 нм по сравнению с предыдущими технологиями. Эти темпы сохранятся на 10 и 7 нм шаге за счет масштабирования, позволяющего повысить степень интеграции и удешевить стоимость одного транзистора, заявил Бор.

Стоит отметить, что Intel начала 14-нм производство с запозданием примерно на 6-9 месяцев относительно планируемых сроков. Несмотря на это американская корпорация опередила конкурентов, и к концу февраля 2015 года лишь она предлагает 14-нм процессоры, а TSMC , Samsung и GlobalFoundries только-только приноравливаются к выпуску 16-нм продукции с сохранением 20-нм геометрии в металлических слоях.

Intel обещает коммерческое освоение 10-нм техпроцесса в 2016 году и планирует использовать 7-нм технологию в 2018-м. Еще через два года компания рассчитывает на переход к 5 нм.

Сделать это без инноваций будет трудно. Они обязательно появятся, поскольку именно так было в последние годы, уверен Марк Бор, ссылаясь на закон Мура, предполагающий, что вычислительная мощность удваивается каждые 24 месяца.

При освоении передовых проектных норм Intel, возможно, будет применять упаковку чипов типа 2,5D (слои помещаются рядом друг с другом) и 3D (слои располагаются поверх друг друга). При этом корпорация продолжает поиск новых эффективных с точки зрения себестоимости решений.

Глава полупроводникового подразделения Samsung Кинам Ким (Kinam Kim) заявил, что CMOS-транзисторы теоретически можно уменьшить до норм 3-5 нм. Вместе с тем топ-менеджер согласился с тем, что технологии ниже 10 нм требуют новых подходов.

Наверное, многие из вас задавали себе ряд вопросов: почему быстрые процессоры появляются только сегодня? Какие процессоры появятся завтра, и от чего это зависит? Почему современные процессоры сильно греются? В данной статье мы постараемся ответить на все эти вопросы и обрисовать некоторые перспективы.
Процессоры - это сложные устройства, базирующиеся на транзисторах . Транзистор является мельчайшим вычислительным элементом, который можно сравнить с краном: если кран открыт, то вода льется, если закрыт - то нет. Используя комбинацию множества таких "кранов", мы можем создавать сложные логические схемы. Современные процессоры состоят из миллионов транзисторов, в то время как первые модели насчитывали всего несколько тысяч (эволюцию процессоров вы можете проследить по соответствующей таблице).
В 1965 году Гордон Мур , один из основателей компании Intel , публикует в журнале Electronics статью. Впоследствии эта статья стала легендарной, а сделанное в ней предположение получило название "закона Мура". Следует отметить, что закон Мура является наблюдением - то есть когда-то он может перестать выполняться. Но вот уже почти 40 лет закон Мура работает. К сожалению, автор дал запутанную и длинную формулировку этого закона, поэтому мы перефразируем ее так: "каждые два года число транзисторов на процессорах, которые выгодно производить, удваивается ". Чтобы понять ее важность и разобраться в последствиях, давайте представим себя в роли производителя процессоров.

Создаем свой процессор
Чипы вырезаются из кремниевых подложек - круглых пластин, которые на современных заводах достигли диаметра 300 мм.
В процессе производства на пластинах вытравляются транзисторы. Однако также возникают и дефекты - они на схематическом изображении подложки показаны желтыми точками. Процессоры с дефектными участками придется выкинуть. На нашем примере из подложки получается 16 процессоров. При этом 4 процессора пойдут в мусорное ведро, поэтому доля выхода годных чипов составляет 75%, а убытки за счет дефектных процессоров нам придется компенсировать повышением цены на оставшиеся 12 чипов. Как же сделать так, чтобы чипы стоили дешевле - чтобы наше производство было рентабельным?

Способ I
Улучшаем технологический процесс производства
Когда производитель процессоров запускает новый завод, он указывает два параметра: диаметр подложки и размер элемента. Как вы понимаете, чем больше диаметр подложки, тем больше мы сможем получать из нее процессоров . Однако здесь есть ограничивающий фактор: число дефектов около края подложки выше, чем в центре. Совершенствование технологии подложек направлено на увеличение "благоприятной зоны" в центре. Как только производитель этого достигает, он может переходить на подложки большего диаметра. Так, процессоры для первого IBM PC (1981 г.) производились из 50-мм подложек, в то время как на современных заводах используются 300-мм подложки (Intel) и 200-мм (AMD).
Под размером элемента понимают минимальный размер детали (транзистора), которую оборудование завода может вытравить на поверхности подложки. Так, под фразой "новые процессоры Prescott перешли на 0,09-мкм технологический процесс" следует понимать то, что размер минимального элемента завода по производству Prescott составляет 0,09 микрометра (миллионная часть метра). Процессоры первого IBM PC имели размер элемента 3 мкм, процессор Pentium - 0,8 мкм, а современные Pentium 4 - 0,09 мкм. Соответственно, чем меньше размер элемента, тем меньшую площадь будет занимать процессор и тем больше процессоров мы сможем получить из одной подложки .
Итак, поднять эффективность производства можно с помощью увеличения диаметра подложки или уменьшения размера элемента - но и тот, и другой способы являются накладными, поскольку предусматривают полную замену оборудования на заводе. Есть ли еще варианты?

Способ II
Уменьшаем размер чипов
Инженеры нашего завода создали микропроцессор, который будет состоять из 100 миллионов транзисторов. Так получилось, что на мощностях нашего завода из одной подложки можно вырезать 16 чипов по 120 миллионов транзисторов. То есть мы можем разместить весь процессор на одном чипе, который можно назвать "сложным", поскольку он будет содержать большое число транзисторов. Но при этом процент выхода годных кристаллов составляет 75%. Мы знаем, что можно достичь лучших результатов. Давайте разобьем наш процессор на 4 отдельных чипа, по 25 миллионов транзисторов каждый.
При этом из подложки можно вырезать 64 чипа, которые могут содержать до 30 миллионов транзисторов.
По-прежнему дефектными оказываются 4 чипа, но доля выхода годных чипов возросла с 75% до 94% - значимое улучшение.
Недостатком подобного дизайна будет вы

Переходим
на 4 чипа.
сокая стоимость упаковки чипов - ведь нам нужно будет упаковать в один цельный процессор четыре чипа. Фактически, увеличение стоимости упаковки съедает весь тот выигрыш в стоимости, который мы получили, увеличив долю выхода годных кристаллов с 75% до 94%.
Существует ли здесь "золотая середина"? Предположим, что наши инженеры ее нашли: если мы будем получать с одной пластины 36 чипов по 53 миллиона транзисторов. Тогда мы можем сделать наш процессор двухчиповым, по 50 миллионов транзисторов в каждом чипе. При этом уровень выхода годных кристаллов составит 89% - лучше, чем в случае с 16 чипами, но хуже, чем при получении 64 чипов. Кстати, процессоры Pentium II и Pentium III состояли не из одного чипа - у них был внешний кэш L2. Тогда процессор вместе с кэшем упаковывались в отдельный картридж.
Переходим
на 2 чипа.

Подведем итог: при данной плотности расположения дефектов на пластине оптимальное число транзисторов, при котором достигается минимальная себестоимость производства кристаллов, составляет 53 миллиона транзисторов на процессор. Это число и фигурирует в законе Мура. Как предсказывал Гордон Мур в своей статье, оптимальное число транзисторов будет
удваиваться каждые два года.
Оптимальное число транзисторов зависит от следующих факторов (в порядке уменьшения влияния):
1. размер элемента;
2. диаметр подложки;
3. среднее число дефектов на квадратный сантиметр;
4. затраты на упаковку чипов.
Закон Мура очень важен, поскольку он описывает многие события в мире процессоров. К тому же из закона Мура выводятся интересные следствия.
Следствия закона Мура
Для лучшего визуального представления разделим каждый процессор, в свою очередь, на блоки. За основу возьмем наш процессор в 100 миллионов транзисторов и разделим его на 36 блоков. При этом каждый участок будет состоять примерно из 3 миллионов транзисторов.
Увеличиваем функциональность
Продолжая пример, приведенный выше, мы построили второй завод, который имеет ту же плотность дефектов и размер подложки, однако мы смогли значительно снизить размер транзистора, увеличив плотность расположения транзисторов в 2 раза. Если взять пример оптимального разбиения подложки на 36 кристаллов, то тогда каждый кристалл сможет вмещать 106 миллионов транзисторов - то есть наш процессор со 100 миллионами транзисторов теперь легко поместится на один кристалл, и теперь мы будем изготавливать процессор из одного чипа, экономя на упаковке. Если обратиться к истории, то процессоры Intel Pentium III сначала изготавливались в многочиповом варианте, с внешним кэшем 512 Кбайт (ядро Katmai ), а затем появились одночиповые варианты Pentium III с кэшем 256 Кбайт на кристалле процессора (ядро Coppermine ).
Но не будем на этом останавливаться. Построим третий завод, у
которого размер элемента еще меньше. Поскольку наш процессор уже полностью входит на кристалл, можно расширить его возможности, увеличив функциональность. Так произошло при переходе от 386 процессора к 486 : тогда на кристалл был добавлен сопроцессор для работы с плавающ ей запятой, до этого существующий в виде отдельного чипа. Затем на кристалле процессора появился кэш сначала первого (486), а затем и второго и третьего уровней. С переходом ядра Willamette Pentium 4 на Northwood мы стали свидетелями увеличения на кристалле процессора кэша второго уровня. Опять же, недавно вышедший Prescott с 0,09-мкм технологическим процессом вновь получил увеличение кэша L2 до 1 Мб.
Добавление новых функций (сопроцессор, кэш и т.д.) непосредственно на кристалл процессора позволило ощутимо увеличить его производительность, не говоря о снижении затрат на упаковку. Так что закон Мура действительно можно связать с вычислительной мощностью.
Уменьшаем размер кристалла
При переходе на меньший размер элемента вместо добавления новых функций на кристалл процессора мы можем оставить все как есть и просто уменьшить площадь ядра.

Обратите внимание на два столбца слева. Первый показывает импульсы тактовой частоты (мегагерцы), второй - тепловыделение (ватты). Уменьшение площади кристалла дает очень хороший эффект: снижение тепловыделения (немало этому помогает и то, что переход на меньший размер элементов позволяет понизить напряжение питания). В результате процессор
будет меньше греться, кулер будет работать с меньшими оборотами вентилятора - то есть тише.
Тепловыделение также связано с тактовой частотой процессора. Как знают любители разгона, повышение тактовой частоты приводит к увеличению выделяемого тепла. Чтобы уменьшить размер кристалла чипа, не снижая тепловыделение, можно поднять тактовую частоту так, чтобы количество выделяемого тепла осталось прежним.

Подведем итог. Снижение размера элемента дает нам две возможности: одна -добавить новые функции на кристалл, а вторая - уменьшить размер кристалла, в то же время сохраняя прежний набор функций. Что интересно, вторая возможность распадается
еще на два варианта: увеличение тактовой частоты процессора - с повышением тепловыделения, сохранение тактовой частоты на прежнем уровне - со снижением тепловыделения.Практические выводы
Итак, мы представили работу завода по производству процессоров. Но как работают настоящие заводы? Выполняется ли в реальности закон Мура вместе со следствиями из него?

На самом деле размер кристалла процессора с 1970 года рос со скоростью примерно 7% в год (несмотря на уменьшение размера транзисторов). Связано это с тем, что при выборе между добавлением новых функций на чип или уменьшением его размера и тепловыделения разработчики процессоров чаще всего выбирали первое. На определенных линейках процессоров, типа Pentium III или G4 , к примеру, уменьшение размера элемента часто приводило к уменьшению тепловыделения. Но когда разработчики процессоров принимались за продукт следующего поколения (например, Pentium 4), они с самого начала думали не о ваттах, а о производительности. А
повышение производительности всегда означало нахождение способа использования возросшего числа транзисторов - а не их отсечение в угоду уменьшению площади.
С новым дизайном процессоров часто случается ситуация, когда инженеры пытаются добавить так много функций на чип, что размер ядра значительно возрастает, несмотря на уменьшение размера элемента. К примеру, при разработке Pentium 4 планировалось сразу же оснастить процессор очень большим кэшем. Но 0,18-мкм технология не позволила это сделать - чип получался слишком крупным и дорогим. Поэтому первый Pentium 4 вышел с кэшем L2 в 256 Кбайт.
Тактовые частоты процессоров за последние два десятилетия выросли на несколько порядков. Если раньше процессоры работали на частоте 5-10 МГц (8086 ), то к концу 2004 года частота вырастет в сотни раз - до 4 ГГц (Pentium 4). Рост тактовых частот, опять же, приводил к увеличению тепловыделения. Кстати, тактовые частоты тоже удваиваются в среднем за два года - аналогично числу транзисторов в законе Мура.

Практический итог таков - увеличивается площадь кристаллов, повышается тактовая частота. Поэтому повышается и тепловыделение. Если раньше процессоры работали вообще без кулеров, то сегодня кулер просто необходим - без него процессор сгорит (или, в лучшем случае, откажется работать).
Будущее закона Мура
Компания Intel заявляет о том, что закон Мура должен выполняться до 2010 года. Про дальнейшее его развитие говорить пока рано. Попытаемся спрогнозировать, к каким последствиям приведет дальнейшее выполнение закона Мура.
Первое последствие заключается в высоком тепловыделении. К сожалению, тепловыделение нельзя увеличивать бесконечно. В какой-то момент потребуется еще более сильное охлаждение (водяное или компрессорное). Эффективное охлаждение - настоящая "головная боль"
современной индустрии. А производители чипов пытаются найти различные подходы, направленные на снижение тепловыделения своих продуктов. Возможно, процессор будет разбит на несколько частей - либо все большую популярность будут приобретать двухпроцессорные системы.
Следствием закона Мура является непрерывное повышение производительности. Однако многие пользователи замечают, что для большинства задач хватило бы и Pentium III 1 ГГц. Поэтому Intel сегодня тратит немало усилий на популяризацию новых задач, которые могли бы в полной мере нагрузить новые мощные процессоры. Яркий пример таких задач - компьютерные игры. Возможно, в недалеком будущем мы столкнемся с ситуацией, когда игры станут "продавать" процессоры, а не только графические
ускорители.
Возможно, станут очень популярны распределенные вычисления. Вместо монструозного центрального процессора на 500 миллионов транзисторов будет лучше, к примеру, распределить эти транзисторы между настольным компьютером, ноутбуком, КПК и другими типами устройств. Более того, все эти 500 миллионов транзисторов должны быть максимально дешевыми и потреблять минимум энергии. Это близко к оригинальному видению Мура - дешевым и повсеместным вычислениям.
Третье следствие - проблемы, связанные со смешением различных типов цепей на одном кристалле. Мобильные компьютеры требуют, чтобы на один кристалл были интегрированы все функции, включая память, процессор и множество вариантов беспроводной связи. Некоторые производители решают проблему "в лоб", стараясь интегрировать их на кристалл любым способом, другие же пытаются найти новые технологии упаковки, которые позволят комбинировать множество чипов с множеством функций в одном модуле.

Эволюция процессоров и закон Мура
Процессор

Размещаемых на кристалле интегральной схемы, удваивается каждые 24 месяца. Часто цитируемый интервал в 18 месяцев связан с прогнозом Давида Хауса из Intel , по мнению которого производительность процессоров должна удваиваться каждые 18 месяцев из-за сочетания роста количества транзисторов и быстродействия каждого из них.

Рост числа транзисторов на кристалле микропроцессора показан на графике справа. Точки соответствуют наблюдаемым данным, а прямая - периоду удвоения в 24 месяца.

Энциклопедичный YouTube

    1 / 3

    ✪ НАУКА ЗА МИНУТУ_Спинтроника

    ✪ Парадокс Мура

    ✪ Артем Оганов: Новые материалы

    Субтитры

    НАУКА ЗА МИНУТУ [ЗВУК ТИКАЮЩИХ ЧАСОВ] В 1965 году один из основателей Intel Гордон Мур обнаружил удивительную закономерность: количество транзисторов в микросхемах возрастает примерно вдвое за год. Мы называем это правило, с несущественными модификациями, законом Мура. Закон Мура – страшная сила. Посмотрите на небо. Все звезды, которые вы видите, входят в нашу галактику. А теперь вообразите, что сейчас за одну секунду в мире производится 25 таких галактик, но из транзисторов! Этот закон Мура - главный драйвер Индустрии 4.0. Но такой рост не может быть вечным. Такие люди, как вице-президент NVIDIA Билл Дэлли или физик-теоретик Мичио Каку, говорят, что закон Мура либо уже мертв, либо умрет в ближайшие 5 лет. Дело в том, что нельзя уменьшать размеры транзисторов до бесконечности. Когда они станут меньше 5 нанометров, рабочая температура чипов станет слишком высокой, и электроны начнут улетать. Неужели рост скоро замедлится? Нет! На смену приходит новая технология, называемая спинтроника. В устройствах спинтроники, в отличие от устройств обычной электроники, энергию или информацию переносит не электрический ток, а ток спинов! Сейчас в мире идет бум – спинтроника вместо электроники. Новые технологии наступают! Индустрия 4.0! Готовьтесь! НАУКА ЗА МИНУТУ МЕДИАЦЕНТР БФУ ИМЕНИ И. КАНТА Субтитры КАРИНЫ МОКИНОЙ

История

По поводу эффектов, обусловленных законом Мура, в журнале «В мире науки » как-то было приведено такое интересное сравнение:

«Если бы авиапромышленность в последние 25 лет развивалась столь же стремительно, как промышленность средств вычислительной техники, то сейчас самолёт Boeing 767 стоил бы 500 долл. и совершал облёт земного шара за 20 минут, затрачивая при этом пять галлонов (~18,9 л) топлива. Приведенные цифры весьма точно отражают снижение стоимости, рост быстродействия и повышение экономичности ЭВМ».

В 2003 году Мур опубликовал работу «No Exponential is Forever: But „Forever“ Can Be Delayed!», в которой признал, что экспоненциальный рост физических величин в течение длительного времени невозможен, и постоянно достигаются те или иные пределы. Лишь эволюция транзисторов и технологий их изготовления позволяла продлить действие закона еще на несколько поколений .

В 2007 году Мур заявил, что закон, очевидно, скоро перестанет действовать из-за атомарной природы вещества и ограничения скорости света .

Одним из физических ограничений на миниатюризацию электронных схем является также принцип Ландауэра , согласно которому логические схемы, не являющиеся. На протяжении многих лет, производители процессоров постоянно увеличивали тактовую частоту и параллелизм на уровне инструкций, так что на новых процессорах старые однопоточные приложения исполнялись быстрее без каких-либо изменений в программном коде. Сейчас по разным причинам производители процессоров предпочитают многоядерные архитектуры, и для получения всей выгоды от возросшей производительности ЦП программы должны переписываться в соответствующей манере. Однако, по фундаментальным причинам, это возможно не всегда.

Количество транзисторов на одном кристалле достигает миллиардов штук. Естественный способ их использовать – строить многопроцессорные системы. Для таких компаний как Intel вопрос создания многопроцессорных систем – это вопрос существования.

Г. Мур (G. Moor – создатель Intel) на основе развития технологии в компа

нии Intel в 1965 году выдвинул следующее положение, которое сейчас называ-

ют законом Мура:

Каждые 2 года количество транзисторов на кристалле удваивается

Этот закон и с некоторыми колебаниями сохраняется длительное время.

Число транзисисторов на кристалле увеличится в такой степени, что это позво-

ляет создавать многоядерные процессоры (МЯП), в которых на одном кристал-

ле размещены сотни и тысячи ядер, каждое из которых является полноценным

процессором.

Считается, что нанотехнологии начинаютя со 100 нм. Таким образом, можно сказать, что современные микропроцессоры – это область нанотехнологий.

До минимального размера порядка 10 нм транзистор сохраняет свои пере-

ключательные и усилительные свойства, что полностью определяет путь разви-

тия кремниевой наноэлектроники вплоть до 2020 г. Ниже 10 нм кремний теря-

ет проводимость. В диапазоне размеров 5-0.5 нм наступает эра мезоскопических структур и приборов. Мезоскопические структуры - электронные при-

боры, размеры активной области которых сопоставимы с параметрами электро-

на. При размерах 0.5 нм и менее - эра квантовых кристаллов.

Графен – это одиночный плоский лист, состоящий из атомов углерода, образующих решётку из шестиугольных ячеек. Нанотрубки состоят из тех же шестиугольных ячеек, имеют средний диаметр около 1 нм и длину до нескольких сантиметров. Но отдельный транзистор – это не процессор. Поэтому квантовые компьютеры могут оказаться ближе по времени, чем мезоскопические структуры.

Вопросы для самоконтроля

    В чем суть параллелизм независимых ветвей?

    Сформулируйте закон Амдала.

    Закон Мура и его перспективы.

Лекция 4. Основные этапы развития параллельной обработки

Идея параллельной обработки возникла одновременно с появлением первых вычислительных машин. В начале 50-х гг. американский математик Дж. Фон Нейман предложил архитектуру последовательной ЭВМ, которая приобрела классические формы и применяется практически во всех современных ЭВМ. Однако фон Нейман разработал также принцип построения процессорной матрицы, в которой каждый процессор был соединен с четырьмя соседними.

D825. Одной из первых полномасштабных многопроцессорных систем явилась система D825 фирмы “BURROUGHS”. Начиная с 1962 г. было выпущено большое число экземпляров и модификаций D825. Выпуск первых многопроцессорных систем, в частности D825, диктовался необходимостью получения не высокого быстродействия, а высокой живучести ЭВМ, встраиваемых в военные командные системы и системы управления. С этой точки зрения параллельные ЭВМ считались наиболее перспективными. Система D825 содержала до четырех процессоров и 16 модулей памяти, соединенных матричным коммутатором, который допускал одновременное соединение любого процессора с любым блоком памяти.

Практическая реализация основных идей параллельной обработки началась только в 60-х гг. 20 - го столетия. Это связано с появлением транзистора, который позволил строить машины, состоящие из большого количества логических элементов, что принципиально необходимо для реализации любой формы параллелизма.

CRAY. Основополагающим моментом для развития конвейерных ЭВМ явилось обоснование академиком С.А. Лебедевым в 1956 г. метода, названного

“принципом водопровода” (позже он стал называться конвейером ). Прежде все-

го был реализован конвейер команд, на основании которого практически одно-

временно были построены советская ЭВМ БЭСМ-6 (1957-1966 гг., разработка

Института точной механики и вычислительной техники АН СССР), и англий-

ская машина ATLAS (1957-1963 гг.). Конвейер команд предполагал наличие

многоблочной памяти и секционированного процессора, в котором на разных

этапах обработки находилось несколько команд.

Следующим заметным шагом в развитии конвейерной обработки, реализо

ванном в ЭВМ CDC-6600 (1964 г.), было введение в состав процессора не-

скольких функциональных устройств, позволяющих одновременно выполнять

несколько арифметико-логических операций: сложение, умножение, логические операции.

В конце 60-х гг. был введен в использование арифметический конвейер , который нашел наиболее полное воплощение в ЭВМ CRAY-1 (1972-1976 гг.).

Арифметический конвейер предполагает разбиение цикла выполнения арифме-

тико-логической операции на ряд этапов, для каждого из которых отводится

собственное оборудование. Таким образом, на разных этапах обработки нахо-

дится несколько чисел, что позволяет производить эффективную обработку

вектора чисел.

Сочетание многофункциональности, арифметического конвейера для каж

дого функционального блока и малой длительности такта синхронизации по-

зволяет получить быстродействие в десятки и сотни миллионов операций в се-

кунду. Такие ЭВМ называются супер ЭВМ.

ILLIAC-IV. Идея получения сверхвысокого быстродействия в первую очередь связывалась с процессорными матрицами (ПМ). Предполагалось, что,

увеличивая в нужной степени число процессорных элементов в матрице, можно

получить любое заранее заданное быстродействие.

Поскольку в 60-е гг. логические схемы с большим уровнем интеграции от

сутствовали, то напрямую реализовать принципы функционирования процес-

сорной матрицы, содержащей множество элементарных процессоров, не пред-

ставлялось возможным. Поэтому для проверки основных идей строились одно-

родные системы из нескольких больших машин. Так, в 1966 г. была построена

система Минск-222, разработанная Институтом математики Сибирского отде-

ления АН СССР и минским заводом ЭВМ им. Г.К.Орджоникидзе. Система со-

держала до 16 соединенных в кольцо ЭВМ Минск-2. Для нее было разработано

специальное математическое обеспечение.

Другое направление в развитии однородных сред, основанное на построе-

нии процессорных матриц, состоящих из крупных процессорных элементов с

достаточно большой локальной памятью, возникло в США и связано с именами

Унгера, Холланда, Слотника. Была создана ЭВМ ILLIAC-IV (1966-1975 гг.), ко-

торая надолго определила пути развития процессорных матриц. В машине ис-

пользовались матрицы 8×8 процессоров, каждый с быстродействием около 4

млн оп/с и памятью 16 кбайт. Для ILLIAC-IV были разработаны кроме Ассемб-

лера еще несколько параллельных языков высокого уровня. Особенно ценным

является опыт разработки параллельных алгоритмов вычислений, определив-

ший области эффективного использования подобных машин.

T ранспьютер . Совершенствование микроэлектронной элементной базы,

появление в 80-х годах БИС и СБИС позволили разместить в одной микросхеме

процессор с 4-мя внешними связями, который получил название транспьютер .

Теперь стало возможным строить системы с сотнями процессоров.

пошло широким потоком. Сначала строились монолитные многопроцессорные

системы, для которых все разрабатывалось специально для конкретной систе-

мы: элементная база, конструктивы, языки программирования, операционные

системы. Затем оказалось много дешевле строить вычислительные кластеры на

основе промышленные средства, появились многояденые процессора, Грид,

квантовые компьютеры.

Некоторые этапы развития параллельных ЭВМ качественно можно представить следующей таблицей:

НАЗВАНИЕ ЭВМ

ПРОГРАММЫ

D825 - одна из первых многопроцессорных систем

Доказана возможность построения многопроцессорных систем

Первая ОС для многопроцессорных систем - ASOR

Матричный процессор ILLIAC IV

Реализована ОКМД

Параллельный язык

Векторно- конвейерная ЭВМ CRAY

Предложены конвейерные вычисления

Предложен ЯВУ векторного типа

Транспьютер Т414

Разработан процессор на кристалле со связями для мультисистем

Язык описания параллелизма OCCAM

Кластер Beowulf

Сборка на серийном оборудовании

Использованы обыч

ные сетевые ОС

Неограниченная возможность расширения

GlobusToolkit, gLite

Многоядерные про-

Разработаны МЯ процессоры с общей и индивидуальной памятью

OpenMP и MPI. Нужны новые разработки

Квантовый компью-

тер Orion компании

Кубит, эспоненциальная скорость за счет суперпозиции

Алгоритмы Шора,

Гровера. Языки моделирования

Вопросы для самоконтроля.

    Основные этапы развития параллельной обработки. D825

    Основные этапы развития параллельной обработки. CRAY.

    Основные этапы развития параллельной обработки. ILLIAC-IV.

    Некоторые этапы развития параллельных ЭВМ.

  • Перевод

Примечание. Дата публикации статьи: 26.12.2015. За прошедшее время некоторые тезисы автора подтвердились реальными фактами, а некоторые оказались ошибочными - прим. пер.

В последние 40 лет мы видели, как скорость компьютеров росла экспоненциально. У сегодняшних CPU тактовая частота в тысячу раз выше, чем у первых персональных компьютеров в начале 1980-х. Объём оперативной памяти на компьютере вырос в десять тысяч раз, а ёмкость жёсткого диска увеличилась более чем в сто тысяч раз. Мы так привыкли к этому непрерывному росту, что почти считаем его законом природы и называем законом Мура. Но есть пределы этому росту, на которые указал и сам Гордон Мур . Мы сейчас приближаемся к физическому пределу, где скорость вычислений ограничена размером атома и скоростью света.

Канонические часы Тик-так от Intel начали пропускать такты то здесь, то там. Каждый «тик» соответствует уменьшению размера транзисторов, а каждый «так» - улучшение микроархитектуры. Нынешнее поколение процессоров под названием Skylake - это «так» с 14-нанометровым технологическим процессом. Логически, следующим должен стать «тик» с 10-нанометровым техпроцессом, но Intel теперь выдаёт «циклы обновления» после каждого «так». Следующий процессор, анонсированный на 2016 год, станет обновлением Skylake, всё ещё на 14-нанометровом техпроцессе . Замедление часов Тик-так - это физическая необходимость, потому что мы приближаемся к лимиту, где размер транзистора составляет всего несколько атомов (размер атома кремния - 0,2 нанометра).

Другое физическое ограничение - это скорость передачи данных, которая не может превышать скорость света. Требуется несколько тактовых циклов, чтобы данные попали из одного конца CPU в другой конец. По мере того как микросхемы становятся крупнее с большим и большим количеством транзисторов, скорость начинает ограничиваться самой передачей данных на микросхеме.

Технологические ограничения - не единственная вещь, которая замедляет эволюцию процессоров. Другим фактором является ослабление рыночной конкуренции. Крупнейший конкурент Intel, компания AMD, сейчас больше внимания уделяет тому, что она называет APU (Accelerated Processing Units), то есть процессорам меньшего размера с интегрированной графикой для мини-ПК, планшетов и других ультра-мобильных устройств. Intel теперь завладела подавляющей долей рынка процессоров для высококлассных ПК и серверов. Свирепая конкуренция между Intel и AMD, которая несколько десятилетий толкала вперёд развитие процессоров x86, практически исчезла.

Рост компьютерной мощи в последние годы идёт не столько от увеличения скорости вычислений, сколько от усиления параллелизма. В современных микропроцессорах используется три типа параллелизма:

  1. Одновременное выполнение нескольких команд с изменением их очерёдности.
  2. Операции Single-Operation-Multiple-Data (SIMD) в векторных регистрах.
  3. Несколько ядер CPU на одной микросхеме.
У этих типов параллелизма нет теоретических лимитов, но есть реальные практические. Выполнение команд с изменением их очерёдности ограничено количеством независимых команд в программном коде. Вы не можете одновременно выполнить две команды, если вторая команда ждёт результат выполнения первой. Нынешние CPU обычно могут одновременно выполнять четыре команды. Увеличение этого количества не принесёт много пользы, потому что процессору будет сложно или невозможно найти в коде больше независимых команд, которые можно выполнить одновременно.

В нынешних процессорах с набором инструкций AVX2 есть 16 векторных регистров по 256 бит. Грядущий набор инструкций AVX-512 даст нам 32 регистра по 512 бит, и вполне можно ожидать в будущем расширения на 1024- или 2048-битные векторы. Но эти увеличения векторных регистров будут давать всё меньший эффект. Немногие вычислительные задачи имеют достаточный встроенный параллелизм, чтобы извлечь выгоду из этих векторов большего размера. 512-битные векторные регистры соединяются набором регистров маски, у которых ограничение на размер 64 бита. 2048-битные векторные регистры смогут хранить 64 числа одинарной точности по 32 бита каждое. Можно предположить, что Intel не планирует делать векторные регистры более чем 2048 бита, поскольку они превзойдут ограничения 64-битных регистров маски.

Многочисленные ядра CPU дают преимущество только если имеется множество критических к скорости одновременно работающих программ или если задача делится на многочисленные независимые потоки. Количество потоков, на которые можно с выгодой разделить задачу, всегда ограничено.

Производители без сомнения постараются делать всё более и более мощные компьютеры, но какова вероятность, что эту компьютерная мощь можно будет использовать на практике?

Существует четвёртая возможность параллелизма, которая пока не используется. В программах обычно полно веток if-else, так что если CPU научатся предсказывать, какая из веток сработает, то можно было бы поставить её на выполнение. Можно выполнять одновременно сразу несколько веток кода, чтобы избежать потери времени, если предсказание окажется неправильным. Конечно, за это придётся заплатить повышенным энергопотреблением.

Другое возможное улучшение - разместить программируемое логическое устройство на микросхеме процессора. Подобная комбинация сейчас является обычным делом для так называемых FPGA, которые используются в продвинутой аппаратуре. Такие программируемые логические устройства в персональных компьютерах можно использовать для реализации функций, специфических для конкретных приложений, для задач вроде обработки изображений, шифрования, сжатия данных и нейросетей.

Полупроводниковая индустрия экспериментирует с материалами, которые можно использовать вместо кремния. Некоторые полупроводниковые материалы III-V способны работать на более низком напряжении и на более высоких частотах, чем кремний , но они не делают атомы меньше или свет медленнее. Физические ограничения по-прежнему в силе.

Когда-нибудь мы можем увидеть трёхмерные многослойные чипы. Это позволит уплотнить схемы, уменьшить расстояния, а следовательно, и задержки. Но как эффективно охлаждать такой чип, когда энергия распространяется повсюду внутри него? Потребуются новые технологии охлаждения. Микросхема не сможет передавать питание на все схемы одновременно без перегрева. Ей придётся держать отключенными большинство своих частей основную часть времени и подавать питание в каждую часть только во время её использования.

В последние годы скорость CPU увеличивается быстрее, чем скорость RAM, которая часто становится серьёзным узким местом. Без сомнения, в будущем мы увидим много попыток увеличить скорость оперативной памяти. Вероятной разработкой будет поместить оперативную память на одну микросхему с CPU (или хотя бы в один корпус), чтобы уменьшить расстояние для передачи данных. Это будет полезное использование трёхмерных чипов. Вероятно, RAM будет статического типа, то есть на каждую ячейку памяти будет подаваться питание только когда к ней осуществляется доступ.

Intel также снабжает рынок суперкомпьютеров для научного использования. У процессора Knight"s Corner - до 61 ядра на одной микросхеме. Он имеет слабое соотношение производительность/цена, но его ожидаемый наследник Knight"s Landing должен быть лучше по этому показателю. Он вместит до 72 ядер на чипе и сможет выполнять команды с изменением их очерёдности. Это маленький нишевый рынок, но Intel может повысить свой авторитет.

Сейчас лучшие возможности по улучшению производительности, как я думаю, с программной стороны. Разработчики ПО быстро нашли применение экспоненциальному росту производительности современных компьютеров, который произошёл благодаря закону Мура. Программная индустрия стала использовать её, а также начала использовать более и более продвинутые инструменты разработки и программные фреймворки. Эти высокоуровневые инструменты разработки и фреймворки сделали возможным ускорить разработку ПО, но за счёт потребления большего количества вычислительных ресурсов конечным продуктом. Многие из сегодняшних программ довольно расточительны в своём чрезмерном потреблении аппаратной вычислительной мощности.

На протяжении многих лет мы наблюдали симбиоз между аппаратной и программной индустриями, где последняя производила всё более продвинутые и ресурсоёмкие продукты, которые подталкивали пользователей покупать всё более мощное оборудование. Поскольку скорость роста аппаратных технологий замедлилась, а пользователи перешли на маленькие портативные устройства, где ёмкость батареи важнее, чем производительность, программной индустрии теперь придётся изменить курс. Ей придётся урезать ресурсоёмкие инструменты разработки и многоуровневый софт и разрабатывать программы, не так набитые функциями. Сроки разработки увеличатся, но программы станут потреблять меньше аппаратных ресурсов и быстрее работать на маленьких портативных устройствах с ограниченным ресурсом батареи. Если индустрия коммерческого ПО сейчас не изменит курс, то может уступить долю рынка более аскетичным продуктам open source.



Понравилась статья? Поделитесь ей
Наверх