Соколов И.А., Степченков Ю.А., Рождественский Ю.В., Дьяченко Ю.Г. Самосинхронное устройство умножения-сложения гигафлопсного класса: методологические аспекты // Проблемы разработки перспективных микро- и наноэлектронных систем — 2014. Сборник трудов / под общ. ред. академика РАН А.Л. Стемпковского. М.: ИППМ РАН, 2014. Часть IV. С. 51-56.
Sokolov I.A., Stepchenkov Yu.A., Rozhdestvenskij Yu.V., Diachenko Yu.G. Speed-Independent Fused Multiply-Add Unit of Gigaflops Rating: Methodological Aspects // Problems of Advanced Micro- and Nanoelectronic Systems Development, 2015, Part IV, Moscow, IPPM RAS, P. 13-14.
Sokolov I.A., Stepchenkov Yu.A., Rozhdestvenskij Yu.V., Diachenko Yu.G. Speed-Independent Fused Multiply-Add Unit of Gigaflops Rating: Methodological Aspects // Problems of Perspective Micro- and Nanoelectronic Systems Development — 2014. Proceedings / edited by A. Stempkovsky, Moscow, IPPM RAS, 2014. Part IV. P. 51-56.
Аннотация: Представлены подходы к проектированию самосинхронной (СС) аппаратуры и рассмотрены условия внутрисистемной интеграции синхронных и СС-устройств в рамках супер-ЭВМ на примере разработки СС-устройства умножения-сложения гигафлопсного класса, соответствующего стандарту IEEE 754 и выполняющего либо одну операцию двойной точности, либо одновременно две операции одинарной точности над входными операндами. Устройство реализовано по КМОП-технологии с проектными нормами 65 нм. В зависимости от исполнения, оно работает с асинхронным или синхронным окружением и обеспечивает производительность на уровне не менее 1 гигафлопс при времени задержки формирования результата относительно поступления входных операндов не более 6 нС.
Abstract: This report contains the approaches to designing self-timed (ST) hardware and discusses the requirements for in-system integration of the synchronous and ST units in a framework of supercomputer by an example of development of Speed-Independed Fused Multiply-Add (SIFMA) unit of gigaflops rating conforming to IEEE 754 Standard. SIFMA performs either one double precision operation, or two simultaneous single precision operations with input operands. SIFMA was designed under industrial CMOS 65-nm technology. Depending on implementation, it operates with synchronous or asynchronous environment and provides performance no less than 1 Gigaflops at latency up to 6 ns.