Recurrent mechanism developments in the data-flow computer architecture

Yu. Shikunov, Yu. Stepchenkov, D. Khilko. Recurrent mechanism developments in the data-flow computer architecture //2018 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus) Moscow, Russia, 29 Jan.-1 Feb., 2018. —IEEE, P. 1413 – 1418. (indexed in Scopus).
DOI: 10.1109/EIConRus.2018.8317362

Abstract: This paper covers non-conventional recurrent data-flow architecture, its features, and implementation aspects. Recurrence — the main feature of the new architecture efficiently solves data redundancy problem, typical for data-flow architectures while increasing performance. Conventional recurrence implementation has an overhead of configuration operand insertion that provides required functional fields (tags). Functional capabilities expansion of the architecture mechanism implementing this feature resulted in further efficiency by eliminating said overhead in some instances. We cover enhancements implemented in multicore recurrent data-flow architecture, designed to increase the versatility of recurrent computational process utilization. We compare Viterbi algorithm implementations with and without enhancements.

Дополнительную информацию о содержании доклада вы можете получить на сайте конференции или связавшись с авторами доклада / You can get additional information on the content of the article on the conference website or by contacting the authors of the article.

Recurrent data-flow architecture: technical aspects of implementation and modeling results

D.V. Khilko, Yu. A. Stepchenkov, D. I. Shikunov, Yu. I. Shikunov. Recurrent data-flow architecture: technical aspects of implementation and modeling results // Problems of Advanced Micro- and Nanoelectronic Systems Development, 2017, Part II, Moscow, IPPM RAS, P. 59-64.

Abstract: The paper covers methods and features of implementing a prototype architecture based on a new recurrent data-flow paradigm of computing designed to solve problems of digital signal processing. Demonstration of key principles and technical solutions implemented in the new architecture is presented, with the example of the Fast Fourier Transform task, as well as estimation of the speed of this task with respect to its solutions on processors of traditional single-core and specialized data-flow multi-core architectures. Comparative estimates of the effectiveness of the implementation of algorithms for isolated words recognition in the environment of the recurrent architecture with respect to von Neumann single-core one are shown.

Recurrent data-flow architecture: features and realization problems

Yu. A. Stepchenkov, Yu. G. Diachenko, D. V. Khilko, V.S. Petrukhin. Recurrent data-flow architecture: features and realization problems // Problems of Advanced Micro- and Nanoelectronic Systems Development, 2017, Part II, Moscow, IPPM RAS, P. 52-58.

Abstract: Results of development of the multi-core recurrent data-flow architecture (MRDA) focused on effective implementation of digital signal processing (DSP) algorithms are presented. Principal differences between MRDA and existing computer architectures are shown. Such differences make it possible to process the instructions in almost half the normal time using singular self-sufficient recurrently represented
data-flow. Additional mechanisms that enhance the performance of computations for a number of DSP algorithms have been listed. Some of the proposed mechanisms can also be used in DSP systems of traditional architecture.

Data redundancy problems in data-flow computing and solutions implemented on the recurrent architecture

Yury Shikunov, Yury Stepchenkov, Dmitry Khilko, Dmitry Shikunov. Data redundancy problems in data-flow computing and solutions implemented on the recurrent architecture // 2017 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus) St. Petersburg, Russia, 1-3 Feb., 2017. — IEEE, P. 335 — 338. (indexed in Scopus).
DOI: 10.1109/EIConRus.2017.7910559

Abstract: This paper covers one of the main disadvantages of data-flow computational model — high overhead costs associated with storing and processing large volumes of tag data. Overcoming this disadvantage using various ways of data compression comes with a number of problems described in this article. To solve given problems new recurrent data-flow computational model was created as well as architecture based on that model. This paper describes key features and mechanics of the new model and architecture allowing us to reduce data redundancy in memory storage. Efficiency of developed mechanics is shown in implementation of fast Fourier transform algorithm.

Дополнительную информацию о содержании доклада вы можете получить на сайте конференции или связавшись с авторами доклада / You can get additional information on the content of the article on the conference website or by contacting the authors of the article.

Testing of Software and hardware testing of data-flow recurrent digital signal processor

Yuri Stepchenkov, Dmitry Khilko, Yuri Diachenko, Yury Shikunov and Dmitry Shikunov. Testing of Software and hardware testing of dataflow recurrent digital signal processor // Proceedings of IEEE East-West Design & Test Symposium (EWDTS’2016), Yerevan, October, 14 — 17, 2016. P. 168-171. (is indexed in Scopus).
DOI: 10.1109/EWDTS.2016.7807672

Abstract: The results of development of multi-core recurrent dataflow architecture (MRDA) focused on effective implementation of parallel digital signal processing (DSP) algorithms are being presented. All stages of MRDA development are integrated into a single iterative design cycle including mathematical modeling tools (imitational model); hardware modeling tools (VHDL-model); FPGA prototype and tools for developing the software meant to run on MRDA. Comparative assessments of effectiveness of DSP algorithms implemented on MRDA in relation to tradition DSP-processor are being presented.

Аннотация: Представлены результаты разработки многопроцессорной рекуррентной потоковой архитектуры (МПРА), ориентированной для эффективного исполнения параллельных алгоритмов в области цифровой обработки сигналов (ЦОС). Все основные этапы разработки МПРА интегрированы в единый итерационный цикл проектирования, включающий в себя средства математического моделирования архитектуры (имитационная модель); средства аппаратного моделирования (VHDL-модель); опытный образец на ПЛИС и средства разработки ПО, предназначенного для функционирования в среде МПРА. Приводятся сравнительные оценки эффективности реализации алгоритмов ЦОС в среде МПРА по отношению к традиционным DSP-процессорам.

Дополнительную информацию о содержании доклада вы можете получить на сайте конференции или связавшись с авторами доклада / You can get additional information on the content of the article on the conference website or by contacting the authors of the article.

Рекуррентная потоковая архитектура: особенности и проблемы реализации

Степченков Ю.А., Дьяченко Ю.Г., Хилько Д.В., Петрухин В.С. Рекуррентная потоковая архитектура: особенности и проблемы реализации // Проблемы разработки перспективных микро- и наноэлектронных систем — 2016. Сборник трудов / под общ. ред. академика РАН А.Л. Стемпковского. М.: ИППМ РАН, 2016. Часть 2. С. 120-127.

Аннотация: Представлены результаты разработки многопроцессорной рекуррентной потоковой архитектуры (МПРА), ориентированной для эффективного исполнения параллельных алгоритмов в области цифровой обработки сигналов (ЦОС). Показаны принципиальные отличия МПРА от существующих традиционных и нетрадиционных компьютерных архитектур, которые позволяют вдвое уменьшить время обработки инструкций за счет использования единого самодостаточного потока обрабатываемых данных и рекуррентного способа его представления. Приведен перечень дополнительных механизмов, которые позволили повысить производительность вычислений для целого ряда алгоритмов ЦОС. Некоторые из предложенных механизмов, могут быть также использованы и в системах ЦОС традиционной архитектуры.

Рекуррентная потоковая архитектура: технические аспекты реализации и результаты моделирования

Д.В. Хилько, Ю.А. Степченков, Д.И. Шикунов, Ю.И. Шикунов. Рекуррентная потоковая архитектура: технические аспекты реализации и результаты моделирования // Проблемы разработки перспективных микро- и наноэлектронных систем – 2016. Сборник трудов / под общ. ред. академика РАН А.Л. Стемпковского. М.: ИППМ РАН, 2016. Часть II. С. 128-135.

Аннотация: В настоящей статье рассматриваются методы и особенности реализации прототипа архитектуры, основанной на новой рекуррентно-потоковой парадигме вычислений и предназначенной для решения задач цифровой обработки сигналов. Приводится демонстрация ключевых принципов и технических решений, реализованных в новой архитектуре, на примере задачи быстрого преобразования Фурье, а также оценка быстродействия этой задачи относительно ее решения на процессорах традиционной одноядерной и специализированной потоковой многоядерной архитектур. Также приводятся сравнительные оценки эффективности реализации алгоритмов распознавания изолированных слов в среде рекуррентной архитектуры по отношению к одноядерной.

Hardware and Software Modelling and Testing of Non-Conventional Data-Flow Architecture

Yuri Shikunov, Dmitry Khilko, Yuri Stepchenkov. Hardware and Software Modelling and Testing of Non-Conventional Data-Flow Architecture // 2016 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus) St. Petersburg, Russia, February 02-03, 2016. — IEEE, P 360-364. (indexed in Scopus).

DOI: 10.1109/EIConRusNW.2016.7448187

Abstract: This paper covers new recurrent data-flow computational model, as well as architecture that implements principles and ideas of this model. Basic differences of this model from the existing ones and examine key aspects of this new computational model including its implementation in the form of Hybrid Recurrent Architecture of Digital Signal Processor are described. The approach and methodology of hardware and software modelling and testing based on new architecture are being proposed. We introduce the model of implementation of the proposed architecture as well as imitation modelling tools of recurrent data-flow architecture, implementing said model. Functionality of imitation model and its role in software development suite for new architecture software development is being described. We introduce the notion of the target modelling platform called GAROS IDE. The results of platform testing on several subtasks of isolated words recognition problem are presented.

Дополнительную информацию о содержании доклада вы можете получить на сайте конференции или связавшись с авторами доклада / You can get additional information on the content of the article on the conference website or by contacting the authors of the article.

Особенности программной реализации имитационной модели потоковой рекуррентной архитектуры

Хилько Д.В., Шикунов Ю.И., Степченков Ю.А.  Особенности программной реализации имитационной модели потоковой рекуррентной архитектуры // Труды Второй молодежной научной конференции «Задачи современной информатики» – М.: ФИЦ ИУ РАН, 2015. – С. 220-227.

Аннотация: Статья посвящена программной реализации имитационной модели, входящей в состав аппаратно-программных средств моделирования и отладки вычислительного устройства, построенного на основе многоядерной потоковой рекуррентной архитектуры. Приводится описание архитектуры имитационной модели, особенностей программной реализации ключевых компонентов. Рассматривается механизм организации взаимодействия между блоками и компонентами модели, функционирующими параллельно. Также рассматриваются технические возможности текущей версии программой реализации, перспективы их развития. Демонстрируются некоторые этапы функционирования модели на примере вычисления тестового алгоритма.

Средства системной отладки рекуррентного вычислителя

Степченков Д.Ю., Петрухин В.С., Морозов Н.В. Средства системной отладки рекуррентного вычислителя // Проблемы разработки перспективных микро- и наноэлектронных систем — 2014. Сборник трудов / под общ. ред. академика РАН А.Л. Стемпковского. М.: ИППМ РАН, 2014. Часть 2. С. 39-44.

Stepchenkov D.Yu., Petrukhin V.S., Morozov N.V. System Debugging Tools for Recurrent Computing Device // Problems of Perspective Micro- and Nanoelectronic Systems Development — 2014. Proceedings / edited by A. Stempkovsky, Moscow, IPPM RAS, 2014.  Expanded abstracts of reports / edited by A. Stempkovsky, Moscow, IPPM RAS, 2015. Part II. P. 13-13.

Stepchenkov D.Yu., Petrukhin V.S., Morozov N.V. System Debugging Tools for Recurrent Computing Device // Problems of Perspective Micro- and Nanoelectronic Systems Development — 2014. Proceedings / edited by A. Stempkovsky, Moscow, IPPM RAS, 2014. Part 2. P. 39-44.

Аннотация: Проведен анализ средств отладки САПР Quartus II, в соответствии с выбранными критериями определен состав средств системной отладки рекуррентного вычислителя. Предложена оптимальная структура аппаратных средств отладки рекуррентного вычислителя.

Abstract: Debugging Tools of CAD Quartus are analyzed. Tools composition for system debugging of a recurrent computing unit was determined in accordance with the selected criteria. An optimal structure of hardware for debugging recurrent computing device is proposed.