Інформаційна технологія прогнозування курсу криптовалют на основі комплексної інженерії ознак
Автор
Мокін, В. Б.
Жуков, С. О.
Куперштейн, Л. М.
Слободянюк, О. В.
Mokin, V. B.
Zhukov, S. O.
Kupershtein, L. M.
Slobodianiuk, O. V.
Дата
2022Metadata
Показати повну інформаціюCollections
Анотації
Розроблено інформаційну технологію прогнозування курсу криптовалют на основі комплексної інженерії ознак. Особливість цієї технології полягає в системному підході до відбору ознак. Проведено аналіз груп зовнішніх та внутрішніх факторів потенційного впливу на криптовалютний ринок. Аналіз ознак, які характеризують зміни курсу криптовалют, показав, що окрім базових первинних ознак, які доступні на багатьох криптобіржах, важливішими для подальшого прогнозування курсу криптовалют є вторинні ознаки, які отримують з базових первинних шляхом застосування до них різних математичних операцій та/або алгоритмічних трансформацій. Аналіз великої кількості джерел показав, що криптовалюти мають низку характерних особливостей, які й зумовили їх велику популярність і які теж варто враховувати під час формування та вибору ознак. В роботі проведена систематизація ключових таких особливостей, а також запропоновано яким чином їх формалізувати у вигляді ознак. Формалізувати ознаки запропоновано за системним підходом, згідно з постулатами технічної кібернетики, де говориться, що будь-який об`єкт дослідження можна представити у вигляді чорного ящика (ЧЯ), який контактує з зовнішнім середовищем у п`яти точках, що можуть у багатовимірному випадку бути множинами ознак чи змінних. Запропоновано загальну математичну модель формування цих факторів, яке полягає у генеруванні великої кількості вторинних ознак на основі простих математичних, алгоритмічних та статистичних трансформацій з подальшим відбором найрелевантніших з них. Технологія передбачає синтез нових вторинних ознак на основі інших вторинних ознак, за окремими винятками, які формалізовано у вигляді системи правил. Це дозволить зменшити перенавчання моделі та покращити її узагальнюючу здатність.
Для доведення працездатності розробленої технології розглянуто приклад її застосування на базі криптовалюти біткоїн за щодобовими даними 2020―2021 років. Проведені дослідження та комп`ютерні експерименти показали ефективність та працездатність запропонованої технології. This article is devoted to the development of information technology for predicting the rate of cryptocurrencies based on complex feature engineering. The peculiarity of this technology lies in a systematic approach to the ion of features. An analysis of groups of external and internal factors of the potential impact on the cryptocurrency market was carried out. An analysis of the features that characterize changes in the cryptocurrency rate showed that apart the basic features available on many cryptocurrency exchanges. The most important for further prediction of cryptocurrency rates are secondary features which are derived the basic ones by applying different mathematical operations and/or algorithmic transformations to them. The analysis of a large number of sources showed that cryptocurrencies have a number of characteristics, which caused their great popularity and also should be taken into account during the formation and ion of features. The work systematizes the key to such characteristics and suggests how to formalize them as features. It is suggested to formalize the features by a systematic approach, according to the postulates of technical cybernetics, which says that any research object can be represented in the form of a black box (BB), which is in contact with the external environment at nine points, which in a rich case can be a multiplicity of features or variables. A general mathematical model of the formation of these factors is proposed, which consists in generating a large number of secondary features on the basis of simple mathematical, algorithmic and statistical transformations with a further ion of the most relevant of them. The technology involves the synthesis of new secondary features on the basis of other secondary features, with some exceptions, which are formalized in the form of a system of rules. This will reduce the overlearning of the model and improve its overall ability.
In order to explain the validity of the developed technology, the application of its use on the Bitcoin exchange rate data for 2020-2021 was examined. The conducted research and computer experiments showed the efficiency and usefulness of the proposed technology.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/35754