Python для обробки даних і моделювання фінансово-економічних показників
Author
Чупілко, Т. А.
Ульяновська, Ю. В.
Мормуль, М. Ф.
Лагода, А. Е.
Chupilko, T. A.
Ulianovska, Yu. V.
Mormul, M. F.
Lagoda, A. E.
Date
2021Metadata
Show full item recordCollections
Abstract
У статті розглянуто аспекти ефективної обробки даних. Значна увага приділяється проблемам, що виникають при моде-люванні і прогнозуванні даних та роль досліджень для прийняття рішень. Визначаються етапи роботи з даними та особливості, що є притаманними кожному етапу. Особливе місце у роботі займає опис можливостей програмної обробки даних з використанням мови Python, яка набуває все більшої популярності завдяки простоті, гнучкості, відкритому коду, зручності роботи з даними у різ-них форматах, а також багатьом розробленим пакетам, які сприяють швидкій та ефективній обробці інформації. Розглядаються NumPy, Pandas, які надають структури даних і функції, що дозволяють зробити роботу зі структурованими даними простою і швидкою, найпопулярніший інструмент для візуалізації даних Matplotlib, пакети для різних обчислювальних задач SciPy, Statsmodels, а також пакет, орієнтований на машинне навчання Scikit-learn. Наводиться приклад використання Python для задач митної сфери. Авторами створено програму для розрахунку, в якій використовуються вище зазначені пакети. Будуються регресійні моделі для аналізу поповнення державного бюджету України надхоженнями від митних органів за рахунок ввізного та вивізного мита. Проводиться аналіз моделей на основі економетричних методів моделювання та розраховуються прогнозні оцінки надхо-джень. The article considers aspects of efficient data processing. Much attention is paid to the problems that arise in modeling and fore-casting data and the role of research in decision-making. The stages of work with data and features that are inherent in each stage are deter-mined. A special place in the work is described by the possibilities of software data processing using Python, which is becoming increasingly popular due to simplicity, flexibility, open source, ease of working with data in various formats, as well as many developed packages that facilitate fast and efficient information processing. NumPy, Pandas, which provide data structures and functions that make working with structured data simple and fast, the most popular tool for data visualization Matplotlib, packages for various computational tasks SciPy, Statsmodels, as well as a package focused on machine learning Scikit-learn. An example of using Python for customs tasks is given. The authors have created a program for calculation, which uses the above packages. Regression models are being built to analyze the replenish-ment of the state budget of Ukraine with revenues from customs authorities at the expense of import and export duties. The analysis of mod-els on the basis of econometric methods of modeling is carried out and forecast estimates of receipts are calculated.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/36486