| dc.contributor.author | Дудник, О. В. | uk |
| dc.contributor.author | Циркун, В. В. | uk |
| dc.contributor.author | Шалаган, В. С. | uk |
| dc.contributor.author | Dudnyk, O. V. | en |
| dc.contributor.author | Tsyrkun, V. V. | en |
| dc.date.accessioned | 2025-08-19T07:53:59Z | |
| dc.date.available | 2025-08-19T07:53:59Z | |
| dc.date.issued | 2025 | |
| dc.identifier.citation | Дудник О. В., Циркун В. В., Шалаган В. С. Etl pipeline на Python для аналізу даних агрегаторів у сфері авіаперевезень // Матеріали LIV Всеукраїнської науково-технічної конференції підрозділів ВНТУ, Вінниця, 24-27 березня 2025 р. Електрон. текст. дані. 2025. URI: https://conferences.vntu.edu.ua/index.php/all-fitki/all-fitki-2025/paper/view/23156. | uk |
| dc.identifier.isbn | 978-617-8132-48-8 | |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/48665 | |
| dc.description.abstract | У сучасній авіаційній галузі, що стрімко розвивається, ефективне управління та аналіз даних є ключовими факторами успішної діяльності компаній–агрегаторів авіаперевезень. Ця стаття зосереджується на створенні та впровадженні ETL–пайплайну (Extract, Transform, Load) з використанням мови програмування Python для збору, обробки та інтеграції даних про авіарейси. Розглянуто методологію побудови ETL–процесів, включаючи витягування даних з SFTP–серверів, фільтрація, нарізання записів та знаходження помилок за допомогою бібліотеки Pandas, і подальше завантаження в базу даних для аналітики. Особлива увага приділена використанню Apache Airflow як інструменту для автоматизації робочих процесів, що забезпечує гнучке керування завданнями та масштабованість системи. У статті аналізуються переваги впровадження таких рішень для підвищення точності та актуальності даних, що дозволяє агрегаторам надавати клієнтам найкращі пропозиції в режимі реального часу. Описані практичні аспекти впровадження ETL–пайплайнів та їх вплив на підвищення ефективності бізнес–процесів у сфері авіаперевезень. | uk |
| dc.description.abstract | In the fast-growing aviation industry, effective data management and analysis are key factors for the success of airline
aggregator companies. This article focuses on creating and using an ETL pipeline (Extract, Transform, Load) with the
Python programming language to collect, process, and integrate flight data. The article explains the method of building
ETL processes, including extracting data from SFTP servers, filtering, splitting records, and finding errors using the
Pandas library. After that, the data is loaded into a database for analysis. Special attention is given to Apache Airflow, a
tool for automating workflows, which helps manage tasks flexibly and scale the system when needed. The article also
looks at the advantages of using such solutions to improve the accuracy and freshness of data. This allows aggregators
to offer the best options to clients in real time. The practical steps of setting up ETL pipelines and how they help make
business processes more efficient in the aviation industry are described. | en |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Матеріали LIV Всеукраїнської науково-технічної конференції підрозділів ВНТУ, Вінниця, 24-27 березня 2025 р. | uk |
| dc.relation.uri | https://conferences.vntu.edu.ua/index.php/all-fitki/all-fitki-2025/paper/view/23156 | |
| dc.subject | авіаперевезення | uk |
| dc.subject | аналіз даних | uk |
| dc.subject | ETL | en |
| dc.subject | Python | en |
| dc.subject | air transportation | en |
| dc.subject | data analysis | en |
| dc.subject | Apache Airflow | en |
| dc.title | Etl pipeline на Python для аналізу даних агрегаторів у сфері авіаперевезень | uk |
| dc.type | Thesis | |
| dc.identifier.udc | 004.6 | |
| dc.relation.references | Flight Data Analysis Through Web Scraping. URL: https://www-promptcloud-com.translate.goog/blog/flight-data-analysis-through-web-scraping/?_x_tr_sl=en&_x_tr_tl=uk&_x_tr_hl=uk&_x_tr_pto=sc (дата звернення: 07.02.2025). | en |
| dc.relation.references | ETL Process in Data Warehouse. URL: https://www-geeksforgeeks-org.translate.goog/etl-process-in-data-warehouse/?_x_tr_sl=en&_x_tr_tl=uk&_x_tr_hl=uk&_x_tr_pto=sc (дата звернення: 07.02.2025). | en |
| dc.relation.references | Apache Airflow Documentation. URL: https://airflow-apache-org.translate.goog/docs/apache-airflow/stable/core-concepts/overview.html?_x_tr_sl=en&_x_tr_tl=uk&_x_tr_hl=uk&_x_tr_pto=sc (дата звернення: 07.02.2025). | en |