| dc.contributor.advisor | Ліщинська Л. Б. | uk |
| dc.contributor.author | Бондар, В. О. | uk |
| dc.contributor.author | Ліщинська, Л. Б. | uk |
| dc.date.accessioned | 2025-08-13T09:32:20Z | |
| dc.date.available | 2025-08-13T09:32:20Z | |
| dc.date.issued | 2025 | |
| dc.identifier.citation | Бондар В. О. Методи збору та аналізу інформації з веб-джерел // Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25673. | uk |
| dc.identifier.isbn | 978-617-8163-57-0 | |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/47848 | |
| dc.description.abstract | У цих тезах розглянуто сучасні методи збору та аналізу інформації з веб-джерел. Проведено
аналіз основних підходів до веб-скрапінгу, роботи з API та агрегування даних з різноманітних Інтернет-ресурсів.
Розглянуто переваги і недоліки використання різних технологій, зокрема Python-бібліотек (BeautifulSoup,
Scrapy), сервісів новинних API та інструментів для попередньої обробки та класифікації даних. Окреслено
основні виклики, такі як обмеження доступу до даних, часті зміни структури веб-ресурсів, необхідність обробки
великого обсягу інформації та виявлення фейкових новин. Вказано на перспективи розвитку систем
автоматизованого збору та аналізу новин для підвищення достовірності та релевантності отриманої
інформації. | uk |
| dc.description.abstract | These theses consider modern methods of collecting and analyzing information from web sources. The
analysis of the main approaches to web scraping, working with APIs, and aggregating data from various Internet
resources is carried out. The advantages and disadvantages of using different technologies are discussed, including
Python libraries (BeautifulSoup, Scrapy), news API services, and tools for preprocessing and classification of data. The
main challenges are outlined, such as data access limitations, frequent changes in web resource structures, the need to
process large volumes of information, and the detection of fake news. The prospects for the development of automated
news collection and analysis systems to improve the reliability and relevance of the obtained information are indicated. | en |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р. | uk |
| dc.relation.uri | https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25673 | |
| dc.subject | збір даних | uk |
| dc.subject | аналіз інформації | uk |
| dc.subject | веб-скрапінг | uk |
| dc.subject | API | en |
| dc.subject | новинні агрегатори | uk |
| dc.subject | машинне навчання | uk |
| dc.subject | обробка текстів | uk |
| dc.subject | фільтрація новин | uk |
| dc.subject | data collection | en |
| dc.subject | information analysis | en |
| dc.subject | web scraping | en |
| dc.subject | news aggregators | en |
| dc.subject | machine learning | en |
| dc.subject | text processing | en |
| dc.subject | news filtering | en |
| dc.title | Методи збору та аналізу інформації з веб-джерел | uk |
| dc.type | Thesis | |
| dc.identifier.udc | 004.056.5 | |
| dc.relation.references | Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web. 2nd ed. OReilly Media, 2018. 290 p. | en |
| dc.relation.references | Janert P.K. Data Analysis with Open Source Tools. OReilly Media, 2010. 530 p. | en |
| dc.relation.references | NewsAPI Documentation. : https://newsapi.org/docs. | en |
| dc.relation.references | Russell M. Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Instagram, GitHub, and More. 3rd ed. OReilly Media, 2019. 423 p. | en |
| dc.relation.references | Bird S., Klein E., Loper E. Natural Language Processing with Python. OReilly Media, 2009 504 p. | en |