Методи збору та аналізу інформації з веб-джерел

Бондар, В. О.

dc.contributor.advisor	Ліщинська Л. Б.	uk
dc.contributor.author	Бондар, В. О.	uk
dc.date.accessioned	2025-08-13T09:32:20Z
dc.date.available	2025-08-13T09:32:20Z
dc.date.issued	2025
dc.identifier.citation	Бондар В. О. Методи збору та аналізу інформації з веб-джерел // Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р. Електрон. текст. дані. 2025. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25673.	uk
dc.identifier.isbn	978-617-8163-57-0
dc.identifier.uri	https://ir.lib.vntu.edu.ua//handle/123456789/47848
dc.description.abstract	У цих тезах розглянуто сучасні методи збору та аналізу інформації з веб-джерел. Проведено аналіз основних підходів до веб-скрапінгу, роботи з API та агрегування даних з різноманітних Інтернет-ресурсів. Розглянуто переваги і недоліки використання різних технологій, зокрема Python-бібліотек (BeautifulSoup, Scrapy), сервісів новинних API та інструментів для попередньої обробки та класифікації даних. Окреслено основні виклики, такі як обмеження доступу до даних, часті зміни структури веб-ресурсів, необхідність обробки великого обсягу інформації та виявлення фейкових новин. Вказано на перспективи розвитку систем автоматизованого збору та аналізу новин для підвищення достовірності та релевантності отриманої інформації.	uk
dc.description.abstract	These theses consider modern methods of collecting and analyzing information from web sources. The analysis of the main approaches to web scraping, working with APIs, and aggregating data from various Internet resources is carried out. The advantages and disadvantages of using different technologies are discussed, including Python libraries (BeautifulSoup, Scrapy), news API services, and tools for preprocessing and classification of data. The main challenges are outlined, such as data access limitations, frequent changes in web resource structures, the need to process large volumes of information, and the detection of fake news. The prospects for the development of automated news collection and analysis systems to improve the reliability and relevance of the obtained information are indicated.	en
dc.language.iso	uk_UA	uk_UA
dc.publisher	ВНТУ	uk
dc.relation.ispartof	Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р.	uk
dc.relation.uri	https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25673
dc.subject	збір даних	uk
dc.subject	аналіз інформації	uk
dc.subject	веб-скрапінг	uk
dc.subject	API	en
dc.subject	новинні агрегатори	uk
dc.subject	машинне навчання	uk
dc.subject	обробка текстів	uk
dc.subject	фільтрація новин	uk
dc.subject	data collection	en
dc.subject	information analysis	en
dc.subject	web scraping	en
dc.subject	news aggregators	en
dc.subject	machine learning	en
dc.subject	text processing	en
dc.subject	news filtering	en
dc.title	Методи збору та аналізу інформації з веб-джерел	uk
dc.type	Thesis
dc.identifier.udc	004.056.5
dc.relation.references	Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web. 2nd ed. OReilly Media, 2018. 290 p.	en
dc.relation.references	Janert P.K. Data Analysis with Open Source Tools. OReilly Media, 2010. 530 p.	en
dc.relation.references	NewsAPI Documentation. : https://newsapi.org/docs.	en
dc.relation.references	Russell M. Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Instagram, GitHub, and More. 3rd ed. OReilly Media, 2019. 423 p.	en
dc.relation.references	Bird S., Klein E., Loper E. Natural Language Processing with Python. OReilly Media, 2009 504 p.	en

Файли в цьому документі

Ім'я:: 25673.pdf
Розмір:: 284.1Kb
Формат:: PDF

Відкрити

Даний документ включений в наступну(і) колекцію(ї)

Молодь в науці: дослідження, проблеми, перспективи (МН-2025) [960]
Молодіжна науково-практична інтернет-конференція студентів аспірантів та молодих науковців

Показати скорочену інформацію