Показати скорочену інформацію

dc.contributor.authorМокін, В. Б.uk
dc.contributor.authorЛосенко, А. В.uk
dc.contributor.authorДратований, М. В.uk
dc.contributor.authorMokin, V. B.en
dc.contributor.authorLosenko, A. V.en
dc.contributor.authorDratovanyi, M. V.en
dc.contributor.authorМокин, В. Б.ru
dc.contributor.authorЛосенко, А. В.ru
dc.contributor.authorДратований, М. В.ru
dc.date.accessioned2021-01-04T13:14:25Z
dc.date.available2021-01-04T13:14:25Z
dc.date.issued2019
dc.identifier.citationМокін В. Б. Інтелектуальна технологія аналізу та передбачення цін на вживані автомобілі [Текст] / В. Б. Мокін, А. В. Лосенко, М. В. Дратований // Вісник Вінницького політехнічного інституту. – 2019. – № 6. – С. 62-72.uk
dc.identifier.issn1997-9266
dc.identifier.issn1997–9274
dc.identifier.urihttp://ir.lib.vntu.edu.ua//handle/123456789/31127
dc.description.abstractДля вигідного продажу вживаного автомобіля слід керуватись не лише власною оцінкою або оцінкою сторонніх експертів, але й використовувати всі інші придатні для цього ресурси. Такими ресурсами можуть слугувати системи передбачення ціни, які за допомогою загальних ознак того чи іншого автомобіля (як-от виробник автомобіля, модель автомобіля, пробіг, вид палива, тип кузова тощо) здатні прогнозувати можливу ціну автомобіля. Такі системи можуть допомогти під час прийняття рішень не лише пересічним продавцям вживаних авто, а й агентствам, які займаються замовленням та масовим перевезенням вживаних авто з-за кордону. Для вибору ключових ознак та ідентифікації за ними оптимальної структури і параметрів моделей необхідно вибрати релевантні датасети, провести їх розвідувальний аналіз та відбір ознак, побудувати моделі машинного навчання, з яких вибрати оптимальну за певними критеріями. Для побудови інформаційної системи та перевірки працездатності запропонованої інтелектуальної технології вибрано два зіставні датасети по вживаних автомобілях США та України. Здійснено систематизацію методів та бібліотек на Python для проведення розвідувального аналізу даних і сформульовано загальні рекомендації щодо їх застосування для поставленої задачі. Запропоновано загальні принципи інтелектуальної технології, яка апробована на відібраних датасетах. Зокрема, проведено розвідувальний аналіз даних по США та обґрунтовано правило для фільтрування аномальних, а можливо й помилкових, даних. Вибрано множину можливих моделей, здійснено їх тренування та вибрано оптимальну серед них за R2-критерієм. Здійснено передбачення вартості авто, з точністю 86,1 %. Аналогічна задача розв’язана і для даних по Україні. Досягнуто точність 85,6 %. Це довело працездатність запропонованої технології та дозволило отримати корисні для використання на практиці результати.uk
dc.description.abstractFor the profitable sale of a used car, people should not only be guided by their own or third-party experts' evaluation, but also use all other suitable resources. Such resources can serve as price prediction systems that, using the common features of a car (such as a car manufacturer, car model, mileage, fuel type, body type, etc.), are able to predict the possible price of a car. Such systems can help in decision-making not only to ordinary car dealers, but also to agencies involved in the ordering and bulk transportation of used cars from abroad. To select the key features and identify the optimal structure and parameters of the models, relevant datasets should be selected, the intelligence analysis and selection of features will be conducted, after which building of a number of machine learning models has begun, from which the optimal model was chosen by certain criteria. In order to build an information system and test the functionality of the proposed intellectual technology, two comparable datasets for used cars of the USA and Ukraine were selected. Python methods and libraries have been systematized for intelligence analysis and general recommendations for their application for the task have been formulated. The general principles of intellectual technology, which is tested on the selected datasets, are offered. In particular, a exploratory data analysis of US data was conducted and a rule for filtering anomalous, and possibly erroneous, data was substantiated. Many possible models were selected, their training was carried out and the optimal one was selected according to the R-squared criterion. The cost of the car has been predicted to an accuracy of 86.1%. A similar problem is solved for data on Ukraine. An accuracy of 85.6% was achieved. This has proven the workability of the proposed technology and has yielded useful results in practice.en
dc.description.abstractДля выгодной продажи подержанного автомобиля следует руководствоваться не только собственной оценкой или оценкой сторонних экспертов, а также использовать все другие подходящие для этого ресурсы. Такими ресур- сами могут служить системы предвидения цен, которые с помощью общих признаков того или иного автомобиля (например производитель автомобиля, модель автомобиля, пробег, вид топлива, тип кузова и другие) способны прогнозировать возможную цену автомобиля. Такие системы могут помочь при принятии решений не только рядовым продавцам подержанных автомобилей, но и агентствам, которые занимаются заказами и массовым пе- ревозкам подержанных авто из-за рубежа. Для выбора ключевых признаков и идентификации по ним оптимальной структуры и параметров моделей необходимо выбрать релевантные датасеты, провести их разведывательный анализ и отбор признаков, построить ряд моделей машинного обучения, из которых выбрать оптимальную по определенным критериям. Для построения информационной системы и проверки работоспособности предложен- ной интеллектуальной технологии были выбраны два сопоставимые датасеты по подержанным автомобилям США и Украины. Проведена систематизация методов и библиотек на Python для проведения разведовательного анализа данных и сформулированы общие рекомендации по их применению для поставленной задачи. Предложены общие принципы интеллектуальной технологии, апробированой на отобранных датасетах. В частности, прове- ден разведывательный анализ данных по США и обоснованно правило для фильтрации аномальных, а возможно и ложных, данных. Выбрано множество возможных моделей, осуществлены их тренировки и выбрана оптимальная среди них по R2-критерию. Осуществлены предсказания стоимости автомобиля, с точностью 86,1 %. Аналогич- ная задача решена и для данных по Украине. Достигнута точность 85,6 %. Это доказало работоспособность предлагаемой технологии и позволило получить полезные для использования на практике результаты.ru
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofВісник Вінницького політехнічного інституту. № 6 : 62-72.uk
dc.relation.urihttps://visnyk.vntu.edu.ua/index.php/visnyk/article/view/2445
dc.subjectінтелектуальна технологіяuk
dc.subjectрозвідувальний аналіз данихuk
dc.subjectпередбачення ціниuk
dc.subjectвживаний автомобільuk
dc.subjectмоделі машинного навчанняuk
dc.subjectintellectual technologyen
dc.subjectdata miningen
dc.subjectprice predictionen
dc.subjectused caren
dc.subjectmachine learning modelsen
dc.subjectинтеллектуальная технологияru
dc.subjectразведывательный анализ данныхru
dc.subjectпредсказания ценыru
dc.subjectподержанный автомобильru
dc.subjectмодели машинного обученияru
dc.titleІнтелектуальна технологія аналізу та передбачення цін на вживані автомобіліuk
dc.title.alternativeIntellectual Technology of Analysis and Price Forecasting of Used Carsen
dc.title.alternativeИнтеллектуальные технологии анализа и предвидения цен на подержанные автомобилиru
dc.typeArticle
dc.identifier.udc004.8:338+629.330F0F0F
dc.relation.referencesA. Bezerra, I. Silva, L. A. Guedes, D. Silva, G. Leitão, and K. Saito, “Extracting Value from Industrial Alarms and Events: A Data-Driven Approach Based on Exploratory Data Analysis,” Sensors, 2019, no 19, issue 12, pp. 11-32.en
dc.relation.referencesStefan Lessmann, and Stefan Voß, “Car resale price forecasting: The impact of regression method, private information, and heterogeneity on forecast accuracy,” International Journal of Forecasting, 2017, no 33, issue 4, pp. 864-877.en
dc.relation.referencesKanwal Noor, and Sadaqat Jan, “Vehicle Price Prediction System using Machine Learning Techniques,” International Journal of Computer Applications, 2017, no 167, issue 9, pp. 27-31.en
dc.relation.referencesSun, Ning & Bai, Hongxi & Geng, Yuxia & Shi, Huizhu, “Price evaluation model in second-hand car system based on BP neural network theory,” IEEE/ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing, 2017, pp. 431-436.en
dc.relation.referencesPython leads the 11 top Data Science, Machine Learning platforms: Trends and Analysis. [Electronic resource]. Available: https://www.kdnuggets.com/2019/05/poll-top-data-science-machine-learning-platforms.html .en
dc.relation.referencesComprehensive Data Exploration with Python [Electronic resource]. Available: https://www.kaggle.com/pmarcelino/comprehensive-data-exploration-with-python .en
dc.relation.referencesModule pandas_profiling. [Electronic resource]. Available: https://pandas-profiling.github.io/pandas-profiling/docs/en
dc.relation.referencesMatplotlib API Overview. [Electronic resource]. Available: https://matplotlib.org/api/index.html .en
dc.relation.referencesA new correlation coefficient between categorical, ordinal and interval variables with Pearson characteristics. [Electronic resource]. Available: https://arxiv.org/abs/1811.11440 .en
dc.relation.referencesUsed Cars Dataset, Vehicles listings from Craigslist. [Electronic resource]. Available: https://www.kaggle.com/austinreese/craigslist-carstrucks-data .en
dc.relation.referencesSupervised Learning API Overview. [Electronic resource]. Available: https://scikit-learn.org/stable/supervised_learning.html#supervised-learning .en
dc.relation.referencesT. Houska, P. Kraft, A. Chamorro-Chavez, and L. Breuer, SPOTting Model Parameters Using a Ready-Made Python Package. [Electronic resource]. Available: https://doi.org/10.1371/journal.pone.0145180 .en
dc.relation.referencesMetrics and scoring: quantifying the quality of predictions. [Electronic resource]. Available: https://scikit-learn.org/stable/modules/model_evaluation.html#r2-score .en
dc.identifier.doihttps://doi.org/10.31649/1997-9266-2019-147-6-62-72


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію