Аналіз різнорідних даних в інтелектуальних системах виявлення шахрайства

Польгуль, Т. Д.; Яровий, А. А.; Polhul, T. D.; Yarovyi, A. A.; Польгуль, Т. Д.; Яровой, А. А.

dc.contributor.author	Польгуль, Т. Д.	uk
dc.contributor.author	Яровий, А. А.	uk
dc.contributor.author	Polhul, T. D.	en
dc.contributor.author	Yarovyi, A. A.	en
dc.contributor.author	Польгуль, Т. Д.	ru
dc.contributor.author	Яровой, А. А.	ru
dc.date.accessioned	2020-12-14T09:03:33Z
dc.date.available	2020-12-14T09:03:33Z
dc.date.issued	2019
dc.identifier.citation	Польгуль Т. Д. Аналіз різнорідних даних в інтелектуальних системах виявлення шахрайства [Текст] / Т. Д. Польгуль, А. А. Яровий // Вісник Вінницького політехнічного інституту. – 2019. – № 2. – С. 78-90.	uk
dc.identifier.issn	1997–9266
dc.identifier.issn	1997–9274
dc.identifier.uri	http://ir.lib.vntu.edu.ua//handle/123456789/31037
dc.description.abstract	Авторами статті шахрайство розглядається як аномалія в даних. Розроблено метод аналізу різ- норідних даних в інтелектуальних системах виявлення шахрайства. Формалізовано процес виявлен- ня шахрайства як аномалії в різнорідних даних при інсталюванні мобільних додатків з використанням теорії множин, що дозволило здійснити подальший аналіз даних у таких системах. Запропоновано математичну модель процесу аналізу різнорідних даних, алгоритм аналізу різнорідних даних, метод аналізу різнорідних даних на основі запропонованих шкал та коефіцієнтів, що дозволили обробляти різноформатні вхідні дані — різних метрик, шаблонів, розмірності, що у процесі аналізу дає можли- вість сформувати узагальнений шаблон шахрая. Розроблений метод використовує бази даних та бази знань, завдяки яким формується узагальнений шаблон шахрая, наявність якого дозволяє прис- корити виявлення шахраїв у нових наборах даних та виявляти навіть неявних шахраїв. Запропонова- ний метод розроблений з метою його використання в інтелектуальних системах виявлення шахрай- ства на основі аномалії в даних, які, на відміну від існуючих, дозволять здійснити аналіз різнорідних даних, на основі яких приймаються рішення про шахрайство, зменшити розмірності даних та прове- сти класифікацію користувачів. Проведено експериментальні дослідження запропонованого методу аналізу різнорідних даних у межах виявлення шахрайства як аномалії в різнорідних даних та класифі- каційної моделі, розробленої з використанням повністю зв’язаних глибоких нейронних мереж з трьома прихованими шарами з використанням розробленого програмного забезпечення та з використанням репрезентативної вибірки. Запропоновано схему експериментального дослідження виявлення анома- лій в різнорідних даних при інсталюванні мобільних додатків, в основі якої є представлений метод аналізу різнорідних даних. Показано ефективність використання запропонованого методу у системі виявлення шахрайства, точність класифікації якої склала 99,14 %, точність виявлення шахраїв — 82,76 %. Проте зі збільшенням правил у розробленій базі знань, що буде відбуватися з кожним запус- ком на нових даних, збільшуватиметься точність системи.	uk
dc.description.abstract	Fraud is being considered as an anomaly in the data in the work. The work is devoted to the development of a method of heterogeneous data analysis in intelligent fraud detection systems. The detection of fraud as an anomaly in heterogeneous data during mobile applications installation using set theory, which allowed further data analysis in such systems, is formalized. The mathematical model of the process of heterogeneous data analysis, the algorithm of heterogeneous data analysis, the method of heterogeneous data analysis on the basis of the proposed scales and coefficients that allowed processing of various input data — data of various metrics, templates, dimensions, which in the analysis process makes it possible to form a generalized fingerprint of fraudster, is proposed. The developed method uses the databases and knowledge bases, through which a generalized fingerprint of the fraudster is formed, the presence of which allows accelerating the detection of fraudsters in new data sets and detecting even implicit fraudsters. The proposed method is designed to use it in intelligent systems for fraud detection based on anomalies in data that, unlike existing ones, will allow analyzing heterogeneous data on the basis of which fraudulent decisions are made, to reduce the dimensionality of data and to classify users. Experi-mental researches of the proposed method of heterogeneous data analysis as a part of detection of fraud as anomalies in heterogeneous data and a classification model developed using fully connected deep neural networks with three hidden layers using the developed software and using a representative sample have been carried out. The scheme of experimental research of detection of anomalies in heterogeneous data during the mobile applications installation, based on which meth-od of heterogeneous data analysis was presented has been proposed. The efficiency of using the proposed method in the fraud detection system is shown, the classification accuracy of which was 99,14 %, the accuracy of the fraud detection is 82,76 %. However, with the increase of rules in the developed knowledge base, which will grow with each launch on the new data, the accuracy of the system will increase.	en
dc.description.abstract	Авторами мошенничество рассматривается как аномалия в данных. Разработан метод анализа разнород-ных данных в интеллектуальных системах обнаружения мошенничества. Формализован процесс выявления мошенничества как аномалии в разнородных данных при инсталлировании мобильных приложений с использова-нием теории множеств, что позволило осуществить дальнейший анализ данных в таких системах. Предложена математическая модель процесса анализа разнородных данных, алгоритм анализа разнородных данных, метод анализа разнородных данных на основе предложенных шкал и коэффициентов, которые позволили обрабаты-вать разноформатные входные данные — различные метрики, шаблоны, размерности, что в процессе анализа дает возможность сформировать обобщенный шаблон мошенника. Разработанный метод использует базы данных и базы знаний, благодаря которым формируется обобщенный шаблон мошенника, наличие которого позволяет ускорить выявление мошенников в новых наборах данных и выявлять даже неявных мошенников. Предложенный метод разработан с целью его использования в интеллектуальных системах обнаружения мо-шенничества на основе аномалии в данных, которые, в отличие от существующих, позволят провести анализ разнородных данных, на основе которых принимаются решения о мошенничестве, уменьшить размерности данных и провести классификацию пользователей. Проведены экспериментальные исследования предложенного метода анализа разнородных данных в рамках выявления мошенничества как аномалии в разнородных данных и классификационной модели, разработанной с использованием полностью связанных глубоких нейронных сетей с тремя скрытыми слоями с использованием разработанного программного обеспечения, репрезентативной выборки. Предложена схема экспериментального исследования для выявления аномалий в разнородных данных при инсталлирования мобильных приложений, в основе которой лежит представленный метод анализа разно-родных данных. Показана эффективность использования предложенного метода в системе определения мошен-ничества, точность классификации которой составила 99,1 4%, точность обнаружения мошенников — 82,76 %. Однако с увеличением правил в разработанной базе знаний, которое будет происходить с каждым запуском на новых данных, будет увеличиваться точность системы.	ru
dc.language.iso	uk_UA	uk_UA
dc.publisher	ВНТУ	uk
dc.relation.ispartof	Вісник Вінницького політехнічного інституту. № 2 : 78-90.	uk
dc.relation.uri	https://visnyk.vntu.edu.ua/index.php/visnyk/article/view/2345
dc.subject	виявлення шахрайства	uk
dc.subject	виявлення аномалій	uk
dc.subject	модель класифікації	uk
dc.subject	метод аналізу різнорідних даних	uk
dc.subject	fraud detection	en
dc.subject	anomaly detection	en
dc.subject	classification model	en
dc.subject	method for analyzing heterogeneous data	en
dc.subject	определение мошенничества	ru
dc.subject	определение аномалий	ru
dc.subject	модель классификации	ru
dc.subject	метод анализа разнородных данных	ru
dc.title	Аналіз різнорідних даних в інтелектуальних системах виявлення шахрайства	uk
dc.title.alternative	Heterogeneous Data Analysis in Intelligent Fraud Detection Systems	en
dc.title.alternative	Анализ разнородных данных в интеллектуальных системах обнаружения мошенничества	ru
dc.type	Article
dc.identifier.udc	004.94
dc.relation.references	T. Polhul, and A. Yarovyi “Development of a method for fraud detection in heterogeneous data during installation of mobile applications,” Eastern-European Journal of Enterprise Technologies, № 1/2 (97), 2019. https://doi.org/doi: 10.15587/1729-4061.2019.155060	en
dc.relation.references	D. Hawkins, “Identification of Outliers,” Chapman and Hall, 1980.	en
dc.relation.references	А. А. Яровий, О. Н. Романюк, І. Р. Арсенюк, та Т. Д. Польгуль, «Виявлення шахрайства при інсталюванні про- грамних додатків з використанням інтелектуального аналізу даних,» Наукові праці Донецького національного технічного університету. Серія: «Інформатика, кібернетика та обчислювальна техніка», № 2 (25), c. 126-131, 2017. [Електронний ресурс]. Режим доступу: http://science.donntu.edu.ua/wp-content/uploads/2018/03/ikvt_2017_2_site-1.pdf .	uk
dc.relation.references	Т. Д. Польгуль, та А. А. Яровий, «Визначення шахрайських операцій при встановленні мобільних додатків з ви- користанням інтелектуального аналізу даних,» Сучасні тенденції розвитку системного програмування. Тези доповідей. Київ, 2016. c. 55-56. [Електронний ресурс]. Режим доступу: http://ccs.nau.edu.ua/wp-content/uploads/2017/12/%D0%A1%D0%A2%D0%A0%D0%A1%D0%9F_2016_07.pdf .	uk
dc.relation.references	Т. Д. Польгуль, та А. А. Яровий, «Метод подолання різнорідності даних для виявлення шахрайства при інсталю- ванні мобільних додатків,» Вісник СНУ ім. В. Даля, № 7 (248) c. 60-69, 2018.	uk
dc.relation.references	T. Polhul, “Development of an intelligent system for detecting mobile app install fraud,” Proceedings of the IRES 156th International Conference, Bangkok, Thailand, 21st-22nd March 2019. pp. 25-29.	en
dc.relation.references	Kochava Uncovers Global Ad Fraud Scam. [Електронний ресурс]. Режим доступу: https://www.kochava.com/ .	en
dc.relation.references	Andrii Yarovyi, Raisa Ilchenko, Ihor Arseniuk, Yevhene Shemet, Andrzej Kotyra, and Saule Smailova, “An intelligent system of neural networking recognition of multicolor spot images of laser beam profile”. Proc. SPIE 10808, Photonics Applications in Astronomy, Communications, Industry, and High-Energy Physics Experiments 2018, 108081B (1 October 2018). https://doi.org/10.1117/12.2501691 .	en
dc.relation.references	V. Kozhemyako, L. Timchenko, and A. Yarovyy, “Methodological Principles of Pyramidal and Parallel-Hierarchical Image Processing on the Base of Neural-Like Network Systems,” Advances in Electrical and Computer Engineering, vol. 8, no. 2, pp. 54-60, 2008, https://doi.org/10.4316/AECE.2008.02010 .	en
dc.relation.references	M. Granik, V. Mesyura and A. Yarovyi, “Determining Fake Statements Made by Public Figures by Means of Artificial Intelligence,” 2018 IEEE 13th International Scientific and Technical Conference on Computer Sciences and Information Technologies (CSIT), Lviv, 2018, pp. 424-427. https://doi.org/ 10.1109/STC-CSIT.2018.8526631 .	en
dc.relation.references	R. Agrawal, R. Srikant, “Mining sequential patterns,” Proceedings of the Eleventh International Conference on Data Engineering. 1995. doi: https://doi.org/10.1109/icde.1995.380415	en
dc.relation.references	V. Chandola, A. Banerjee, V. Kumar, “Anomaly detection,” ACM Computing Surveys, vol. 41, iss. 3, pp. 1-582009. https://doi.org/https://doi.org/10.1145/1541880.1541882 .	en
dc.relation.references	S. Guido, A. Müller, Introduction to Machine Learning with Python: A Guide for Data Scientists. O’Reilly Media, 2016. 400 p.	en
dc.relation.references	D.-Y. Yeung, C. Chow, “Parzen-window network intrusion detectors,” “Object recognition supported by user interaction for service robots.” 2002. https://doi.org/10.1109/icpr.2002.1047476 .	en
dc.relation.references	E. Keogh, J. Lin, A. Fu, “HOT SAX: Efficiently Finding the Most Unusual Time Series Subsequence,” Fifth IEEE International Conference on Data Mining (ICDM’05). 2005. https://doi.org/10.1109/icdm.2005.79 .	en
dc.relation.references	E. Keogh, J. Lin, S.-H. Lee, H. V. Herle “Finding the most unusual time series subsequence: algorithms and applications,” Knowledge and Information Systems, vol. 11, iss. 1, pp. 1-27 , 2006. https://doi.org/10.1007/s10115-006-0034-6 .	en
dc.relation.references	А. Г. Кюльян, Т. Д. Польгуль, та М. Б. Хазін, «Математична модель рекомендаційного сервісу на основі методу кола- боративної фільтрації,» Комп’ютерні технології та Інтернет в інформаційному суспільстві, c. 226-227, 2012. [Електронний ресурс] Режим доступу: http://ir.lib.vntu.edu.ua/bitstream/handle/123456789/7911/226-227.pdf?sequence=1&isAllowed=y	uk
dc.relation.references	А. А. Яровий, та Т. Д. Польгуль, «Комп’ютерна програма «Програмний модуль збору даних інформаційної тех- нології» виявлення шахрайства при інсталюванні програмних додатків.» Cвідоцтво про реєстрацію авторського права на твір № 76348. К.: Міністерство економічного розвитку і торгівлі України, 2018.	uk
dc.relation.references	А. А. Яровий, та Т. Д. Польгуль, «Комп’ютерна програма «Програмний модуль визначення схожості користува- чів інформаційної технології виявлення шахрайства при інсталюванні програмних додатків,» Cвідоцтво про реєстрацію авторського права на твір № 76347. К.: Міністерство економічного розвитку і торгівлі України, 2018.	uk
dc.identifier.doi	https://doi.org/10.31649/1997-9266-2019-143-2-78-90

Файли в цьому документі

Ім'я:: Польгуль.pdf
Розмір:: 929.9Kb
Формат:: PDF

Відкрити

Даний документ включений в наступну(і) колекцію(ї)

Вісник Вінницького політехнічного інституту. 2019. № 2 [15]

Показати скорочену інформацію