Використання машинного навчання для визначення місцезнаходження людей у приміщеннях
Автор
Топольський, А. І.
Паламарчук, Є. А.
Topolskiy, A. I.
Palamarchuk, Ye. A.
Дата
2025Metadata
Показати повну інформаціюCollections
Анотації
The article investigates the problem of automated data processing to record the presence of students in classes. It is proposed to use machine learning methods, since they allow predicting the location of students in the premises even in the presence of anomalies in the data. The solution to this problem will help to increase the efficiency of the educational process and reduce dependence on traditional methods of recording presence, which require time and human resources.
Experiments were conducted using various machine learning methods for regression and classification tasks. Prediction accuracy was used as a measure to compare different methods.
Among the regression methods, the following were considered: SVR, LinearSVR, NuSVR, PLSRegression, KernelRidge, RidgeCV, BayesianRidge, DecisionTreeRegressor, and ExtraTreeRegressor. The best accuracy was obtained by DecisionTreeRegressor, KernelRidgeRegression and ExtraTreeRegressor methods — 92.5, 93.9 and 95.5 %, respectively. However, regression methods require continuous data, such as user coordinates, which limits their use in environments where technical means do not allow obtaining such data.
As an alternative, classification methods were considered, namely: SVC, KNeighborsClassifier, DecisionTreeClassifier and RandomForestClassifier. The initial results showed lower accuracy compared to regression methods, which was due to the lack of representativeness of the training data. To solve this problem, a step-by-step algorithm was applied, which gradually predicts the building, floor and specific room. This algorithm led to a significant improvement in accuracy, with the best result being achieved by the RandomForestClassifier method — 94.3 %.
It was concluded that the choice of a machine learning method depends on the technical means used. If they allow you to obtain continuous data, such as coordinates, it is optimal to use the ExtraTreeRegressor, DecisionTreeRegressor, or KernelRidgeRegression regression methods. If continuous data cannot be obtained, it is optimal to use the RandomForestClassifier classification method with the proposed step-by-step algorithm. Досліджено проблему автоматизованої обробки даних для фіксації присутності студентів на заняттях. Запропоновано використовувати методи машинного навчання, адже вони дозволяють спрогнозувати місцезнаходження студентів в приміщеннях навіть за умов аномалій у даних. Вирішення цієї проблеми сприятиме підвищенню ефективності освітнього процесу та зменшення залежності від традиційних способів фіксації присутності, які потребують витрат часу та людських ресурсів.
Проведено експерименти з використанням різних методів машинного навчання для задач регресії та класифікації. Мірою для порівняння різних методів використано точність прогнозування.
Досліджено застосування таких методів регресії як SVR, LinearSVR, NuSVR, PLSRegression, KernelRidge, RidgeCV, BayesianRidge, DecisionTreeRegressor та ExtraTreeRegressor. Найкращу точність прогнозування отримано методами DecisionTreeRegressor, KernelRidgeRegression та ExtraTreeRegressor — 92,5, 93,9 та 95,5 % відповідно. Проте для методів регресії необхідні неперервні дані, такі як координати користувача, що обмежує їхнє використання в умовах, де технічні засоби не дозволять отримати такі дані.
Як альтернатива розглянуто методи класифікації, а саме: SVC, KNeighborsClassifier, DecisionTreeClassifier та RandomForestClassifier. Первинні результати показали нижчу точність у порівнянні з методами регресії, що зумовлено недостатньою репрезентативністю тренувальних даних. Для вирішення цієї проблеми застосовано покроковий алгоритм, який поступово прогнозує будівлю, поверх та конкретне приміщення. Такий алгоритм забезпечив значне підвищення точності. Найкращий результат показав метод RandomForestClassifier — 94,3 %.
Підсумовуючи зазначимо, що вибір методу машинного навчання залежить від використовуваних технічних засобів. Якщо вони дозволяють отримувати неперервні дані, такі як координати, оптимально використовувати методи регресії ExtraTreeRegressor, DecisionTreeRegressor або KernelRidgeRegression. Якщо ж неперервні дані неможливо отримати, то оптимально використовувати метод класифікації RandomForestClassifier із запропонованим покроковим алгоритмом.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/50434

