Особливості формування спеціалізованого набору даних для прогнозування хімічних властивостей фторвмісних сполук
Автор
Шевчук, О. Ф.
Павлюк, П. П.
Shevchuk, O. F.
Pavliuk, P.
Дата
2026Metadata
Показати повну інформаціюCollections
Анотації
The paper presents the features and results of forming a specialized dataset for predicting the physicochemical
properties of saturated fluorine-containing compounds. The proposed dataset includes experimental pKa and LogP
values for 183 compounds and covers several structural classes relevant to medicinal chemistry. Data preprocessing was
performed, including outlier removal, stratified splitting, and molecular similarity control. Preliminary analysis revealed
nonlinear relationships between the number and position of fluorine atoms and the properties of the compounds, which
justifies the use of machine learning methods for further modeling. У роботі представлено особливості та результати формування спеціалізованого набору даних для
прогнозування фізико-хімічних властивостей насичених фторвмісних сполук. Пропонований датасет містить
експериментальні значення pKa та LogP для 183 сполук і охоплює кілька структурних класів, що мають значення
для медичної хімії. Проведено попередню обробку даних, включно з видаленням викидів, стратифікованим
поділом та контролем структурної подібності молекул. Первинний аналіз виявив нелінійні залежності між
кількістю та положенням атомів фтору і властивостями сполук, що обґрунтовує доцільність застосування
методів машинного навчання для подальшого моделювання.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/51300

