| dc.contributor.author | Шевчук, О. Ф. | uk |
| dc.contributor.author | Павлюк, П. П. | uk |
| dc.contributor.author | Shevchuk, O. F. | en |
| dc.contributor.author | Pavliuk, P. | en |
| dc.date.accessioned | 2026-05-01T09:33:36Z | |
| dc.date.available | 2026-05-01T09:33:36Z | |
| dc.date.issued | 2026 | |
| dc.identifier.citation | Шевчук О. Ф., Павлюк П. П. Особливості формування спеціалізованого набору даних для прогнозування хімічних властивостей фторвмісних сполук // Матеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р. Електрон. текст. дані. 2026. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/26328. | uk |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/51300 | |
| dc.description.abstract | The paper presents the features and results of forming a specialized dataset for predicting the physicochemical
properties of saturated fluorine-containing compounds. The proposed dataset includes experimental pKa and LogP
values for 183 compounds and covers several structural classes relevant to medicinal chemistry. Data preprocessing was
performed, including outlier removal, stratified splitting, and molecular similarity control. Preliminary analysis revealed
nonlinear relationships between the number and position of fluorine atoms and the properties of the compounds, which
justifies the use of machine learning methods for further modeling. | en |
| dc.description.abstract | У роботі представлено особливості та результати формування спеціалізованого набору даних для
прогнозування фізико-хімічних властивостей насичених фторвмісних сполук. Пропонований датасет містить
експериментальні значення pKa та LogP для 183 сполук і охоплює кілька структурних класів, що мають значення
для медичної хімії. Проведено попередню обробку даних, включно з видаленням викидів, стратифікованим
поділом та контролем структурної подібності молекул. Первинний аналіз виявив нелінійні залежності між
кількістю та положенням атомів фтору і властивостями сполук, що обґрунтовує доцільність застосування
методів машинного навчання для подальшого моделювання. | uk |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Матеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р. | uk |
| dc.relation.uri | https://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/26328 | |
| dc.subject | фторвмісні сполуки | uk |
| dc.subject | набір даних | uk |
| dc.subject | попередня обробка даних | uk |
| dc.subject | машинне навчання | uk |
| dc.subject | прогнозування властивостей | uk |
| dc.subject | fluorine-containing compounds | en |
| dc.subject | dataset | en |
| dc.subject | pKa | en |
| dc.subject | LogP | en |
| dc.subject | data preprocessing | en |
| dc.subject | machine learning | en |
| dc.subject | property prediction | en |
| dc.title | Особливості формування спеціалізованого набору даних для прогнозування хімічних властивостей фторвмісних сполук | uk |
| dc.type | Thesis | |
| dc.identifier.udc | 004.852:547.96 | |
| dc.relation.references | Benaiges, D., Pedro-Botet, J., & Climent, E. (2021). Hydrophilic or lipophilic statins? Frontiers in Cardiovascular
Medicine. https://doi.org/10.3389/fcvm.2021.687585 | en |
| dc.relation.references | Baltruschat, M., & Czodrowski, P. (2020). Machine learning meets pKa. F1000Research.
https://doi.org/10.12688/f1000research.22090.2 | en |
| dc.relation.references | Caine, B. (2019). On the development and application of AIBL-pKa, a pKa predictor based on equilibrium bond lengths of a
single protonation state. | en |
| dc.relation.references | Yang, Q., Li, Y., Liu, Y., Zhang, L., Luo, S., & Cheng, J. (2020). Holistic prediction of the pKa in diverse solvents based on a
machine-learning approach. Angewandte Chemie International Edition, 43. https://doi.org/10.1002/anie.202008528 | en |
| dc.relation.references | Xiong, J., Li, Z., Wang, G., Fu, Z., Zhong, F., Xu, T., Liu, X., Huang, Z., Liu, X., Chen, K., Jiang, H., & Zheng, M. (2022).
Multi-instance learning of graph neural networks for aqueous pKa prediction. Bioinformatics, 38(3).
https://doi.org/10.1093/bioinformatics/btab714 | en |
| dc.relation.references | Li, M., Zhou, J., Hu, J., Fan, W., Zhang, Y., Gu, Y., & Karypis, G. (2017). DGL-LifeSci: An open-source toolkit for deep
learning on graphs in life science. ACS Omega, 6(41). https://doi.org/10.1021/acsomega.1c04017 | en |
| dc.relation.references | Landrum, G. (2023, September). RDKit: Open-source cheminformatics [Online]. Retrieved from https://www.rdkit.org | en |
| dc.relation.references | Raddi, R. M., & Voelz, V. A. (2022). Stacking Gaussian processes to improve pKa predictions in the SAMPL7 challenge.
Journal of Computer-Aided Molecular Design, 35. https://doi.org/10.1007/s10822-021-00411-8 | en |
| dc.relation.references | Gurbych, O., Pavliuk, P., Krasnienkov, D., Liashuk, O., Melnykov, K., Grygorenko, O. (2025). Filling the gap in LogP and pKa
evaluation for saturated fluorine-containing derivatives with machine learning. Journal of Computational Chemistry, 46(2).
https://doi.org/10.1002/jcc.70002 | en |