Показати скорочену інформацію

dc.contributor.authorШевчук, О. Ф.uk
dc.contributor.authorПавлюк, П. П.uk
dc.contributor.authorShevchuk, O. F.en
dc.contributor.authorPavliuk, P.en
dc.date.accessioned2026-05-01T09:33:36Z
dc.date.available2026-05-01T09:33:36Z
dc.date.issued2026
dc.identifier.citationШевчук О. Ф., Павлюк П. П. Особливості формування спеціалізованого набору даних для прогнозування хімічних властивостей фторвмісних сполук // Матеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р. Електрон. текст. дані. 2026. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/26328.uk
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/51300
dc.description.abstractThe paper presents the features and results of forming a specialized dataset for predicting the physicochemical properties of saturated fluorine-containing compounds. The proposed dataset includes experimental pKa and LogP values for 183 compounds and covers several structural classes relevant to medicinal chemistry. Data preprocessing was performed, including outlier removal, stratified splitting, and molecular similarity control. Preliminary analysis revealed nonlinear relationships between the number and position of fluorine atoms and the properties of the compounds, which justifies the use of machine learning methods for further modeling.en
dc.description.abstractУ роботі представлено особливості та результати формування спеціалізованого набору даних для прогнозування фізико-хімічних властивостей насичених фторвмісних сполук. Пропонований датасет містить експериментальні значення pKa та LogP для 183 сполук і охоплює кілька структурних класів, що мають значення для медичної хімії. Проведено попередню обробку даних, включно з видаленням викидів, стратифікованим поділом та контролем структурної подібності молекул. Первинний аналіз виявив нелінійні залежності між кількістю та положенням атомів фтору і властивостями сполук, що обґрунтовує доцільність застосування методів машинного навчання для подальшого моделювання.uk
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofМатеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р.uk
dc.relation.urihttps://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/26328
dc.subjectфторвмісні сполукиuk
dc.subjectнабір данихuk
dc.subjectпопередня обробка данихuk
dc.subjectмашинне навчанняuk
dc.subjectпрогнозування властивостейuk
dc.subjectfluorine-containing compoundsen
dc.subjectdataseten
dc.subjectpKaen
dc.subjectLogPen
dc.subjectdata preprocessingen
dc.subjectmachine learningen
dc.subjectproperty predictionen
dc.titleОсобливості формування спеціалізованого набору даних для прогнозування хімічних властивостей фторвмісних сполукuk
dc.typeThesis
dc.identifier.udc004.852:547.96
dc.relation.referencesBenaiges, D., Pedro-Botet, J., & Climent, E. (2021). Hydrophilic or lipophilic statins? Frontiers in Cardiovascular Medicine. https://doi.org/10.3389/fcvm.2021.687585en
dc.relation.referencesBaltruschat, M., & Czodrowski, P. (2020). Machine learning meets pKa. F1000Research. https://doi.org/10.12688/f1000research.22090.2en
dc.relation.referencesCaine, B. (2019). On the development and application of AIBL-pKa, a pKa predictor based on equilibrium bond lengths of a single protonation state.en
dc.relation.referencesYang, Q., Li, Y., Liu, Y., Zhang, L., Luo, S., & Cheng, J. (2020). Holistic prediction of the pKa in diverse solvents based on a machine-learning approach. Angewandte Chemie International Edition, 43. https://doi.org/10.1002/anie.202008528en
dc.relation.referencesXiong, J., Li, Z., Wang, G., Fu, Z., Zhong, F., Xu, T., Liu, X., Huang, Z., Liu, X., Chen, K., Jiang, H., & Zheng, M. (2022). Multi-instance learning of graph neural networks for aqueous pKa prediction. Bioinformatics, 38(3). https://doi.org/10.1093/bioinformatics/btab714en
dc.relation.referencesLi, M., Zhou, J., Hu, J., Fan, W., Zhang, Y., Gu, Y., & Karypis, G. (2017). DGL-LifeSci: An open-source toolkit for deep learning on graphs in life science. ACS Omega, 6(41). https://doi.org/10.1021/acsomega.1c04017en
dc.relation.referencesLandrum, G. (2023, September). RDKit: Open-source cheminformatics [Online]. Retrieved from https://www.rdkit.orgen
dc.relation.referencesRaddi, R. M., & Voelz, V. A. (2022). Stacking Gaussian processes to improve pKa predictions in the SAMPL7 challenge. Journal of Computer-Aided Molecular Design, 35. https://doi.org/10.1007/s10822-021-00411-8en
dc.relation.referencesGurbych, O., Pavliuk, P., Krasnienkov, D., Liashuk, O., Melnykov, K., Grygorenko, O. (2025). Filling the gap in LogP and pKa evaluation for saturated fluorine-containing derivatives with machine learning. Journal of Computational Chemistry, 46(2). https://doi.org/10.1002/jcc.70002en


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію