Автоматизація процесу пошуку генів у геномі людини
Анотації
Магістерська кваліфікаційна робота присвячена розробці автоматизації процесу пошуку генів у геномі людини.
В даній роботі розглянуто сучасні методи та існуючі програмні засоби для обробки великих масивів інформації, зокрема генетичних даних. Розроблено метод обробки та пошуку слабоструктурованих даних великої розмірності. Спроектовано архітектуру розподіленої системи, на основі СУБД Apache Cassandra з інтегрованим модулем для індексації даних, на основі Apache Lucene, та Apache Spark для обробки даних.
Дана автоматизована розподілена система дозволяє обробляти генетичну інформацію швидше її аналогів та здійснювати пошук за короткий час. Magister work is devoted to the development of automated process of searching gene in genome of human.
In this work, there was consider the modern methods and existing software tools for processing large volumes of data, including genetic data. There was developed method of handling and searching semi structured data big capacity. There was design the architecture of distributed system based on Apache Cassandra database with integrated module for indexing the data, based on Apache Lucene, and Apache Spark tool for data processing.
This automated distributed system allows processing the genetic data faster than counterparts and perform searching very fast.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/25513