Methoden-Framework zum High Performance Data Mining von Monte-Carlo-Proteinsimulationen

Die Simulation von Biomolekülen auf Supercomputern mit Hilfe von Monte-Carlo- oder Molekulardynamik-Methoden erzeugt Sets von Trajektorien mit bis zu 1014 Konformationen, wobei jede Konformation als hochdimensionaler Vektor der molekularen Freiheitsgrade repräsentiert wird.
Die hohe Dimensionalität und große Anzahl der Konformationen bereitet bei der Analyse solcher Trajektorien zur Zeit erhebliche Schwierigkeiten.

Um aus diesen Simulationen tiefere Einsichten über die zugrundeliegenden biophysikalischen Prozesse zu erhalten werden daher in diesem Projekt High Performance Methoden zum Vergleichen, Ordnen, Indizieren und für das Data Mining solcher Molekülensembles und ihrer dynamischen Substrukturen entwickelt. Monte Carlo Simulationen von Proteinfaltungs- und Peptidaggregationsprozessen des SL-Bio stellen erste Anwendungsfälle für das zu entwickelnde Methoden-Framework dar (1).


(1) Mohanty, S. ; Meinke, J. ; Zimmermann, O.
Folding of Top7 in unbiased all-atom Monte Carlo simulations
Proteins 81(8), 1446 - 1456 (2013) [10.1002/prot.24295]

Projektlaufzeit:
Januar 2015 - Dezember 2016

Kontakt:
Prof. Dr. T. Seidl, Data Management and Data Exploration Group, Computer Science 9, RWTH Aachen University
Dr. Olav Zimmermann, Simulation Laboratory Biology, Jülich Supercomputing Centre, Forschungszentrum Jülich