Ένας οδηγός για μεθόδους και λογισμικό πρόβλεψης δομής πρωτεϊνών

Για να ασκήσουν τις βιολογικές τους λειτουργίες, οι πρωτεΐνες διπλώνονται σε μία ή περισσότερες συγκεκριμένες διαμορφώσεις, υπαγορευόμενες από πολύπλοκες και αναστρέψιμες μη ομοιοπολικές αλληλεπιδράσεις. Ο προσδιορισμός της δομής μιας πρωτεΐνης μπορεί να επιτευχθεί με χρονοβόρες και σχετικά δαπανηρές τεχνικές όπως η κρυσταλλογραφία, η φασματοσκοπία πυρηνικού-μαγνητικού συντονισμού και η ενδομετρία διπλής πόλωσης. Το λογισμικό βιοπληροφορικής έχει αναπτυχθεί για τον υπολογισμό και την πρόβλεψη δομών πρωτεϊνών με βάση τις αλληλουχίες αμινοξέων τους.

Μια ανακεφαλαίωση της δομής των πρωτεϊνών

Ως εναλλακτική λύση στην πειραματική τεχνική, τα εργαλεία ανάλυσης δομής και πρόβλεψης βοηθούν στην πρόβλεψη της δομής των πρωτεϊνών σύμφωνα με τις αλληλουχίες αμινοξέων τους. Η επίλυση της δομής μιας δεδομένης πρωτεΐνης είναι εξαιρετικά σημαντική στην ιατρική (για παράδειγμα, στο σχεδιασμό φαρμάκων) και στη βιοτεχνολογία (για παράδειγμα, στο σχεδιασμό νέων ενζύμων). Το πεδίο της υπολογιστικής πρόβλεψης πρωτεϊνών εξελίσσεται συνεπώς συνεχώς, μετά την αύξηση της υπολογιστικής ισχύος των μηχανών και την ανάπτυξη ευφυών αλγορίθμων.

Υπάρχουν τέσσερα επίπεδα δομής πρωτεΐνης (σχήμα 1). Στην πρόβλεψη δομής πρωτεΐνης, η πρωτογενής δομή χρησιμοποιείται για την πρόβλεψη δευτερογενών και τριτογενών δομών.

Οι δευτερεύουσες δομές πρωτεϊνών εντοπίζονται αναδιπλούμενες εντός της πολυπεπτιδικής αλυσίδας που σταθεροποιείται από δεσμούς υδρογόνου. Οι πιο κοινές δομές δευτερογενούς πρωτεΐνης είναι άλφα έλικες και βήτα φύλλα.

Η τριτογενής δομή είναι η τελική μορφή της πρωτεΐνης όταν όλες οι δευτερεύουσες δομές έχουν διπλωθεί σε μια τρισδιάστατη δομή. Αυτό το τελικό σχήμα σχηματίζεται και συγκρατείται μαζί μέσω ιοντικής αλληλεπίδρασης, δισουλφιδικών γεφυρών και δυνάμεων van de Waals.

Τέσσερα επίπεδα δομής πρωτεϊνών. Εικόνα από το Khanacademy.org.

Μέθοδοι και λογισμικό πρόβλεψης δομής πρωτεϊνών

Ένας μεγάλος αριθμός λογισμικού πρόβλεψης δομής έχει αναπτυχθεί για ειδικά χαρακτηριστικά και ιδιαιτερότητες πρωτεΐνης, όπως πρόβλεψη διαταραχής, πρόβλεψη δυναμικής, πρόβλεψη διατήρησης δομής κ.λπ. Οι προσεγγίσεις περιλαμβάνουν μοντελοποίηση ομολογίας, νήματα πρωτεϊνών, μεθόδους ab initio, πρόβλεψη δευτερογενούς δομής και έλικας διαμεμβράνης και πρόβλεψη πεπτιδίου σήματος.

Η επιλογή της σωστής μεθόδου ξεκινά πάντα με τη χρήση της πρωτεύουσας αλληλουχίας της άγνωστης πρωτεΐνης και την αναζήτηση της βάσης δεδομένων πρωτεϊνών για ομόλογα (εικόνα 2).

Διάγραμμα λήψης αποφάσεων για τη μέθοδο πρόβλεψης της πρωτεϊνικής δομής.

Ακολουθούν ορισμένες λεπτομερείς μέθοδοι για την πρόβλεψη της δομής των πρωτεϊνών:

  • Εργαλεία πρόβλεψης δευτερογενούς δομής

Αυτά τα εργαλεία προβλέπουν τοπικές δευτερογενείς δομές που βασίζονται μόνο στην αλληλουχία αμινοξέων της πρωτεΐνης. Οι προβλεπόμενες δομές στη συνέχεια συγκρίνονται με τη βαθμολογία DSSP, η οποία υπολογίζεται με βάση την κρυσταλλογραφική δομή της πρωτεΐνης (περισσότερα για τη βαθμολογία DSSP εδώ).

Οι μέθοδοι πρόβλεψης για δευτερογενή δομή βασίζονται κυρίως σε βάσεις δεδομένων γνωστών πρωτεϊνικών δομών και σύγχρονων μεθόδων μηχανικής μάθησης όπως νευρωνικά δίχτυα και μηχανές φορέα υποστήριξης.

Εδώ είναι κάποιο εξαιρετικό εργαλείο για την πρόβλεψη δευτερογενούς δομής.

  • Τριτοβάθμια δομή

Τα εργαλεία πρόβλεψης τριτογενούς (ή 3-D) δομής εμπίπτουν σε δύο κύριες μεθόδους: Ab initio και συγκριτική μοντελοποίηση πρωτεϊνών.

Οι μέθοδοι πρόβλεψης δομής πρωτεΐνης Ab initio (ή de novo) επιχειρούν να προβλέψουν τριτοταγείς δομές από αλληλουχίες βασισμένες σε γενικές αρχές που διέπουν την ενεργειακή αναδίπλωση πρωτεϊνών και / ή στατιστικές τάσεις διαμορφωτικών χαρακτηριστικών που αποκτούν οι εγγενείς δομές, χωρίς τη χρήση ρητών προτύπων.

Όλες οι πληροφορίες σχετικά με την τριτοταγή δομή μιας πρωτεΐνης κωδικοποιούνται στην κύρια δομή της (δηλαδή, την ακολουθία αμινοξέων της). Ωστόσο, μπορεί να προβλεφθεί ένας τεράστιος αριθμός, μεταξύ των οποίων μόνο ένας έχει την ελάχιστη ελεύθερη ενέργεια και σταθερότητα που απαιτείται για να διπλωθεί σωστά. Η πρόβλεψη της δομής των πρωτεϊνών Ab initio απαιτεί συνεπώς τεράστια ποσότητα υπολογιστικής ισχύος και χρόνου για την επίλυση της φυσικής διαμόρφωσης μιας πρωτεΐνης και παραμένει μία από τις κορυφαίες προκλήσεις για τη σύγχρονη επιστήμη.

Οι πιο δημοφιλείς διακομιστές περιλαμβάνουν Robetta (χρησιμοποιώντας το πακέτο λογισμικού Rosetta), SWISS-MODEL, PEPstr, QUARK. Περιηγηθείτε σε μια πλήρη λίστα εδώ.

Εάν μια πρωτεΐνη γνωστής τριτοταγούς δομής μοιράζεται τουλάχιστον το 30% της αλληλουχίας της με ένα πιθανό ομόλογο απροσδιόριστης δομής, μπορούν να χρησιμοποιηθούν συγκριτικές μέθοδοι που επικαλύπτουν την υποτιθέμενη άγνωστη δομή με την γνωστή δομή. Η μοντελοποίηση ομολογίας και το νήμα πρωτεϊνών είναι δύο βασικές στρατηγικές που χρησιμοποιούν προηγούμενες πληροφορίες για άλλες παρόμοιες πρωτεΐνες για να προτείνουν μια πρόβλεψη μιας άγνωστης πρωτεΐνης, με βάση την ακολουθία της.

Το λογισμικό μοντελοποίησης ομολογιών και πρωτεϊνικών σπειρωμάτων περιλαμβάνει τα RaptorX, FoldX, HHpred, I-TASSER και άλλα.

βιβλιογραφικές αναφορές

Πρόβλεψη δομής πρωτεΐνης de novo. Βικιπαίδεια.

Πρόβλεψη δομής πρωτεϊνών. Βικιπαίδεια