Modelarea unei proteine prin filetare sau modelarea recunoașterii aliasing este o tehnică utilizată pentru proteina de model care se dorește ca acestea să aibă același cot că structurile de proteine cunoscute , dar care nu au proteine omoloage identificate în baza de date de proteine (PPB). Prin urmare, se opune metodei de predicție a structurii bazată pe modelarea omologică . Modelarea prin filetare funcționează utilizând cunoștințe statistice despre relația dintre structurile depuse în PDB și secvența proteinei pe care cineva dorește să o modeleze.
Predicția se face prin înșirarea (adică plasarea, alinierea) fiecărui aminoacid din secvența țintă într-o poziție din structura modelului și evaluarea cât de bine se potrivește ținta modelului. Odată selectat cel mai potrivit model, modelul structural al secvenței este construit pe baza alinierii cu modelul ales.
O proteină este o structură foarte fină transversal, dar foarte lungă. Această structură este de cele mai multe ori pliată pe ea însăși pentru a ocupa un spațiu minim. Anvelopa definită de această structură nu este regulată, interacțiunile diferitelor câmpuri înseamnă că anumite porțiuni ale moleculelor vor fi ascunse, în timp ce altele vor rămâne disponibile pentru a interacționa cu alte molecule. Această formă îi conferă proprietăți biologice suplimentare. Prin urmare, modelarea unei proteine constă în mare parte în încercarea de a găsi această formă 3D. Un element definitoriu al formei constă din coatele sale , adică locurile în care molecula se îndoaie în altă direcție.
Dacă vrem să inventăm o nouă proteină, probabil că o vom defini mai întâi din aminoacizii săi , cu toate acestea acest lucru nu este suficient, activitatea sa biologică este în mare măsură definită prin forma sa, care este la fel de importantă ca și compoziția sa biochimică. Dar de unde îi cunoașteți forma dacă este o proteină care nu există în natură? Putem crede că această proteină va avea o formă similară cu cea a unei proteine a cărei compoziție de aminoacizi ar fi apropiată; aceasta se numește modelare structurală prin omologie . Cu toate acestea, există cazuri în care variațiile direcțiilor sunt rapide și în care metoda de modelare prin omologie dă rezultate proaste: Coate. Prin urmare, este necesar să se identifice aceste îndoiri în proteinele existente pentru a le putea prezice în proteinele nou inventate. Această metodă poate fi, de asemenea, utilizată pentru a prezice o formă a structurii numai din predicția coatelor. Vom asambla apoi fiecare segment rezultat din predicția către vecinii săi. Prin urmare, acestea sunt așezate pe rând unul față de celălalt.
Filetarea sau inserția proteinelor, cunoscută și sub denumirea de recunoaștere a cotului pliabil , este un proces de modelare utilizat pentru modelarea prin analogie, a proteinelor care au aceleași pliuri ca proteinele structurilor cunoscute, dar care nu au proteine omoloage cu structură cunoscută. Diferă de metoda de modelare a structurii omologiei, deoarece este utilizată pentru proteinele care nu au structura proteinelor lor omoloage depuse în baza de date proteică ( PDB ), în timp ce modelarea omologică este utilizată precis pentru proteinele care au proteine omoloage depuse în PDB și a cărei structură este cunoscută.
Predicția se face prin „alinierea sau înșirarea” fiecărui aminoacid din secvența țintă într-o poziție într-o structură șablon și evaluarea în ce grad șablonul astfel „decorat” devine similar cu secvența țintă. Această operațiune se repetă pe diferite șabloane și în cele din urmă se alege șablonul care face posibilă generarea unei structuri cât mai aproape de cea a secvenței țintă. Filetarea proteinelor se bazează pe două observații fundamentale: numărul de coate pliabile diferite în natură este destul de redus (în jurul valorii de 1300), iar 90% din noile structuri supuse PDB în ultimii trei ani prezintă coate pliabile. Structurale similare celor deja conținute în PDB.
Baza de date de clasificare structurală a proteinelor (SCOP) oferă o descriere detaliată și cuprinzătoare a relațiilor structurale și evolutive ale structurii cunoscute. Proteinele sunt clasificate pentru a reflecta atât structura, cât și evoluția. Există multe niveluri în ierarhie, dar principalele niveluri sunt familiale, superfamiliale și pliere, așa cum este descris mai jos.
Proteinele grupate în familii sunt clar legate de evoluție. În general, aceasta înseamnă că similitudinile reziduale perechi între proteine sunt de 30% și mai mult. Cu toate acestea, în unele cazuri, funcții și structuri similare oferă dovezi definitive ale descendenței comune în absența unei identități de secvență ridicată. De exemplu, multe globine formează o familie, deși unii membri au identități secvențiale de doar 15%.
Proteinele care au identitate de secvență scăzută, dar ale căror caracteristici structurale și funcționale sugerează că este probabil o origine evolutivă comună, sunt plasate împreună în superfamilii. De exemplu, actina, domeniul ATPazei proteinei de șoc termic și hexakinaza formează împreună o superfamilie.
Proteinele sunt definite ca având o pliere comună (îndoire) dacă au aceleași structuri secundare majore în același aranjament și cu aceleași conexiuni topologice. Diferite proteine cu aceeași pliere au deseori elemente structurale secundare periferice și regiuni ale cotului care diferă prin mărime și conformație. În unele cazuri, aceste regiuni periferice diferite pot acoperi jumătate din structură. Proteinele plasate în aceeași categorie de coate pliabile pot să nu aibă o origine evolutivă comună: asemănările structurale ar putea apărea numai din fizica și chimia proteinelor favorizând anumite aranjamente de ambalare și topologia lanțului.
O paradigmă generală de filetare a proteinelor constă din următoarele patru etape:
Modelarea omologică și filetarea proteinelor sunt metode bazate pe modele și nu există o limită puternică între ele în ceea ce privește tehnicile de predicție. Dar structurile proteice ale țintelor lor sunt diferite. Modelarea omologică va fi posibilă numai pentru țintele care au proteine omoloage cu structură cunoscută, în timp ce filetarea proteinelor este posibilă numai pentru țintele cu numai omologie de coate pliabile găsite. Cu alte cuvinte, modelarea omologiei este destinată țintelor „mai ușoare”, iar filetarea proteinelor este destinată țintelor „mai dificile”.
Modelarea omologiei tratează modelul în aliniere ca o secvență și numai predicția este utilizată numai pentru omologie. Filetarea proteinelor procesează șablonul într-o aliniere ca structură, iar secvența și informațiile structurale extrase din aliniament sunt utilizate pentru predicție. Atunci când nu se găsește o omologie semnificativă, filetarea proteinelor poate face o predicție pe baza informațiilor structurale. Acest lucru explică, de asemenea, de ce filetarea proteinelor poate fi mai eficientă decât modelarea omologică în multe cazuri.
În practică, atunci când identitatea secvenței într-o aliniere a secvenței secvenței este scăzută (adică <25%), modelarea omologică poate să nu producă o predicție semnificativă. În acest caz, dacă există o omologie la distanță pentru țintă, modelarea firului de proteine poate genera o predicție bună.