Modelarea proteinelor prin filetare

Modelarea unei proteine prin filetare sau modelarea recunoașterii aliasing este o tehnică utilizată pentru proteina de model care se dorește ca acestea să aibă același cotstructurile de proteine cunoscute , dar care nu au proteine omoloage identificate în baza de date de proteine (PPB). Prin urmare, se opune metodei de predicție a structurii bazată pe modelarea omologică . Modelarea prin filetare funcționează utilizând cunoștințe statistice despre relația dintre structurile depuse în PDB și secvența proteinei pe care cineva dorește să o modeleze.

Predicția se face prin înșirarea (adică plasarea, alinierea) fiecărui aminoacid din secvența țintă într-o poziție din structura modelului și evaluarea cât de bine se potrivește ținta modelului. Odată selectat cel mai potrivit model, modelul structural al secvenței este construit pe baza alinierii cu modelul ales.

O proteină este o structură foarte fină transversal, dar foarte lungă. Această structură este de cele mai multe ori pliată pe ea însăși pentru a ocupa un spațiu minim. Anvelopa definită de această structură nu este regulată, interacțiunile diferitelor câmpuri înseamnă că anumite porțiuni ale moleculelor vor fi ascunse, în timp ce altele vor rămâne disponibile pentru a interacționa cu alte molecule. Această formă îi conferă proprietăți biologice suplimentare. Prin urmare, modelarea unei proteine constă în mare parte în încercarea de a găsi această formă 3D. Un element definitoriu al formei constă din coatele sale , adică locurile în care molecula se îndoaie în altă direcție.

Utilizare caz

Dacă vrem să inventăm o nouă proteină, probabil că o vom defini mai întâi din aminoacizii săi , cu toate acestea acest lucru nu este suficient, activitatea sa biologică este în mare măsură definită prin forma sa, care este la fel de importantă ca și compoziția sa biochimică. Dar de unde îi cunoașteți forma dacă este o proteină care nu există în natură? Putem crede că această proteină va avea o formă similară cu cea a unei proteine ​​a cărei compoziție de aminoacizi ar fi apropiată; aceasta se numește modelare structurală prin omologie . Cu toate acestea, există cazuri în care variațiile direcțiilor sunt rapide și în care metoda de modelare prin omologie dă rezultate proaste: Coate. Prin urmare, este necesar să se identifice aceste îndoiri în proteinele existente pentru a le putea prezice în proteinele nou inventate. Această metodă poate fi, de asemenea, utilizată pentru a prezice o formă a structurii numai din predicția coatelor. Vom asambla apoi fiecare segment rezultat din predicția către vecinii săi. Prin urmare, acestea sunt așezate pe rând unul față de celălalt.

Mod de operare

Filetarea sau inserția proteinelor, cunoscută și sub denumirea de recunoaștere a cotului pliabil , este un proces de modelare utilizat pentru modelarea prin analogie, a proteinelor care au aceleași pliuri ca proteinele structurilor cunoscute, dar care nu au proteine ​​omoloage cu structură cunoscută. Diferă de metoda de modelare a structurii omologiei, deoarece este utilizată pentru proteinele care nu au structura proteinelor lor omoloage depuse în baza de date proteică ( PDB ), în timp ce modelarea omologică este utilizată precis pentru proteinele care au proteine ​​omoloage depuse în PDB și a cărei structură este cunoscută.

Predicția se face prin „alinierea sau înșirarea” fiecărui aminoacid din secvența țintă într-o poziție într-o structură șablon și evaluarea în ce grad șablonul astfel „decorat” devine similar cu secvența țintă. Această operațiune se repetă pe diferite șabloane și în cele din urmă se alege șablonul care face posibilă generarea unei structuri cât mai aproape de cea a secvenței țintă. Filetarea proteinelor se bazează pe două observații fundamentale: numărul de coate pliabile diferite în natură este destul de redus (în jurul valorii de 1300), iar 90% din noile structuri supuse PDB în ultimii trei ani prezintă coate pliabile. Structurale similare celor deja conținute în PDB.

Clasificarea structurală a proteinelor

Baza de date de clasificare structurală a proteinelor (SCOP) oferă o descriere detaliată și cuprinzătoare a relațiilor structurale și evolutive ale structurii cunoscute. Proteinele sunt clasificate pentru a reflecta atât structura, cât și evoluția. Există multe niveluri în ierarhie, dar principalele niveluri sunt familiale, superfamiliale și pliere, așa cum este descris mai jos.

Familia (relație evolutivă evidentă)

Proteinele grupate în familii sunt clar legate de evoluție. În general, aceasta înseamnă că similitudinile reziduale perechi între proteine ​​sunt de 30% și mai mult. Cu toate acestea, în unele cazuri, funcții și structuri similare oferă dovezi definitive ale descendenței comune în absența unei identități de secvență ridicată. De exemplu, multe globine formează o familie, deși unii membri au identități secvențiale de doar 15%.

Superfamilie (origine evolutivă comună probabilă)

Proteinele care au identitate de secvență scăzută, dar ale căror caracteristici structurale și funcționale sugerează că este probabil o origine evolutivă comună, sunt plasate împreună în superfamilii. De exemplu, actina, domeniul ATPazei proteinei de șoc termic și hexakinaza formează împreună o superfamilie.

Pliere (asemănare structurală majoră)

Proteinele sunt definite ca având o pliere comună (îndoire) dacă au aceleași structuri secundare majore în același aranjament și cu aceleași conexiuni topologice. Diferite proteine ​​cu aceeași pliere au deseori elemente structurale secundare periferice și regiuni ale cotului care diferă prin mărime și conformație. În unele cazuri, aceste regiuni periferice diferite pot acoperi jumătate din structură. Proteinele plasate în aceeași categorie de coate pliabile pot să nu aibă o origine evolutivă comună: asemănările structurale ar putea apărea numai din fizica și chimia proteinelor favorizând anumite aranjamente de ambalare și topologia lanțului.

Metodă

O paradigmă generală de filetare a proteinelor constă din următoarele patru etape:

Comparație cu modelarea omologică

Modelarea omologică și filetarea proteinelor sunt metode bazate pe modele și nu există o limită puternică între ele în ceea ce privește tehnicile de predicție. Dar structurile proteice ale țintelor lor sunt diferite. Modelarea omologică va fi posibilă numai pentru țintele care au proteine ​​omoloage cu structură cunoscută, în timp ce filetarea proteinelor este posibilă numai pentru țintele cu numai omologie de coate pliabile găsite. Cu alte cuvinte, modelarea omologiei este destinată țintelor „mai ușoare”, iar filetarea proteinelor este destinată țintelor „mai dificile”.

Modelarea omologiei tratează modelul în aliniere ca o secvență și numai predicția este utilizată numai pentru omologie. Filetarea proteinelor procesează șablonul într-o aliniere ca structură, iar secvența și informațiile structurale extrase din aliniament sunt utilizate pentru predicție. Atunci când nu se găsește o omologie semnificativă, filetarea proteinelor poate face o predicție pe baza informațiilor structurale. Acest lucru explică, de asemenea, de ce filetarea proteinelor poate fi mai eficientă decât modelarea omologică în multe cazuri.

În practică, atunci când identitatea secvenței într-o aliniere a secvenței secvenței este scăzută (adică <25%), modelarea omologică poate să nu producă o predicție semnificativă. În acest caz, dacă există o omologie la distanță pentru țintă, modelarea firului de proteine ​​poate genera o predicție bună.

Software de filetare a proteinelor

Note și referințe

  1. (în) Jian Peng și Jinbo Xu , "  Raptorx: Exploatarea informațiilor pentru alinierea structurii proteinelor prin inferență statistică  " , Proteine: Structure, Function, and Bioinformatics , vol.  79, n °  S10,2011, p.  161–171 ( DOI  10.1002 / prot.23175 , citit online , accesat la 9 iunie 2019 )
  2. (în) J. Peng și J. Xu , "  Filetarea omologiei cu conținut scăzut de proteine  " , Bioinformatică , vol.  26, n o  12,15 iunie 2010, i294 - i300 ( ISSN  1367-4803 și 1460-2059 , PMID  20529920 , PMCID  PMC2881377 , DOI  10.1093 / bioinformatics / btq192 , citit online , accesat la 9 iunie 2019 )
  3. (în) Jian Peng și Jinbo Xu , „  abordare multi-șablon a filetării proteinelor A  ” , Proteine: Structure, Function, and Bioinformatics , vol.  79, nr .  6,iunie 2011, p.  1930–1939 ( DOI  10.1002 / prot.23016 , citit online , accesat la 9 iunie 2019 )
  4. (în) Jianzhu Ma Jian Peng Sheng Wang și Jinbo Xu , "  Un câmp neural condiționat pentru modelul de filetare a proteinelor  " , Bioinformatică , vol.  28, n o  12,15 iunie 2012, i59 - i66 ( ISSN  1460-2059 și 1367-4803 , PMID  22689779 , PMCID  PMC3371845 , DOI  10.1093 / bioinformatics / bts213 , citit online , accesat la 9 iunie 2019 )
  5. (ro) Sitao Wu și Yang Zhang , "  Muster: Îmbunătățirea alinierii secvenței de proteine ​​profil-profil prin utilizarea mai multor surse de structură a informațiilor  " , Proteine: Structure, Function, and Bioinformatics , vol.  72, n o  24 februarie 2008, p.  547–556 ( DOI  10.1002 / prot.21945 , citit online , accesat la 9 iunie 2019 )
  6. (în) Y. Yang , E. Faraggi , H. Zhao și Y. Zhou , „  Îmbunătățirea recunoașterii pliurilor proteice și modelarea bazată pe șabloane prin utilizarea de potriviri bazate pe probabilistică șabloane  ” , Bioinformatică , vol.  27, nr .  15,1 st august 2011, p.  2076–2082 ( ISSN  1367-4803 și 1460-2059 , PMID  21666270 , PMCID  PMC3137224 , DOI  10.1093 / bioinformatics / btr350 , citit online , accesat la 9 iunie 2019 )
  7. (în) D. Gront , dl Blaszczyk , P. Wojciechowski și A. Kolinski , "  BioShell Threader: detectare proteină omologie de secvență se bazează profile și profile de structură secundară  " , Nucleic Acids Research , Voi.  40, n o  W1,1 st iulie 2012, W257 - W262 ( ISSN  0305-1048 și 1362-4962 , PMID  22693216 , PMCID  PMC3394251 , DOI  10.1093 / nar / gks555 , citit online , accesat la 9 iunie 2019 )

Bibliografie

linkuri externe