Accueil / Regards sur la science / Une intelligence artificielle propose une structure tridimensionnelle pour toutes les protéines connues

Une intelligence artificielle propose une structure tridimensionnelle pour toutes les protéines connues

Publié en ligne le 22 juin 2023 - Intelligence Artificielle -

Une protéine est une molécule formée d’un assemblage d’acides aminés. Le séquençage d’une protéine permet de déterminer sa structure primaire, c’est-à-dire l’ordre dans lequel s’enchaînent ses acides aminés. La base de données UniProt recense les séquences, issues de la littérature scientifique, de quelque 200 millions de protéines [1].

Cependant la structure primaire d’une protéine ne dit rien sur sa structure tridimensionnelle, pourtant déterminante pour comprendre sa fonction, c’est-à-dire le rôle qu’elle possède au sein d’un organisme vivant. En effet, une protéine est une molécule dont l’activité biologique n’est effective que si elle acquiert une structure lui permettant d’interagir avec d’autres molécules du vivant.

Traditionnellement, la structure tridimensionnelle d’une protéine est déterminée par cristallographie aux rayons X, par spectrométrie RMN (résonance magnétique nucléaire) ou par cryo-microscopie électronique. Ce sont ces techniques qui ont permis de résoudre la structure tridimensionnelle de plus de 100 000 protéines avec une résolution atomique [2].

En disposant, pour un grand nombre de protéines, à la fois de leur séquence (structure primaire) et de leur structure tridimensionnelle, il est possible d’entraîner des intelligences artificielles à prédire la structure tridimensionnelle à partir de la structure primaire.

Structure tridimensionnelle d’une protéine légumine (ou globuline 11S).

À ce jeu, le programme AlphaFold de DeepMind (une entreprise appartenant à Alphabet, la maison mère de Google) est à ce jour l’un des plus performants. Il a remporté en 2020 la dernière édition du tournoi CASP [3]. Cette compétition qui se déroule tous les deux ans vise à évaluer l’efficacité des programmes de prédiction de structures protéiques en leur soumettant des séquences de protéines dont la structure tridimensionnelle a été résolue expérimentalement, mais non rendue publique.

Après avoir publié le programme AlphaFold sous licence libre l’année dernière [4], DeepMind franchit un nouveau cap en publiant sa base de données de structures protéiques [5]. Accessible gratuitement, cette base contient les structures tridimensionnelles prédites des quelque 200 millions de protéines dont la séquence est connue. La communauté scientifique pourra l’utiliser pour prédire les interactions entre les protéines du vivant et leurs partenaires, mais aussi pour comprendre les mécanismes d’action de médicaments existants et améliorer leur efficacité, voire pour en concevoir de nouveaux « sur mesure », parfaitement adaptés à la forme de leur protéine cible.

Pascal Combemorel

Agrégé de SVT, il est le responsable éditorial de Planet-Vie (planet-vie.ens.fr), un site internet publiant des articles de vulgarisation en biologie.

Rubrique coordonnée par Kévin Moris
Références
1 | Le site d’Uniprot
2 | Le site de la banque de données RCSB Protein Data Bank
3 | Jumper J et al., “Highly accurate protein structure prediction with AlphaFold”, Nature, 2021, 596 :583-9.
4 | Le programme AlphaFold sous licence libre.
5 | La base de données des 200 millions de structures protéiques générées par AlphaFold : alphafold.ebi.ac.uk

Publié dans le n° 343 de la revue


Partager cet article


L' auteur

Pascal Combemorel

Agrégé de SVT, il est le responsable éditorial de Planet-Vie, un site internet publiant des articles de (...)

Plus d'informations

Intelligence Artificielle

L’intelligence artificielle (IA) suscite curiosité, enthousiasme et inquiétude. Elle est présente dans d’innombrables applications, ses prouesses font régulièrement la une des journaux. Dans le même temps, des déclarations médiatisées mettent en garde contre des machines qui pourraient prendre le pouvoir et menacer la place de l’Homme ou, a minima, porter atteinte à certaines de nos libertés. Les performances impressionnantes observées aujourd’hui sont-elles annonciatrices de comportements qui vont vite nous échapper ?