Subscriptions
for enrichment
18 february 2019 | La Revue POLYTECHNIQUE

Un langage électronique commun pour caractériser les molécules

Une équipe de chimistes dirigée par l’Université de Genève a créé un langage électronique commun permettant de partager des données de chimie organique avec l’ensemble de la communauté scientifique internationale. Ils espèrent, de cette manière, constituer une norme ainsi que des bases de données internationales en libre accès.
En chimie organique, les scientifiques sont sans cesse à la recherche de nouvelles molécules, qu’ils créent et étudient grâce à la résonance magnétique. Les données récoltées sont ensuite retranscrites en fonction des normes propres à chaque laboratoire ou publication. Elles sont dès lors difficilement exportables électroniquement et donc peu utilisables par la communauté scientifique.

 
Le nouveau langage électronique NMReDATA constitue une norme pour le traitement des données des molécules organiques, afin de permettre leur transfert électronique d’un ordinateur à l’autre et de constituer des bases de données internationales en libre accès.
 
 

Traduire les données des molécules d’une seule et même manière
Une équipe internationale, dirigée par des chimistes de l’Université de Genève (UNIGE), a développé un nouveau langage électronique commun, permettant de traduire les données de chaque molécule d’une seule et même manière et de les exporter facilement d’un système informatique à l’autre. Les données deviennent ainsi facilement accessibles par tous les chimistes et réutilisables directement, permettant un gain de temps notable pour les futures recherches. Parue dans la revue Magnetic Resonance in Chemistry, cette étude ouvre la voie à la création d’une base de données internationale en accès libre, ainsi qu’à des outils spécifiques incluant l’analyse par intelligence artificielle.
 
La résonance magnétique se met au diapason
Les chimistes organiciens créent de nouvelles molécules à base d’atomes de carbone, mais celles-ci sont si petites qu’il leur est impossible de voir ce qu’ils synthétisent. Pour vérifier ces assemblages effectués à l’aveugle, les chercheurs utilisent alors la résonance magnétique. Chaque atome constituant la molécule émet un signal, dont la fréquence est traduite sous forme de spectre, que les chimistes vont ensuite décoder. Pour déterminer la structure d’une molécule, il faut donc être capable de lire les spectres de la résonance magnétique.
Les chimistes possèdent donc un vocabulaire spécifique pour décrire les spectres des molécules et détailler la résonance des atomes. Mais cette traduction des données brutes en langage écrit varie en fonction du laboratoire, du logiciel utilisé et de la publication. Il n’existe donc ni base de données sur la composition des molécules, ni uniformité dans le traitement des spectres et des données qui leurs sont attribuées.
«C’est pourquoi il est très difficile de réutiliser des données générées par d’autres laboratoires sans risque d’erreur», explique Damien Jeannerat, chercheur au Département de chimie organique de la Faculté des sciences de l’UNIGE. «Nous avons donc eu l’idée de créer un langage électronique unique qui permette de passer d’un système à l’autre sans perte d’information et de constituer des bases de données internationales en libre accès», poursuit-il.
 
Une langue unique: le NMReDATA
Les chimistes de l’UNIGE ont ainsi dirigé une initiative internationale impliquant les spécialistes du domaine et proposé une norme pour le traitement des données des molécules organiques. «Nommé NMReDATA, notre nouveau format fonctionne selon un système d’étiquettes à attribuer à chaque donnée extraite du spectre dans un ordre défini, qui est facilement lisible par un ordinateur», précise Marion Pupier, ingénieure au Département de chimie organique de la Faculté des sciences de l’UNIGE.
Ainsi, le signal de chaque spectre sera traduit dans l’ordre par le déplacement chimique, le nombre d’atomes, le couplage, les corrélations interatomiques et finalement l’attribution. «Jusqu’à présent, chacun transmettait ces mêmes informations de façon plus ou moins complète, dans un ordre qui lui était propre, rendant impossible le transfert électronique d’un ordinateur à l’autre sans un contrôle et une réorganisation des informations par les chercheurs. Avec notre système, cette contrainte disparaît grâce à l’uniformité du langage», affirme Damien Jeannerat.
 
Créer une base de données internationale en libre accès
L’idée d’un langage électronique commun est intimement liée à la volonté de créer une base de données en accès libre. «Celle-ci permettrait aux chimistes de trouver la composition exacte de molécules étudiées, sans refaire eux-mêmes un travail déjà effectué par le passé»,note Marion Pupier. L’information sera visible et disponible en tout lieu et toute heure, permettant un gain de temps considérable dans la recherche en chimie organique.
Reste à présent à diffuser ce nouveau format et à en faire la norme dans la publication d’articles par les grandes revues internationales. «Nous espérons que dans une année environ, tous les logiciels seront parfaitement opérationnels et que le langage NMReDATA sera utilisé par tous»,conclut Damien Jeannerat.
 
Damien Jeannerat
Maître d’enseignement et de recherche
UNIGE
Tél. 022 379 60 84
Damien.Jeannerat@unige.ch
 
Marion Pupier
Ingénieure ETS
UNIGE
Tél. 022 379 33 51
Marion.Pupier@unige.ch