Déjouer la complexité du transfert technologique
Sachin Misra, Principal, Kalypso, A Rockwell Automation Company
Des outils numériques permettront de relever ce défi chronophage.
Si vous pensez aux vaccins anti-COVID développés ces deux dernières années, vous pouvez vous demander si nous n’avons pas déjà trouvé la solution pour avoir des transferts technologiques rapides. Oui et non. La grande rapidité est due à l’énorme effort humain déployé et à la grande persévérance.
Il existe en fait de nombreux articles publics qui expliquent le grand nombre de personnes employées par Pfizer pour piloter le transfert technologique en vue du vaccin anti-COVID-19, qui, cela dit, consiste en un modèle à 50 000 étapes de process ou opérations unitaires. Tentez d’expliquer cela sur papier en format PDF. Il est quasiment impossible de rendre compte de la recette complète.
La réponse est : oui, c’est possible ; mais, ce n’est pas soutenable. Si nous avons une autre pandémie, pouvons-nous lancer 300 personnes dans le transfert technologique ? Absolument. Mais cela fonctionne-t-il pour un produit commercial ? Non. Il faut avoir à l’esprit le fait qu’il existe des technologies qui court-circuitent l’élément humain du transfert technologique autant que possible.
Puiser dans les données
La plupart des données collectées pendant le processus de transfert technologique sont des données qui, comble de l’ironie, ont pu avoir au départ un format numérique. Mais, plus vous rassemblez des données provenant de multiples systèmes, plus vous les traduisez — ou les reformatez — en un fichier PDF ou ce que nous appelons du « papier sur verre ».
Traduites en opérations manufacturières, ces informations doivent subir une ingénierie inversée pour alimenter le système ERP de gestion des ressources ou le système MES de gestion de la production. Lorsque nous avons examiné cette problématique avec nos clients, nous avons pensé qu’il existait un meilleur moyen de capturer ces données — numériques ou non — et de les convertir dans un format cohérent qui peut piloter le fil numérique.
Mais, de quelle sorte de données parlons-nous ? Si vous commencez au niveau le plus haut de la Figure 1, vous trouvez la matière proprement dite, qu’il s’agisse de la substance médicamenteuse, de l’ingrédient pharmaceutique actif, des produits intermédiaires, etc. Nous divisons ensuite ce niveau en petite molécule ou grande molécule, car les constructions sont légèrement différentes en termes de description des matières qui constituent le produit médicamenteux.
Le niveau médian de la figure concerne le conditionnement. Si le produit est prévu pour une forme solide administrée par voie orale, il peut se présenter dans un blister. S’il s’agit d’un produit biologique, il peut avoir un appareil de livraison dédié, très bien défini, une nomenclature précise, voire des composants connectés qui mesurent le régime de livraison, la thérapie de dosage, et autres paramètres. Il peut avoir son initiative propre.
Nous constatons généralement que ces groupes sont associés à des informations qui relèvent de différents domaines. Un ingénieur développement en conditionnement ne peut pas mettre au point une substance médicamenteuse et vice-versa. Chacun est très spécialisé et concentré dans son domaine, et a tendance à exploiter très en profondeur les systèmes qu’il utilise, ce qui ne profite pas nécessairement à un scientifique, par exemple. Par exemple, si je suis un ingénieur en conditionnement travaillant sur une application de modélisation 3D pour développer le conditionnement, cela ne veut rien dire pour le scientifique qui travaille sur la molécule clé.
Les deux derniers niveaux concernent réellement le développement. Pensez à l’ingénierie de process. Vous déployez 10 à 15 années d’efforts en développement, en laboratoire ou dans une installation pilote, et vous souhaitez passer à la phase de la commercialisation. Vous êtes donc aux prises avec la complexité des différentes autorisations de mise sur le marché auxquelles vous devez vous soumettre.
En substance, un seul médicament peut avoir à se décliner sous 50 à 60 recettes différentes, selon le nombre de sites de fabrication et le nombre de variantes commerciales prises en charge.
Enfin, il y a le niveau équipement proprement dit. Nous savons que les entreprises pharmaceutiques et de biotechnologie n’ont pas d’exactes répliques clonées de leurs installations. Il y a de la variabilité. Dans une installation, il peut y avoir un mélangeur ou un bioréacteur qui se comporte ou fonctionne un peu différemment d’un autre ailleurs. Il faut en tenir compte lors du processus de transfert technologique ou d’évolution.
C’est la complexité que nous tentons de décrypter par ces documents de transfert technologique.
Quelle est la pièce manquante ?
Depuis ces 100 dernières années, nous nous attelons inlassablement à travailler sur les modalités de définition des recettes. Grâce à la puissance de traitement dont nous disposons actuellement, nous pouvons emprunter deux trajectoires différentes pour accélérer le processus de collecte et de diffusion des données en direction des systèmes en aval.
Ce qui manque véritablement est un mécanisme ou processus qui prendrait toutes les données de développement collectées sur les 10 à 15 dernières années et les convertirait dans un format réutilisable, facilement consommable et exploitable par un système ERP ou MES. Le but est d’améliorer l’approche actuelle qui consiste à avoir 10 à 15 personnes par site qui tentent de maîtriser la documentation qui leur est livrée par leurs collègues du développement.
L’opération est plus intéressante et exige probablement davantage de travail si vous êtes une entreprise de sous-traitance pharmaceutique, dite CDMO. Si vous devez négocier avec de multiples entreprises innovantes du secteur pharmaceutique qui fournissent des données sous différentes formes, vous disposez probablement d’une équipe de développement process qui passe 6 à 18 mois à simplement comprendre de quoi il s’agit et à revenir vers l’entreprise pharmaceutique pour dire « est-ce bien de cela dont il s’agit ? ».
Nous avons besoin de Google Translate. Cette appli sur votre téléphone ne convertit pas simplement les mots d’une langue dans une autre. Elle étudie également la sémantique et le contexte grammatical. Si elle traduisait simplement des mots isolés, elle ne réaliserait sans doute que 30 % du travail. Il faut vraiment comprendre l’intention de la phrase écrite.
C’est ce à quoi nous nous attelons : examiner ces documents « papier sur verre » se présentant comme du texte ou des images scannées et tenter d’en déduire une signification numérique.
La figure 2 illustre le processus actuel de transfert technologique qui doit être familier à ceux qui travaillent dans le secteur des sciences de la vie. À gauche, vous avez tous les systèmes qui contribuent à la définition du produit, du conditionnement et du process. Tout cela doit être canalisé à travers un pare-feu et être réceptionné par un groupe de fabrication interne ou de multiples sous-traitants qui doivent interpréter correctement les informations qui les concernent.
Notre mission est de permettre la conversion de ces divers documents scannés ou à base d’images en un ensemble structuré et reproductible qui peut constamment alimenter les systèmes en aval et dont on a supprimé l’élément humain consistant à interpréter l’intention du document. Les données peuvent ensuite être exploitées par tous les partenaires en aval.
Comment procédons-nous ?
Pour accomplir cette mission, il nous faut tout d’abord veiller à ce que les données soient soumises en toute sécurité. Beaucoup d’entreprises communiquent via FTP, courriel, appels téléphoniques et sites Internet, si bien qu’il devient très difficile du point de vue d’une stratégie de contrôle de sécuriser la propriété intellectuelle. Au bout du compte, tout ce qui circule via le transfert technologique représente la propriété intellectuelle de votre entreprise, qui doit être sécurisée et mise à la disposition des bons partenaires au bon moment.
Il ne s’agit pas simplement de convertir les données ; il faut aussi les suivre. Il vous faut une piste d’audit pour savoir exactement, en cas d’événement malencontreux, ce qui a été converti, qui l’a approuvé et l’a validé, qui a reçu les données et qui les a consommées.
Quelqu’un est chargé de la collecte de toutes les informations provenant de tous les différents systèmes utilisés par les scientifiques et les ingénieurs en développement process. Ces informations doivent ensuite être agrégées en un seul document, ou peut-être un ensemble de documents, puis il faut orchestrer le processus de livraison des données à l’unité de fabrication.
Ce qui fait généralement défaut est ce mécanisme d’orchestration et de conversion tel qu’il est développé par Google Translate, qui maîtrise la véritable intention de ce que vous tentez de communiquer via le transfert technologique pour le transformer en quelque chose de prévisible et d’exploitable.
Une fois que les données sont transformées dans un format compréhensible et réutilisable, les systèmes à l’aval n’auront plus besoin de l’intervention humaine pour saisir toutes les informations. Au lieu de cela, l’information est automatiquement transmise au système qui en a besoin.
Notre but est d’utiliser un mécanisme de traitement par langage naturel pour comprendre les documents — le contexte du vocabulaire, la sémantique des mots, l’intention grammaticale — et de faire appel à un algorithme d’apprentissage automatique qui assimile l’intention de chaque document et la convertit en un format structuré ISA 88. Concrètement, le processus consiste à prendre les documents et les coller les uns aux autres avec des données numériques, ce qui aboutit à une construction réutilisable de données numériques, facilement consommables par vos systèmes.
Mais les documents de transfert technologique n’ont pas simplement des données numériques ou textuelles, formatées en tableau ou hiérarchisées. Ils ont aussi des données sous forme d’images. Il peut s’agir d’analyses chromatographiques. Ou de méthodes d’échantillonnage et d’essai. Il s’agit d’ensembles de données non structurés que vous ne pouvez pas aisément convertir en données numériques. Ces ensembles sont néanmoins quelque peu liés à une forme de données numériques, il faut donc pouvoir discerner les différences inhérentes entre les différents ensembles de données enfouies dans le document.
Lorsque vous traitez le document par le langage naturel, l’outil utilisé prend les images scannées et fait appel aux technologies de reconnaissance optique de caractères (OCR) pour en extraire les données. Ou, si le document PDF provient à l’origine de données numériques, l’outil de traitement rétablit ces données.
À ce stade, les données ne sont pas contextualisées. L’outil a simplement extrait les données et il ne fait que constater le volume de données dans le document. La sortie du traitement par le langage naturel recherche des indicateurs clés de manière à pouvoir créer des ensembles de données en tableaux, facilement importables ou consommables par le système en aval.
L’un des avantages de cette approche est la collaboration qu’elle rend possible. Il est très difficile de collaborer avec quelqu’un sur un document PDF si une valeur est mal lue. Comment exprimer cela ? Vous envoyez un courriel disant : « Bonjour, à la page 22, au paragraphe 3, je ne parviens pas à lire une valeur sur la ligne 4 ». Si vous pouvez l’extraire, la couche d’intelligence vous explique ce qui est manquant ou souligne les passages auxquels prêter attention de sorte que vous rendez le processus beaucoup plus efficace.
Choisir une voie
Il existe deux directions possibles. L’une consiste à ne rien changer parce que vous maîtrisez ce que vous faites. Dans le secteur des sciences de la vie, c’est très difficile d’inciter au changement. Vous pouvez ainsi continuer à travailler avec les entreprises de développement et leur confier la production des mêmes documents PDF qu’ils produisent depuis des années, puis faire appel à un traitement par langage naturel pour les convertir en éléments numériques réutilisables et lisibles. C’est une voie possible.
La seconde voie consiste à adopter des outils nativement numériques qui vous permettent de modéliser le process et les matières très tôt dans le processus de développement et de publier nativement les ensembles de données numériques. Nous sommes réalistes et savons que cela prendra des années — voire des décennies — pour que certains domaines du secteur des sciences de la vie adoptent des solutions nativement numériques.
C’est pour cela qu’entre-temps, nous encourageons cette approche bidirectionnelle : démarrer par l’utilisation de la puissance de traitement de l’AI et de l’apprentissage automatique pour convertir les documents en éléments réutilisables, puis au fil du temps, adopter des outils nativement numériques. Le plus gros avantage est l’amélioration de la productivité, mais pas seulement :
- Accélération des essais cliniques, des autorisations de mise sur le marché (variantes) et de la commercialisation
- Réduction du coût global des transferts internes et externes vers la production
- Accélération et plus grande efficacité de la validation des process
- Diminution de la latence du dimensionnement/démarrage de l’usine, des lignes et des équipements de production
- Amélioration de la qualité des lots et réduction des déchets et rebuts
- Accélération des soumissions et approbations réglementaires
- Amélioration de la boucle du concept qualité, du développement à la fabrication, en passant par la conformité
- Amélioration de la traçabilité dans la généalogie des lots (pays approprié, produit approprié)
À propos de Rockwell Automation
Cette entreprise est un leader mondial en matière d’automatisation industrielle et de transformation numérique. Nous connectons l’imagination des gens avec le potentiel de la technologie afin d’élargir le champ du possible, pour un monde plus productif et plus durable. Rockwell Automation, dont le siège social se trouve à Milwaukee (Wisconsin), emploie près de 25 000 personnes au service de ses clients dans plus de 100 pays.