IA en tant que service : Infomaniak lance un service LLM de confiance aussi performant que ChatGPT
Le service LLM API marque le lancement de l’IA as-a-Service d’Infomaniak qui va se développer dans les mois à venir. Les entreprises qui traitent des données sensibles peuvent à présent intégrer à leurs applications une IA générative de confiance qui garantit le contrôle des données. Open source, hébergée en Suisse et plus compétitive que ChatGPT, l’IA mise à disposition par Infomaniak est capable de traiter des textes dans de nombreuses langues pour traiter du texte et exécuter des tâches complexes de programmation et d’analyse de données. À la création d’un compte, 1M de tokens sont offerts.
Avec son IA en tant que service, Infomaniak s’engage à proposer la meilleure technologie open source en matière d’IA. Le modèle de langage utilisé au lancement du service est basé sur Mixtral 8x7B, une technologie libre, dont l’algorithme et le fonctionnement peuvent être vérifiés par les ingénieurs du monde entier.
Cette IA générative garantit aux entreprises une maîtrise totale des données et une parfaite conformité à la législation suisse et européenne : les données échangées avec l’IA sont exclusivement utilisées pour le besoin du client. Aucune information n’est analysée ou revendue, les requêtes vers l’IA ne sont pas journalisées et tout est exclusivement hébergé dans l’infrastructure d’Infomaniak en Suisse.
La documentation de l’API permet aux développeurs de facilement intégrer l’IA aux environnements de travail des entreprises pour créer des assistants virtuels, répondre à des questions, résumer, classifier, corriger, générer, traduire ou encore faire de l’analyse de sentiment de contenus par exemple.
Sur le plan environnemental, notre objectif est de fournir des services IA aussi écoresponsables que possible :
- Les activités sont exclusivement alimentées avec de l’énergie renouvelable.
- L’énergie consommée par les services sera intégralement revalorisée grâce à un nouveau dcentre de données.
- Les modèles qui sont efficaces sur le plan énergétique sont favorisés. L’architecture de Mixtral gère 45 milliards de paramètres au total, mais n’en utilise que 12 milliards par jeton, ce qui réduit considérablement la consommation énergétique tout en fournissant des résultats supérieurs à Llama 2 et ChatGPT 3.5.
Les services IA d’Infomaniak vont se développer
La prochaine étape est de permettre aux entreprises de connecter notre IA avec leurs données personnelles pour fournir des réponses 100 % personnalisées.
En parallèle, nous intégrons progressivement l’IA dans tout l'écosystème de l'entreprise :
- Il sera possible de générer le texte de ses articles de blog et de ses pages Web avec Site Creator.
- La plateforme d’hébergement vidéo d’Infomaniak permettra de générer automatiquement les sous-titres de ses vidéos.
- La solution de visioconférence kMeet pourra automatiquement générer un résumé des réunions en ligne.
- Une API speech-to-text viendra prochainement enrichir les services IA.
Traiter des données sensibles avec l’IA
Les données sont à la base des IA. Certains acteurs comme OpenAI ne laissent aucun doute sur l’analyse systématique des données. Chaque information supplémentaire qui est donnée renforce le pouvoir de l’algorithme.
Les IA propriétaires sont une boîte noire. Leur fonctionnement est opaque et il est impossible de savoir par où passent les données, si elles sont sécurisées, comment elles sont et seront utilisées, sur quelle durée, etc. D’autres utilisateurs pourraient potentiellement faire émerger des données privées sur la place publique, totalement par hasard ou en questionnant l’IA…
L’approche d’Infomaniak est claire et transparente :
- Leurs IA se basent sur des modèles open source vérifiables. Il est plus facile de prendre en compte les biais de leurs algorithmes et des données sur lesquelles ils ont été entraînés.
- Pour le moment aucun modèles ne sont entraînés. Seule leur utilisation finale est réalisée par Infomaniak sur une infrastructure de confiance, sans journalisation, ni analyse, ni stockage des données.
- L'offre permet des adaptations spécifiques avec des préprompts ou des restrictions en amont pour éviter l’utilisation de l’IA à des fins malveillantes, comme la génération de courriers indésirables, par exemple.
Comprendre le fonctionnement des IA génératives
« L’IA est une révolution de données. La connaissance scientifique et la puissance de calcul existent depuis longtemps. Ce que l’IA attendait pour se réveiller, c’est la capacité à rassembler des jeux de données de tailles considérables. » explique Swan Blanc, développeur IA chez Infomaniak
Préentraînement : les modèles de langage sont d’abord nourris avec de gigantesques ensembles de données pour apprendre une vaste gamme de schémas linguistiques.
Ajustement : une deuxième phase permet d’adapter finement le modèle sur un ensemble de données plus spécifiques avec des objectifs (classification de texte, compréhension de questions, génération de contenu, etc.) pour le faire converger jusqu’au résultat souhaité.
L’inférence : le modèle passe ensuite dans une mise en application réelle. Sans modifier sa structure interne cette fois, il interprète les nouvelles entrées (nos prompts) en contextualisant grâce aux connaissances acquises dans les phases précédentes. Sa réponse est une distribution probabiliste des mots fondée sur les schémas linguistiques qu’il connaît.
Optimisation continue : le modèle est finalement mis à jour par incréments pour intégrer de nouvelles informations ou des tendances tout en préservant ses connaissances antérieures.