Product Overview
Gefran présente GAIA, sa nouvelle plateforme d’IA générative développée en partenariat avec 40Factory, destinée au marché de l’automatisation industrielle.
GAIA est un ensemble de chatbots basés sur une interface en langage naturel, mis en œuvre par l’intégration d’un grand modèle de langage (LLM) tel que ChatGPT.
GAIA est donc capable de converser par écrit ou oralement dans toutes les langues prises en charge par le LLM, soit actuellement 58 dans le cas de ChatGPT.
La caractéristique distinctive de GAIA est son applicabilité directe aux processus industriels, grâce à sa capacité à intégrer le savoir-faire distinctif des constructeurs de machines et des entreprises de fabrication, ainsi que sa facilité d’utilisation tant sur la machine qu’en supervision ou dans les services internes.
Génération augmentée par récupération
La génération augmentée par récupération (RAG) est une technique qui combine des modèles de langage génératifs (LLM) avec des systèmes de récupération de documents.
Pendant la génération, le modèle interroge une base de connaissances externe au LLM pour récupérer les informations pertinentes en temps réel.
Ces informations sont ensuite intégrées à la réponse, ce qui garantit l’exactitude et l’actualité du contenu.
RAG est utile dans les contextes où il est nécessaire de répondre avec des données actualisées ou spécialisées qui ne sont pas présentes dans le modèle LLM qui gère la communication avec l’utilisateur.
En particulier, GAIA est équipé d’un environnement spécifique pour le chargement de documents à l’appui de RAG. Cet environnement permet de spécialiser les bases documentaires en fonction de la nature de la demande (par exemple, marketing, technique, réglementaire, etc.), afin de fournir des réponses pertinentes et précises.
GAIA vous permet également de récupérer les textes originaux qui se cachent derrière chaque réponse, afin de pouvoir les vérifier immédiatement si nécessaire.
Technologie de base : Solution 40Factory basée sur ChatGPT ou modèle en périphérie basé sur Llama
La nature modulaire de GAIA permet une mise en œuvre basée sur différents grands modèles de langage (LMM).
La mise en œuvre standard utilise ChatGPT, ce qui permet de tirer parti de la publication continue de nouvelles fonctionnalités, ainsi que de l’immense puissance de calcul offerte par les modèles full-web.
Imaginez : ChatGPT 4 serait basé sur huit modèles spécialisés, chacun mettant en œuvre environ 200 milliards de paramètres (poids).
Il est également possible de mettre en œuvre GAIA en mode « full edge » (périphérie complète), c’est-à-dire en s’appuyant exclusivement sur les ressources d’un automate ou d’un PC industriel, sans accès à Internet.
Cette architecture est basée sur des modèles de langage de la famille LLaMA (Large Language Model Meta AI), qui peuvent également fonctionner sur des machines dépourvues d’unité de traitement graphique dédiée.
À titre de référence, un modèle LLaMA avec un milliard de poids occupe une mémoire locale de l’ordre de 1 Go.
En outre, il est nécessaire de prévoir l’espace requis pour la mise en œuvre de RAG au niveau local.
Cela signifie qu’une mise en œuvre complète à la périphérie de GAIA doit être axée sur une mission spécifique afin d’atteindre une puissance et une efficacité comparables à celles de la version web (par exemple, un support technique pour résoudre les temps d’arrêt des machines, y compris la documentation technique de la machine et une base de données historique des tickets d’entretien dans RAG).
Toutefois, la nature modulaire de GAIA permet d’utiliser côte à côte des chatbots dans le cloud et des chatbots en périphérie complète (full edge), en fonction du type de requête et de la nécessité d’être utilisable hors ligne.
Intégration de GAIA à G-Mation
La plateforme G-Mation est particulièrement bien adaptée à la mise en œuvre de GAIA en mode cloud et en mode full edge.
Tout d’abord, l’architecture en docker vous permet d’implémenter et de mettre à jour facilement les applications dockerisées de GAIA, même sur des machines déjà sur le terrain.
De plus, l’architecture de serveur Web de G-Mation, grâce à la technologie NGINX, permet de gérer des backends supplémentaires, en plus de celui intégré à l’automate pour le contrôle et la configuration des machines.
En particulier, le back-end contenu dans le docker GAIA vous permet de lancer l’application directement sur le panneau de l’opérateur G-Mation, basé sur une technologie web.
Il suffit d’ouvrir une nouvelle fenêtre dans le navigateur de votre PC.
En ce qui concerne la mise en œuvre basée dans le cloud, la disponibilité d’un VPN dockerisé directement sur l’automate G-Mation vous permet d’accéder à la plateforme cloud GAIA en toute sécurité, sans avoir à passer par des passerelles supplémentaires.
En ce qui concerne l’implémentation en périphérie complète (full edge), les 8 Go de mémoire et l’architecture multicœur de l’UC vous permettent d’effectuer de nombreuses tâches d’assistance à l’opérateur sans affecter le contrôle des machines de quelque manière que ce soit.