En 2023, le dictionnaire anglais Cambridge a désigné hallucinate (halluciner) comme « mot de l’année » dans le contexte de l’intelligence artificielle (IA). Un système d’IA qui hallucine produit de l’information partiellement ou complètement fausse en la présentant comme si elle était authentique et correspondait à la requête.
La reconnaissance officielle du terme en dit long sur ce phénomène, qui peut étonner quand on pense aux prouesses d’outils comme ChatGPT. Mais le fait est qu’on ne peut jamais se fier entièrement au contenu créé par l’IA générative. La même prudence s’impose avec les outils d’IA de traduction. Tous les outils ont des hallucinations, souvent difficilement repérables. Nous voulons ici vous aider à mieux comprendre le problème, ses conséquences et les façons de vous protéger.
Comment surviennent les hallucinations
Malgré leur appellation, les outils d’intelligence artificielle ne réfléchissent pas. Leurs algorithmes fonctionnent à partir de corpus de contenus existants, dont ils extraient la réponse la plus probable à une question ou la traduction la plus probable d’un terme ou d’une phrase. Plus une combinaison de mots apparaît souvent dans son corpus, plus l’algorithme la choisit de préférence à d’autres combinaisons moins fréquentes.
L’immensité des corpus fait leur force, mais aussi leur faiblesse. Pour les outils d’IA publics, des masses de contenus originaux ou traduits sont recueillies partout sur Internet sans vérification. Il y a beaucoup d’erreurs linguistiques ou factuelles, de fausses informations, de stéréotypes, de manques d’uniformité, etc. C’est l’une des causes des hallucinations.
Autre cause importante : aucun corpus n’est exhaustif. Il y a des mots ou des combinaisons de mots que les outils d’IA n’y trouveront pas : formulations rares ou complexes, propos humoristiques, expressions familières, noms propres de personnes ou de produits, etc.
Que fait un outil s’il ne trouve pas de repères fiables dans son corpus pour bien prédire une réponse ou une traduction?
Un outil d’IA générative explique parfois qu’il manque d’information pour répondre. Mais il peut aussi halluciner et formuler une réponse inexacte sans aucune indication d’incertitude, comme si tout était vrai et fiable. Les conséquences peuvent être cocasses… ou absolument désastreuses.
Un exemple d’hallucinations graves en IA générative
En 2023, un avocat de New York a présenté à la cour un dossier truffé de fausses citations et d’allusions à de faux jugements attribuables à des hallucinations de ChatGPT. Cette histoire a créé des remous jusqu’à la Cour Suprême des États-Unis.
Les hallucinations sont aussi réelles en IA de traduction. Un outil qui ne trouve pas de traduction sûre ne peut pas vous prévenir ni vous consulter pour bien interpréter un passage. Il laisse parfois des parties de texte non traduites. Mais en général, il propose une traduction qui risque d’être factuellement erronée même si elle est linguistiquement exacte.
Trois exemples d’hallucinations en IA de traduction
Prendre la route avec un véhicule non déneigé ou couvert de glace peut entraîner des amendes.
Driving a vehicle with no snow or ice on it can result in fines.
Même si elle est bien formulée et semble exacte au premier coup d’œil, la traduction dit que l’absence de neige ou de glace sur un véhicule peut entraîner des amendes. C’est exactement le contraire de ce que dit le message original.
Auto theft is surging in Canada—and according to a recent report from Équité Association, it’s adding up to more than $1 billion in insurance claims.
Le vol d’automobiles est en hausse au Canada et, selon un rapport récent d’Équité Association, il s’agit d’un crime contre l’humanité qui représente plus d’un milliard de dollars en réclamations d’assurance.
L’outil ajoute que le vol d’automobiles est un crime contre l’humanité, ce qui ne fait absolument pas partie du contenu original et qui transforme radicalement le message.
Discover the econ-friendly cities that excel in sustainability and create a better future for all.
Découvrez les villes respectueuses de l’économie qui excellent en matière de durabilité et créent un avenir meilleur pour tous.
Le message original fait allusion aux villes respectueuses de l’environnement (eco-friendly). Mais à cause d’une simple coquille dans le mot (econ-friendly), l’outil fausse le sens de toute la phrase en faisant allusion à des villes respectueuses de l’économie.
Les risques et leurs conséquences
Voici trois conséquences concrètes de diffuser des contenus contenant des hallucinations.
INEXACTITUDE
Dans le cas d’information inexacte, les organisations ou les personnes risquent de prendre de mauvaises décisions parfois graves.
DÉSINFORMATION
Dans le cas d’énoncés mensongers, c’est le dangereux problème de la désinformation qui s’aggrave dans notre société.
STÉRÉOTYPES
Les stéréotypes présents dans les corpus d’époques révolues peuvent produire des contenus contraires aux valeurs actuelles et perpétuer la discrimination.
Traduction par IA : comment vous protéger
Les entreprises langagières professionnelles comme Versacom offrent une solide expertise en traduction par IA et en élimination des risques liés aux hallucinations. Deux protections essentielles font partie de leur offre de services.
1 – Optimisation du choix et de l’utilisation des outils
Les entreprises langagières professionnelles utilisent les meilleurs outils d’IA, rigoureusement testés et intégrés à leur infrastructure sécurisée. Elles peuvent vous offrir des outils spécialisés et entraînés avec des contenus exclusifs, pertinents pour votre organisation et révisés par des ressources langagières qui connaissent votre domaine.
2 – Révision professionnelle
Des équipes spécialisées en révision de contenus traduits par IA assurent l’absence d’erreurs qui découlent d’hallucinations, parfois presque indétectables.
Versacom est le partenaire par excellence de votre réflexion sur la traduction par IA et son utilisation efficace et sûre. Nos spécialistes en services langagiers, en gestion et en technologies vous garantissent les meilleurs résultats et le maximum d’économies.