La logique contextuelle et l'intelligence artificielle

1. Introduction

La logique contextuelle Lc est un formalisme logique de la famille de dicto . Proposée par Arnaud Kohler ([Koh95]), elle présente une sémantique non monotone pour modéliser et exploiter, en respectant les règles de production syntaxique de la logique propositionnelle, des informations incomplètes, incohérentes ou modales dans le cadre de la révision des croyances.

Le terme a aussi été employé par Nicolas Gauvrit pour nommer un modèle de logique locale permettant d'élucider certains paradoxes de la logique naturelle [Gau01], et par Yvon Gauthier pour proposer une analogie avec les logiques internes [Gau91].

La logique contextuelle ouvre des questions en Intelligence Artificielle, et plus particulièrement en Sciences Cognitives : en garantissant la cohérence syntaxique de la base de connaissances, Lc simplifie de nombreux sujets. Cela permet par exemples de se concentrer :

L'expression Intelligence Artificielle, ou IA, ne bénéficie pas d'une définition unanimement acceptée. Elle varie notamment selon le but recherché : modéliser un raisonnement humain ou modéliser un raisonnement idéal. Lc propose une sémantique des croyances. Elle se situe donc dans le premier cas, intégrant la modélisation des doutes et des erreurs.

2. La révision des croyances

L'exemple présenté dans les paragraphes précédents apporte quelques instructions :

Un avantage important de Lc est de rester dans les règles de production syntaxique de Lp. Cela lui permet de bénéficier de ses algorithmes.

Ceux-çi ont toutefois une charge des calculs et des temps de réponses non négligeables. Les progrès des technologies réalisés depuis plusieurs décennies repoussent sans cesse le seuil des possibles, mais sans préjuger définitivement de la non existence d'une limite. Les sciences cognitives proposent des solutions à cette difficulté.

3. Les modèles cognitifs

Les recherches autour des modèles cognitifs ont conduit à l'émergence de différents concepts (les définitions ci-dessous sont très succinctes, et font toujours l'objet de discussions) :

Les modèles cognitifs distinguent donc une MLT (contenant l'ensemble des connaissances) d'une MCT (contenant un sous-ensemble "actif" de la MLT. Dans le cadre de l'IA, cette distinction peut être utilisée pour répondre au problème posé par la charge de calcul rencontré par les formalismes logiques en limitant la charge de calcul à un nombre fini de formules.

Pour gérer la définition du périmètre de la MCT, 3 principes reviennent le plus souvent :

Pour être complet, on peut indiquer les travaux de J. Pitrat. Ils laissent à penser que les croyances d'un humain excèdent rarement plus de quatre niveaux de méta-connaissances, supposant l'existence d'un seuil d'incapacité sémantique. En logique contextuelle, cela pourrait se traduire par un rang maximum sur les propositions atomiques.

4. Le modèle cognitif contextuel

Sur ces principes, le modèle cognitif contextuel propose :

  1. le RS est le lieu où est mémorisé l'ensemble des fonctions procédurales,
  2. la MLT contient l'ensemble des formules contextuelles. Elles sont indexées par le RS sur chacune des propositions atomiques qui la composent suivant leur chronologie d'apparition dans la MCT,
  3. la MT contient toutes les formules susceptibles d'être produites par résolution sur la MCT,
  4. la MCT contient un ensemble fini de formules de la MLT. Elle a une taille limitée. Lorsqu'il intègre une formule dans la MCT, le RS efface en fonction des seuils d'incapacité la formule la plus ancienne, et met à jour la MT, la MLT et ses index. La MCT évolue en réaction à une stimulation :
    1. si arrivée d'une connaissance, sous la forme d'une formule cf : le RS vérifie dans la MLT s'il existe une ancienne connaissance c'f en tenant compte des seuils d'incapacité. Il intègre la connaissance (nouvelle ou ancienne) dans la MCT,
    2. si interrogation, sous la forme d'un ensemble de propositions atomiques : le but est alors de trouver une croyance contenant ces propositions pour produire une interprétation sémantique :
      1. si une réponse se trouve déjà dans la MT, le système la produit. Le RS efface de la MCT les formules qui ont participé à la réponse, et les réintègre,
      2. sinon, le RS recherche dans les index de la MLT, en respectant les seuils d'incapacités, des formules construites sur au moins deux des propositions contenues dans l'interrogation :
        1. s'il n'en trouve pas, il produit une réponse d'échec et attend une nouvelle stimulation.
        2. s'il en trouve, il les intègre à la MCT. Il reprend ensuite à l'étape (4.2.1) après avoir ajouté dans l'interrogation les propositions des formules qu'il vient d'extraire de la MLT.

5. Remarques et application

Sur (1), recherche d'une ancienne connaissance : le but est double, ne pas saturer la MLT d'une part, et bénéficier de l'indexation sur le contexte de l'ancienne connaissance d'autre part. L'existence des seuils techniques peut conduire à la création en double d'une croyance, ce qui suppose l'existence d'un mécanisme de nettoyage de la MLT.

Sur (2), indexation des propositions : ainsi, une connaissance a → ( bc) est triplement indexée sur a, b et c. Le RS pourra donc y accéder de trois manières différentes. Et suivant les valeurs des seuils d'incapacités, elle pourra être inaccessible par l'index a mais accessible par l'index b par exemple.

Sur (4.2.1), effacement et réintégration des formules dans la MCT : le but de l'opération est de mettre à jour les différentes indexations.

Sur (4.2.2), recherche sur au moins deux propositions : deux est un choix arbitraire, qui peut être modifié.

Sur (4.2.2.1), constat d'échec : le RS indique qu'il n'a pas trouvé de relation entre les propositions qui formaient l'interrogation.

Sur (4.2.2.2), enrichissement de l'interrogation : il permet au RS d'élargir si besoin sa recherche dans la MLT aux propositions en corrélation avec la question posée.

Sur (4.2.2.2), risque de bouclage infini : un seuil technique peut être défini pour échapper à ce risque.

Ce modèle est simple à implémenter. Les seuils techniques permettent de maîtriser les temps de calcul. Son objectif est d'essayer de simuler des comportements "humains", incluant les erreurs, les oublis, des réponses différentes entre 2 instants, etc.. Les réponses produites dépendent en effet fortement des seuils d'incapacités appliqués et de l'historique du système.

L'ambition du modèle cognitif contextuel est de pouvoir reproduire un comportement comme : De quelle couleur est ce mur ? "Blanc". Que boivent les vaches ? "Du lait". La connaissance Une vache boit de l'eau, incluse dans la MLT, n'est pas automatiquement remontée par le RS dans la MCT... Ce n'est pas la réponse attendue d'un agent absolument rationnel. Mais c'est, bien souvent, la réponse que fournit une intelligence humaine.