Le web semantique

Qu’est-ce que l’IA apporte au web sémantique

Le web sémantique permet à la machine de comprendre le langage humain et de le contextualiser. L’objectif de cette technique de l’IA est d’interconnecter les données du web mondial.

Importance du web sémantique

Le web a connu 3 grandes phases dans son évolution : le web1.0 purement consultatif, le web 2.0 à base d’interactions sociales entre les utilisateurs pour leur permettre de collaborer et le web 3.0 ou web sémantique qui doit permettre aux machines de collaborer.

Le web sémantique vise à rendre les données lisibles par toutes les machines, quelle que soit la technique qui la stocke, en découplant les données de leur format de codage (Oracle, MySQL, etc.). Il s’agit donc de créer un standard d’interopérabilité technique tout en décrivant la signification des données.

La notion de web sémantique est aujourd’hui au cœur du travail de référencement naturel d’un site internet. Elle doit être intégrée dès la création du site ou lors de sa refonte.

Les robots des moteurs de recherche étudient l’affinité sémantique des différents termes pour déduire la thématique générale d’une page et pour la faire sortir dans les résultats de recherche. Ces robots pourront associer l’univers sémantique d’une page web à des requêtes précises s’ils sont capables de l’identifier facilement.

Les Ontologies

Les ontologies

L’ontologie est une représentation des propriétés du monde réel dans un formalisme permettant un traitement informatique. Elle constitue un ensemble structuré de concepts qui permet de donner un sens aux informations. Son but est de modéliser des connaissances dans un domaine donné.

Par exemple, si on tape «vénus» sur Google, la machine doit pouvoir reconnaître s’il s’agit de la Vénus de Milo, de la marque de rasoir Vénus ou de la joueuse de tennis Vénus Williams. Les ontologies permettent ainsi de contextualiser la donnée.

Contextualiser et filtrer sont deux actions indissociables. L’intelligence artificielle permet de produire des contextes qui vont générer des filtres. Le web 3.0 est en réalité un web des contextes qui permet de catégoriser et de trier de la donnée pour faire apparaître de nouveaux modèles de filtrages. Dans le domaine de l’analyse du web et des réseaux sociaux, les filtres existants sont à l’évidence dépassés.

Le web accueille chaque seconde des centaines de milliers de données. Il est inefficace de vouloir exercer une veille pointue et professionnelle sur un sujet sans une aide contextuelle, des recommandations, etc. La combinaison du Big Data, de l’intelligence artificielle et du web sémantique va apporter des solutions innovantes et efficaces aux recherches sur internet.

Son fonctionnement

On a normalisé les choses sur internet pour optimiser le web sémantique en proposant un empilement des ressources :

  • L’adresse où se trouve la donnée (URI) sur le web
  • Le RDF (Research Definition Framework) (en anglais) qui va permettre de définir les structures décrivant nos données (triplet sujet/verbe/Complément)
  • Le RDFS qui modélise les définitions de données (signification de ce que la donnée veut dire)
    Ontlogy web language qui utilise les vocabulaires permettant de décrire le contexte de la donnée
  • Le SparQl, un langage de requête qui va permettre d’aller chercher l’info dans le serveur qui détient la donnée

Pour comprendre le fonctionnement, on peut par exemple trouver sur internet que Sergio Léone est le réalisateur du film « Pour une poignée de dollar». Dans ce résultat, on va par ailleurs trouver que Clint Eastwood a tourné dans ce film. Le moteur d’inférences va permettre de déduire que Sergio Leone a dirigé Clint Eastwood. Cet enchainement constitue une forme d’Intelligence Artificielle.

Fonctionnement

D’autres articles sur le même thème

Systèmes experts

Les systèmes experts (ou moteurs de règles) sont une technique de l’IA

Système multi agents et IA Distribuée

Le domaines complexes et hétérogènes tels que l’aide à la décision dans des situations subtiles, la reconnaissance et la compréhension de formes dans des environnements mouvants

La résolution de problèmes

Les recherches et applications business sur l’IA sont intenses, ce qui accélère les innovations et l’évolution des algorithmes intelligents.

Le chaine TAL

L’Intelligence Artificielle se caractérise par une approche nouvelle dans le traitement informatique des problèmes.

Le machine learning

« Il n’y a pas d’intelligence sans apprentissage », affirme Yann Le Cun, patron de l’Intelligence Artificielle (IA) chez Facebook. C’est dans cette logique que s’inscrit le machine learning.

Les réseaux neuromaux

De nos jours, on ne peut pas parler de machine learning sans parler de réseau de neurones artificiels, un ensemble d’algorithmes dont le fonctionnement est inspiré des neurones biologiques