Débats

Google, les données structurées et l’avenir !

Par 3 juin 2014 1 commentaire

Google est en évolution constante

Depuis début avril Google a rajouté de nouvelles cordes à son arc : il comprend de mieux en mieux les pages web par une analyse plus fine du code qui les génère.

Recherchez votre bar préféré dans le moteur de recherche, Google vous fournit directement un plan, les coordonnées, les heures d’ouvertures.

Page de résultats pour le bar "Nul Bar Ailleurs"

Page de résultats pour le bar « Nul Bar Ailleurs »

Et peut même mettre en avant des données plus fine, telles qu’un menu.

Code pour indexer un menu

Code pour indexer un menu

Pour ce faire, il suffit de lui donner les informations de la bonne manière, il fera le reste.

Knowledge Graph

Tout cela est devenu possible grâce au Knowledge Graph, méthode pour structurer les informations entre elles. D’abord basée sur les connaissances de Wikipédia et Freebase, qui sont des bases de connaissances structurées, le Knowledge Graph est maintenant alimenté par les informations que collectent les bots directement le code des sites internet.

En bref, pour un peu que votre site soit structuré correctement et contienne des balises structurantes pour le contenu, Google le comprend parfaitement, l’indexe de manière pertinente, et met en avant les éléments clés dans sa page de résultats.

Pour l’internaute c’est merveilleux, tout lui est servi sur un plateau via la page de résultats Google, même plus besoin de cliquer et d’aller chercher l’information dans la page qui la contient, tout est là, devant lui.

Il a même plus que ce qu’il cherche grâce à l’inclusion des autres services Google dans la page de résultat (Voici un exemple grâce à l’article : Youtube intégré au Knowledge Graph).

Les 3 talents de Google pour être pertinent sur les requêtes :

Comprendre le contenu des pages

Requête "fruits" dans Google

Requête « fruits » dans Google

Depuis leur création, les moteurs de recherche s’évertuent à comprendre le contenu des pages. Les premiers moteurs lisaient les mots clés définis dans la balise « Keywords » et déterminaient leur classement en partant de cela.

Ensuite, les moteurs ont réussi à comprendre les mots importants dans les pages WEB et en déduire les mots et expressions clés pertinentes.

Maintenant il y a énormément de critères utilisés pour positionner une page sur une requête. Le point intéressant est qu’aucun moteur ne comprenait le texte qui était dans la page, ils utilisaient les mathématiques pour faire émerger les termes importants dans les textes. Mais ces termes ne sont que des chaines de caractères, ils n’avaient pas de sens pour un moteur comme ils en auraient pour un humain.

Maintenant, ces chaines de caractères ont un sens. Le balisage sémantique inséré dans les pages donne des définitions à son contenu.

Lorsque vous tapez « fruits », Google est capable de vous donner des informations relatives aux fruits directement dans la page de résultats, chose impossible avant la mise en place du knowledge graph et des données structurées.

Les balises sont, à l’heure actuelle, insérées par des humains, développeurs ou personnes éditant les contenus, selon des conventions déterminées principalement par Schema.org, de même que la structuration des connaissances dans Wikipédia (fortement utilisée par Google dans le Knowledge Graph) n’est pas automatique, elle suit des règles et des schémas imposés.

Dans l’ensemble des processus de construction et de structuration de la connaissance, l’intervention humaine est nécessaire. Cependant, la compréhension d’une page WEB pour Google en devient de plus en plus fine.

Faire des liens entre les contenus

La structuration des connaissances est le socle pour avoir la capacité de faire des liens. De là, Google devient capable de faire des liens entre les contenus et cela sans intervention extérieure. Il repère des connaissances qui ont été structurées par des humains, sur diverses pages du WEB, dans divers type de contenus (images, vidéos, …) et les met lui même en relation.

Pour imager, prenons l’acteur « Andrew Garfield » : Les bots de Google parcourent les sites Internet et récupèrent des fragments d’informations sur lui

  • Les films dans lesquels ils jouent, ainsi que les autres acteurs et les réalisateurs sur Allociné ou Première.fr
  • Le nom de sa compagne dans les page People de site de type Paris Match
  • Sa date de naissance sur Wikipédia
  • Des photos de lui un peu partout
  • Des vidéos de lui en train de chanter sur le site du Saturday Night Live et sur Youtube

L’ensemble de ses informations sont insérés dans le Knowledge Graph et reliées à un point central « Andrew Garfield »

Répondre à vos questions (vos requêtes)

Le but ultime de Google est de vous fournir les informations que vous recherchez et aussi, celles que vous ne cherchez pas qui pourraient vous interesser.

Grâce sa capacité à relier des connaissances, Google enrichit considérablement les réponses qu’il fournit aux utilisateurs. Il vous fait accéder aux contenus qui vous intéressent ainsi que des contenus proches.

Si vous cherchez un acteur (Au hasard : « Andrew Garfield »), le moteur vous met les films dans lequel celui-ci apparait, ses partenaires sur le tournage et sa date de naissance. Si vous cherchez un chanteur, il vous proposera les clips disponibles.

Google, les balbutiements d’une intelligence artificielle ?

Google dialogue avec nous, à chaque question que nous lui posons, il propose des réponses pertinentes, et en plus devient pro-actif. En nous suggérant de l’information,  Google nous demande implicitement « Ne cherches tu pas quelque chose de plus précis ? ». Chaque fois que nous cliquons sur des liens que que Google proposent, nous lui répondons « Oui je cherchais cela, merci ! ». En répondant, nous envoyons une information qui va s’agréger à celles de tous les internautes, alimentant les statistiques et renforçant les capacités de Google de comprendre nos comportements sur une page de recherche, donc de répondre plus pertinemment.

Dans les faits, Google apprend de nous, chaque interaction le rend de plus en plus intelligent, plus pertinent et lui permettra d’être en avance de phase sur nos futurs besoins d’informations.

Cependant cela ne serait pas possible sans ce travail autour de la connaissance. Il est le fondamental pour créer les services de demain, positionné autour du dialogue homme/machine et du soutient de l’humain par les ordinateurs.

Il y a fort à parier que Google est en train de créer la première intelligence artificielle accessible à tous.

Join the discussion 1 Commentaire

Laisser une réponse