Auteur Message
Administrateur
Avatar de l’utilisateur
Hello,

Pas de panique, ça a l’air abscons, sauf pour les gens qui connaissent; si je poste ici ce n’est pas pour polluer, mais pour référencer une certaine page, ce qui est nécessaire pour l’expérience dont il est question.

C’est une page de teste que les robots du web doivent explorer, et ensuite des requêtes seront faites sur les moteurs de recherche, en utilisant des phrases qui n’apparaissent que dans certaines conditions d’analyse de ce document, pour savoir comment les moteurs de recherche ont analysé ce document.

La capacité que ce test essaie de déterminer, c’est : Oui ou Non, les moteurs de recherche indexent-ils les documents XML après transformation ? Et si la réponse est Oui pour certains, alors lesquels ?

Bon, je colle mon lien ici : test : les robots du web indexent-il les transformation XSLT ?
Profil
Administrateur
Avatar de l’utilisateur
Résultats du teste so far (après 5 mois) : Google indexe le XML sans appliquer la transformation XSLT. Yahoo!, que je suspectait d'être capable d’appliquer la transformation, n’a non-seulement pas indexé le document après transformation, mais n’a même pas non-plus indexé le source XML.

Bref, cette petite expérience n’a révélé rien d’intéressant.
Profil
zen
Modératrice
Avatar de l’utilisateur
Bah ! Si c'est juste pour se débarrasser des bots.... Ils te gênent vraiment ? En fait, en venant ici, le google bot nous fait de la pub sur google. C'est tout de même pas négligeable ! Clin d’œil
Profil
Administrateur
Avatar de l’utilisateur
Non, ce n’est pas pour se débarrasser des robots comme Google ou Yahoo, et même bien au contraire : c’est de mieux les comprendre qu’il s’agit.

J’explique : il y a plusieurs manières de diffuser des documents sur internet. Les plus connus sont les pages web en HTML et les fichiers PDF. Il existe un autre format de diffusion, qui est pour l’instant peu connu des grand public, mais qui a beaucoup d’avantage. Ce format c’est XML + XSLT (pas besoin d’en dire plus ici, il suffit de dire que c’est un format intéressant pour comprendre la question).

Le but de cette expérience lancée il y a cinq mois, était de déterminer si oui ou non les robots (les bons robots, pas les robots de spams) sont capables de correctement interpréter ces documents là.

La réponse est malheureusement non Déçu(e) ou triste

Mais bon, ça va peut-être évoluer dans l’avenir Petit sourire


P.S. La question ne concerne pas le forum spécialement, mais les techniques de publications de documents en général, raison pour laquelle le sujet avait été posté en Sciences.
Profil
zen
Modératrice
Avatar de l’utilisateur
OK mais j'ai eu l'impression dans un de tes postes que les robots te dérangeaient et que tu voulais les empêcher de venir. Je me demandais pourquoi.
Profil
Administrateur
Avatar de l’utilisateur
Je parlais des robots de spams, c’est à dire les pseudos bizarres que tu vois parfois comme dernier membre inscrit (et qui disparaissent quand je les supprime), qui ne s’inscrivent que pour créer un profil bidon et y mettre l’adresse d’un site louche, et éventuellement (plus rarement, car ça leur pose plus de problèmes pour des raisons que je ne détail pas ici) envoyer des mails ou MP de spam.

Ceux il en arrive plusieurs tous les jours ou même toutes les heures, et contrairement aux robots des moteurs de recherche, ces robots là, on se passerait bien de leurs visites.

C’est vrai que parler de robots, c’est vague, il on devrait préciser à chaque fois desquels on parle.
Profil
zen
Modératrice
Avatar de l’utilisateur
Effectivement, ces robots là.... Colère
Profil