<?xml version="1.0" encoding="iso-8859-1" ?>
<rss version="0.92">
	<channel>
    <title>espace-g</title>
    <link>http://espace-g.blog2geek.com</link>
    <description>Blog specialise; geek et geek attitude.</description>
    <language>fr-FR</language><item>
        <title>Vivement que les ordinateurs deviennent intelligents!</title>
        <link>http://espace-g.blog2geek.com/vivement-que-les-ordinateurs-deviennent-intelligents-141.html</link>
        <description>
Un autre enjeu important pour l&amp;rsquo;avenir de Google, et plus généralement pour celui des moteurs de recherche est la sémantique. En effet, les pages sont classées d&amp;rsquo;après des mots-clefs, présents à un endroit où un autre des pages. Ceci est très limitatif car une requête sur le terme « bateau » ne renverra pas de pages qui contiendraient le terme « navire » en lieu et place de « bateau ». 


On constate donc que malgré tous les efforts de pertinence, chaque requête, actuellement, garde sous silence certains résultats adéquats. Il semble que Google ait commencé à ouvrir la voie puisqu&amp;rsquo;on constate que des pages liées entre elles, et de thématiques similaires, sont mieux classées que d&amp;rsquo;autres pages liées, mais avec des thématiques dissemblables (pour ce qui concerne les requêtes correspondantes aux thématiques).


D&amp;rsquo;ailleurs, la sémantique est visible dans Google News. Comment fait Google pour classer les résultats par catégories si ce n&amp;rsquo;est en utilisant des résultats de sémantiques ? Il paraît très probable que chaque page indexée par Google se voit assigner une thématique... ou tout du moins cela semble être une orientation qui sera suivie très prochainement.
</description>
		<pubDate>Fri, 07 Jul 2006 19:44:00 GMT</pubDate>
      </item><item>
        <title>Classement collaboratif</title>
        <link>http://espace-g.blog2geek.com/classement-collaboratif-140.html</link>
        <description>On peut imaginer un autre moyen efficace pour contrer le spam. Il s&amp;rsquo;agirait d&amp;rsquo;utiliser la communauté des internautes pour repérer les sites spammeurs, en prenant en compte les résultats statistiquement probants. Le schéma serait le suivant : 
  un internaute effectue une requête sur Google. 
  il accède à l&amp;rsquo;un des sites indiqué dans les résultats. 
  il consulte la page, et si le site n&amp;rsquo;a rien à voir avec sa requête, il fait un retour à Google. En généralisant ce schéma, à l&amp;rsquo;aide par exemple d&amp;rsquo;un simple bouton sur la Google Toolbar, il serait facile d&amp;rsquo;écarter certains sites. La chose semble idéale si on ne déclasse que les sites qui sont massivement considérés comme étant du spam, et si on ne les déclasse que pour les requêtes correspondantes des internautes. A tout moment un internaute aurait bien sûr la possibilité de revenir sur sa décision (toujours en passant par un bouton, facilement accessible, de la Google Toolbar). Pour éviter la fraude, on écarterait les avis des internautes qui ne sont pas assez actifs, ou trop actifs. De cette façon, l&amp;rsquo;utilisation d&amp;rsquo;un robot pour tricher en délivrant des avis en grand nombre serait vouée à l&amp;rsquo;échec (ou plus difficile). En croisant les algorithmes actuels avec un classement collaboratif, on ne parviendrait pas nécessairement à assainir le web, mais au moins à le faire ressembler à ce que veulent la majorité. Ainsi, la population des internautes pourrait organiser des boycotts de sites et ainsi exprimer sa voix. Un nouvel idéal de démocratie de recherche documentaire pourrait poindre.</description>
		<pubDate>Fri, 07 Jul 2006 19:43:00 GMT</pubDate>
      </item><item>
        <title>Faut-il lutter contre le spam ?</title>
        <link>http://espace-g.blog2geek.com/faut-il-lutter-contre-le-spam--139.html</link>
        <description>Si on supprimait tout le spam de l&amp;rsquo;index de Google, le moteur serait nettement plus pertinent, et on parle de véritable spam et non pas de pages dont le contenu serait faible, mais involontairement. En effet, on trouve par paquets assez larges des sites qui reprennent le contenu d&amp;rsquo;autres sites, voire même des résultats de moteurs de recherche, pour parvenir à être classés dans Google à des rangs très honorables. Existe-t-il un moyen réellement efficace, sans passer par une vérification humaine (impossible, les pages sont trop nombreuses), pour parvenir à supprimer toutes les pages artificielles ? C&amp;rsquo;est difficile à croire. Eventuellement, Google pourrait mettre au point un second index spécialisé non plus dans la recherche pertinente, mais dans la recherche et le classement du spam, et ainsi confronter les deux index. Les pages les mieux classées dans l&amp;rsquo;index spam subiraient une pénalité sur l&amp;rsquo;index normal. Ce serait une manière un peu nouvelle de procéder, on ne filtrerait plus, on mettrait en avant afin de déclasser.</description>
		<pubDate>Fri, 07 Jul 2006 19:43:00 GMT</pubDate>
      </item><item>
        <title>Accessibilité</title>
        <link>http://espace-g.blog2geek.com/accessibilite-138.html</link>
        <description>Le web est en ce moment en phase de transition. En effet, jusqu&amp;rsquo;à présent les sites étaient programmés de manière à avoir le même aspect esthétique sous tous les navigateurs (du moins les navigateurs leader : internet explorer, netscape, firefox, etc...) et être lisibles de manière assez confortable à toutes les résolutions (à partir de 800x600 pixels). Si ces deux règles sont toujours vraies, elles ont été complétées par une réalité de convenance : la séparation de la forme et du fond. Ainsi les mises à jour sont plus simples à faire et nécessitent de moins jongler entre les fichiers. De plus, cette séparation permet d&amp;rsquo;assurer globalement un affichage semblable sur tous les navigateurs (s&amp;rsquo;ils respectent les normes émises par le W3C). A partir de cette séparation, il a semblé évident que le contenu était la pièce maîtresse d&amp;rsquo;une page web, et par conséquent que le graphisme n&amp;rsquo;était pas si important. C&amp;rsquo;est-à-dire que si le support de lecture permet un affichage élégant, tant mieux, s&amp;rsquo;il ne le peut pas, comme un téléphone portable, tant pis, on adapte le graphisme au support. En allant plus loin, on se rend compte que la solution aux barrières du handicap est là. Il devrait être possible d&amp;rsquo;adapter le contenu d&amp;rsquo;une page pour qu&amp;rsquo;un malvoyant, un handicapé moteur, etc.... puisse en prendre connaissance avec confort. Il suffit pour cela de structurer la page à l&amp;rsquo;aide de marqueurs indiquant la nature des éléments et l&amp;rsquo;ordonnancement des paragraphes et des titres. Les menus sont explicites, les liens, tout comme les images, sont pourvus de description concrètes, etc... Cette façon de développer les sites commence à devenir une bonne habitude des webmasters, mais est loin d&amp;rsquo;être généralisée. C&amp;rsquo;est peut-être l&amp;rsquo;occasion pour Google de mettre au point un système qui « obligerait gentiment » à l&amp;rsquo;utiliser. Par exemple, Google pourrait prendre en compte les informations de structures de façon à améliorer le classement des pages (le texte d&amp;rsquo;un lien de menu devrait par exemple être plus pertinent qu&amp;rsquo;un lien simple), voire même favoriser les sites qui utilisent ces nouveaux standards. Google pourrait aussi facilement sensibiliser les internautes à l&amp;rsquo;importance de l&amp;rsquo;accessibilité en proposant plusieurs versions de son cache : audio, couleurs contrastée, et d&amp;rsquo;autres solutions dépendant des différents handicaps existants. Evidemment, le respect de l&amp;rsquo;accessibilité devrait être un devoir citoyen, mais peut-être qu&amp;rsquo;en expliquant tous les avantages qui peuvent en être retirés (les pages accessibles sont la plupart du temps plus légères et donc plus rapides à charger), on parviendra à convaincre. A défaut, un bonus de référencement finira de motiver les plus indécis.</description>
		<pubDate>Fri, 07 Jul 2006 19:43:00 GMT</pubDate>
      </item><item>
        <title>Confidentialité</title>
        <link>http://espace-g.blog2geek.com/confidentialite-137.html</link>
        <description>
Google a souvent affaire à des plaintes concernant la confidentialité de ses services. Pour ce qui est du moteur de recherche, les soucis concerne l&amp;rsquo;indexation de pages censées rester secrète et restreintes uniquement à quelques personnes. Mais parfois la sécurisation technique des pages est mauvaise. Quand les dites pages sont ensuite affichées aux yeux de tous par le biais du moteur de recherche, cela devient très gênant. Cela pose à nouveau le problème de la politique de Google qui est l&amp;rsquo;indexation massive en considérant, par défaut, que les webmasters souhaitent faire référencer leurs sites. C&amp;rsquo;est un raisonnement qui peut se tenir dans la mesure où internet est avant tout un lieu public. On pourrait cependant faire une similitude avec les &amp;oelig;uvres d&amp;rsquo;arts exposées au Louvre, accessible à tous très facilement, et que pourtant on ne peut photographier...


Google a d&amp;rsquo;autres soucis de confidentialité à travers ses publicités contextuelles. En effet, un robot analyse le texte d&amp;rsquo;une page pour ensuite afficher une publicité correspondante. Mais quand on parle d&amp;rsquo;e-mail, ou bien de disque dur, on peut penser que la confidentialité peut être mise à mal. C&amp;rsquo;est sans doute pour remédier à cette faille potentielle que Google Mail et Google Talk ne contiennent aucune publicité. Pourtant, il en a été à chaque fois question avant le lancement du moteur. Sage décision semble-t-il. Pourtant, un logiciel comme Google Desktop pose de réels problèmes de confidentialité. En effet, il garde en mémoire un cache de ce qui se trouvait sur l&amp;rsquo;ordinateur au moment de l&amp;rsquo;indexation (qui se fait par défaut en continu). Même les e-mails sont concernés. Un utilisateur d&amp;rsquo;un ordinateur public, ou multi-utilisateurs peut ainsi être épié de façon indirecte. Pour les logiciels Google proposant des fonctionnalités avancées, il est indispensable, pour pouvoir y accéder, d&amp;rsquo;accepter d&amp;rsquo;envoyer à Google des informations non personnelles. Ces dernières incluent, éventuellement, la liste des sites visités, les habitudes d&amp;rsquo;utilisation du service, etc. Rien n&amp;rsquo;est nominatif, mais connaître parfaitement les habitudes de quelqu&amp;rsquo;un ne serait-ce pas le connaître déjà ? Heureusement, jusqu&amp;rsquo;à présent Google ne semble pas se servir de manières intrusives des informations qui lui sont divulguées. Si jamais cela devenait le cas, il y a fort à parier que les critiques seraient nombreuses, et l&amp;rsquo;image de Google sans aucun doute ternie.
</description>
		<pubDate>Fri, 07 Jul 2006 19:42:00 GMT</pubDate>
      </item><item>
        <title>Trust Google</title>
        <link>http://espace-g.blog2geek.com/trust-google-136.html</link>
        <description>Google varie ses services, c&amp;rsquo;est une chose assez normale pour une entreprise qui est leader de son domaine et qui peut difficilement agrandir ses parts de marché sans changer de domaine. Pourtant, sa position de leader en tant que moteur de recherche est assez dangereuse. Nous l&amp;rsquo;avons vu, il existe de nombreux risque de voir un site être déclassé, que ce soit suite à une mauvaise interprétation des filtres antispam ou d&amp;rsquo;une concurrence qui utilise des procédés réprouvés par Google. Dès lors, tout site qui se verrait supprimer de l&amp;rsquo;index Google et qui ne vend des services ou des biens que par le biais d&amp;rsquo;internet a toutes les chances de mettre la clef sous la porte. La situation est fortement précaire et le trust de Google n&amp;rsquo;est pas une bonne chose, même si on ne peut nier que l&amp;rsquo;entreprise ne se repose pas sur ses lauriers. Introduire une réelle concurrence semble indispensable pour permettre au reste du web de fonctionner de manière plus sereine. Quelques moteurs semblent en être capables. Yahoo Search et Msn Search sont de bons candidats. Le premier est en forte progression dans les pays anglo-saxons et des tests en aveugle semblent le mettre devant Google pour ce qui est de la pertinence. Le second est moins efficace (un récent concours de positionnement : « Sorcier Glouton » paraît mettre les webmasters d&amp;rsquo;accord sur ce point) et a une moins bonne image du fait de l&amp;rsquo;esprit contraire à l&amp;rsquo;open source (très à la mode auprès des internautes les plus assidus) qu&amp;rsquo;il véhicule.</description>
		<pubDate>Fri, 07 Jul 2006 19:42:00 GMT</pubDate>
      </item><item>
        <title>Spam et antispam sont dans un bateau</title>
        <link>http://espace-g.blog2geek.com/spam-et-antispam-sont-dans-un-bateau-135.html</link>
        <description>
Google modifie régulièrement son algorithme de manière à être de plus en plus pertinent. Traquer les sites utilisant des techniques de triches est donc primordial pour lui. Pour ce faire, il existe Google Reports, un outil qui permet de dénoncer les sites fautifs. Apparemment, Google ne supprime pas de manière manuelle les sites incriminés. Il semble plutôt qu&amp;rsquo;à partir de ces sites les ingénieurs mettent au point de nouveaux filtres. La méthode n&amp;rsquo;est pas sans sens puisque par ce biais ce sont potentiellement plusieurs sites qui seront détectés et exclus, plutôt qu&amp;rsquo;un seul qui serait bien vite remplacé par un autre. Mais parfois les filtres génèrent des résultats trop aléatoires. C&amp;rsquo;est ainsi que pendant l&amp;rsquo;été 2005 un vent de panique a saisi de nombreux webmasters. Du jour au lendemain leur site était déclassé de Google, ce qui générait pour certains plus de 60% de baisse de fréquentation, et donc de revenus pour les sites commerciaux. On a appelé ce phénomène le « bourbonnage » car il est intervenu après la GoogleDance prénommée Bourbon. De nombreuses solutions ont été envisagées pour modifier le statut des sites dits « tricheurs ». Mais finalement, peu, ou plutôt toutes ont été efficaces : ne rien modifier, modifier en profondeur, mettre en place du cloacking et des redirections pour éviter d&amp;rsquo;éventuels problèmes de pages dupliquées... Comme rien n&amp;rsquo;a pu être déduit des méthodes utilisées par chacun pour résoudre ce déclassement, une autre explication a pris le dessus... Google aurait mis de côté certains sites sur lesquels il ne savait pas faire la différence entre spam et vrai contenu, en attendant de pouvoir juger... Pourtant, il faut souligner qu&amp;rsquo;en même temps que ce « bourbonnage », l&amp;rsquo;index de Google présentait quelques bugs. Par exemple certains sites retrouvait leur cache tel qu&amp;rsquo;il était six mois avant, ainsi qu&amp;rsquo;un certains nombre de pages anciennement indexées mais n&amp;rsquo;existant plus. Il semble donc plus raisonnable de penser à un bug assez étendu de Google sur cette période, ce qui expliquerait aussi pourquoi tout est rentré dans l&amp;rsquo;ordre après les nouveaux passages de GoogleBot. 
</description>
		<pubDate>Fri, 07 Jul 2006 19:42:00 GMT</pubDate>
      </item><item>
        <title>Faire du cloacking</title>
        <link>http://espace-g.blog2geek.com/faire-du-cloacking-134.html</link>
        <description>Le cloacking est une technique qui consiste à modifier une page web selon la personne (définie par son adresse ip et/ou son user-agent), ou le robot qui la consulte. C&amp;rsquo;est un procédé très répandu pour faire des sites multilingues : on détecte la langue du navigateur, et on affiche les pages correspondantes. Mais c&amp;rsquo;est aussi une façon de présenter au GoogleBot des pages optimisées de façon très lourde. En effet, on n&amp;rsquo;a pas besoin de s&amp;rsquo;occuper de l&amp;rsquo;aspect graphique de la page, ni même du contenu puisqu&amp;rsquo;un internaute ne pourra pas visionner cette page. Il est possible, de la sorte, de fabriquer une page n&amp;rsquo;ayant que des mots clefs pertinents, sans aucun texte parasite, avec un balisage extrêmement réfléchi pour le référencement. Le cloacking peut se faire soit sur l&amp;rsquo;user-agent, soit sur l&amp;rsquo;adresse ip. Dans le premier cas, l&amp;rsquo;internaute pourra déceler la supercherie assez facilement, et donc signaler l&amp;rsquo;abus à Google. Dans le second cas, seul Googlebot parviendra à détecter le problème, ce qu&amp;rsquo;il pourra uniquement faire en modifiant son adresse IP. C&amp;rsquo;est pour éviter d&amp;rsquo;être pris en faute que les webmasters qui pratiquent le cloacking mettent à jour régulièrement la liste des adresses IP de GoogleBot.</description>
		<pubDate>Fri, 07 Jul 2006 19:41:00 GMT</pubDate>
      </item><item>
        <title>Pages satellites</title>
        <link>http://espace-g.blog2geek.com/pages-satellites-133.html</link>
        <description>Un peu à l&amp;rsquo;image du Google Bomb, l&amp;rsquo;utilisation de pages satellites consiste à utiliser une multitude de pages, hébergées sur des serveurs différents, de manière à améliorer le PageRank, et donc le classement, d&amp;rsquo;une autre page. Généralement, les pages satellites sont constituées d&amp;rsquo;un contenu très restreint permettant de se placer dans l&amp;rsquo;index de Google sur la même thématique que la page dont le classement doit être amélioré. Celle-ci est d&amp;rsquo;ailleurs souvent très visiblement présente sous forme de lien, de façon à ne perdre aucun visiteur ; souvent la redirection vers la page « centrale » est automatisé par l&amp;rsquo;utilisation d&amp;rsquo;un javascript (jusqu&amp;rsquo;à maintenant, Google ne prend pas en compte le code Javascript. On peut ainsi rediriger le visiteur, mais pas GoogleBot) ou de la technique du cloacking. Les pages satellites ont pour principal défaut de ne pas se limiter à améliorer le classement d&amp;rsquo;une page. Elles contribuent avant tout à polluer l&amp;rsquo;index de Google qui se voit ainsi fréquemment détenteur de résultats sans réel contenu.</description>
		<pubDate>Fri, 07 Jul 2006 19:41:00 GMT</pubDate>
      </item><item>
        <title>Google bomb</title>
        <link>http://espace-g.blog2geek.com/google-bomb-132.html</link>
        <description>
Google bomb est un terme assez violent pour une méthode qui ne l&amp;rsquo;est pas moins, même si elle reste virtuelle. Le Google bomb consiste à exploiter l&amp;rsquo;algorithme du PageRank. En mettant en place un réseau de liens (à partir de sites et de pages différents) vers une et même autre page, celle que l&amp;rsquo;on souhaite discréditer, et à affecter un texte absurde ou insultant à ces liens. Il existe de nombreux exemples de Google bomb réussis. Par exemple, par le biais de cette méthode, des internautes sont parvenus, sur la requête « miserable failure » à faire sortir par Google, comme premier résultat, la biographie de Georges W. Bush sur le site de la Maison Blanche.


Source principale : http://en.wikipedia.org/wiki/Googlebomb
</description>
		<pubDate>Fri, 07 Jul 2006 19:41:00 GMT</pubDate>
      </item><item>
        <title>Google Match</title>
        <link>http://espace-g.blog2geek.com/google-match-131.html</link>
        <description>
Le GoogleMatch n&amp;rsquo;est pas un service de Google. C&amp;rsquo;est plutôt une manière d&amp;rsquo;interroger le moteur de recherche dont le paradigme est « Entre deux affirmations, celle qui renvoie le plus de résultats dans google est celle qui est vraie ». Des études ont montrées que pour ce qui est de l&amp;rsquo;orthographe, le GoogleMatch permet d&amp;rsquo;obtenir de bons résultats (dans 90% des cas, à choisir entre deux orthographes, dont l&amp;rsquo;une est exacte, Google a plus de résultats pour cette dernière). Cependant, une idée n&amp;rsquo;est pas forcément exacte car elle est populaire. Par exemple, la requête « suicide prisons irlande » contre « suicide prisons utopia » donne des résultats intéressants (4830 contre 20800 résultats en août 2005). On pourrait en déduire qu&amp;rsquo;il y a davantage de suicides en Utopia qu&amp;rsquo;en Irlande. Ce n&amp;rsquo;est évidemment pas le cas puisque Utopia n&amp;rsquo;est pas un pays réel. Dans cet exemple nous sommes capables de déceler l&amp;rsquo;absurdité mais ce n&amp;rsquo;est pas toujours possible. Ceci montre qu&amp;rsquo;il n&amp;rsquo;est pas forcément inutile d&amp;rsquo;avoir du recul pour prendre en compte les résultats de Google, et que même en étant une formidable source documentaire, Google n&amp;rsquo;en est pas forcément une fiable. Dans la majorité des cas le système du PageRank permet de mettre en avant les contenus de qualité, mais il subsiste des exceptions.


Source principale : http://fr.wikipedia.org/wiki/Argumentum_ad_Google
</description>
		<pubDate>Fri, 07 Jul 2006 19:41:00 GMT</pubDate>
      </item><item>
        <title>Spamdexing, c\'est le mal !</title>
        <link>http://espace-g.blog2geek.com/spamdexing-c-est-le-mal--130.html</link>
        <description>L&amp;rsquo;optimisation permet de mieux se positionner sur certaines requêtes. C&amp;rsquo;est un fait. Même si toutes les « astuces » ne sont pas connues parfaitement, celles évoquées permettent d&amp;rsquo;obtenir des résultats satisfaisants sur des requêtes n&amp;rsquo;étant pas trop concurrentielles. Pour les autres, il est nécessaire de faire usage d&amp;rsquo;autres méthodes, souvent moins bien considérées. Entre optimisation et tricherie, il n&amp;rsquo;y a pas beaucoup de marge. D&amp;rsquo;ailleurs, on peut même douter qu&amp;rsquo;il en existe la moindre. L&amp;rsquo;index de Google compte les sites très populaires en tête des résultats, puis viennent non pas les sites « intéressants » mais plutôt des sites optimisés. Il faut optimiser, tricher, pour bien se classer. A chacun de mieux tricher que les autres pour influencer Google. Heureusement, un webmaster passant du temps à optimiser son référencement est souvent un webmaster prenant soin de son contenu. Mais quand ce sont des prestataires extérieurs qui se chargent du référencement, la donne est différente et on se retrouve parfois avec des sites sous forme de coquilles vides, mais très bien classés.</description>
		<pubDate>Fri, 07 Jul 2006 19:40:00 GMT</pubDate>
      </item><item>
        <title>alt aux images</title>
        <link>http://espace-g.blog2geek.com/alt-aux-images-129.html</link>
        <description>
Nous n&amp;rsquo;avons parlé que de texte et de contenu pour le moment. Pourtant, il est souvent nécessaire d&amp;rsquo;afficher des images sur une page internet. On peut inscrire une légende autour, mais ce n&amp;rsquo;est pas tout le temps possible, ou souhaité pour des raisons esthétique. Sans contenu, pas de référencement efficace. Heureusement, il existe un attribut « alt » (à limiter à une phrase de quelques mots seulement) qui, associé au code d&amp;rsquo;insertion d&amp;rsquo;une image, permet de place du texte qui sera analysé par Google.


&lt;img src=&quot;fichier-image.jpg&quot; alt=&quot;texte alternatif&quot;/&gt;


Bien sûr, cet attribut « alt » n&amp;rsquo;est pas, à l&amp;rsquo;origine, destiné à Google. Il sert à délivrer de l&amp;rsquo;information aux internautes naviguant sans afficher les images. C&amp;rsquo;est un texte alternatif. Par exemple, grâce à lui un internaute malvoyant peut, par le biais d&amp;rsquo;outils de lecture de pages web adaptés, obtenir un court résumé de l&amp;rsquo;illustration qu&amp;rsquo;il ne peut pas percevoir correctement.


Il est donc indispensable de s&amp;rsquo;attacher à toujours conserver du sens dans l&amp;rsquo;attribut « alt », même si le référencement s&amp;rsquo;en trouve moins bon qu&amp;rsquo;il ne pourrait l&amp;rsquo;être.
</description>
		<pubDate>Fri, 07 Jul 2006 19:40:00 GMT</pubDate>
      </item><item>
        <title>Savoir rediriger correctement</title>
        <link>http://espace-g.blog2geek.com/savoir-rediriger-correctement-128.html</link>
        <description>
La plupart des sites internet proposent des contenus qui se renouvellent (l&amp;rsquo;exemple parfait est le site d&amp;rsquo;information), se réecrit, mais parfois aussi se détruit. Souvent ce ne sont que quelques pages... Mais là où il existait un rang dans Google pour une page donnée, on trouve simplement un vide. Google conservera tout de même la page dans sa base de données quelques semaines. Cela permettra aux internautes de la consulter via le cache de Google, ou bien parfois à Google de la réindexer si elle est remise en ligne dans des délais raisonnables. Si le webmaster du site ne souhaite pas remettre sa page en ligne, il a tout intérêt à faire le nécessaire pour conserver l&amp;rsquo;intérêt déjà décerné par Google, et celui de son visiteur. Ainsi, il peut mettre en place une redirection pour faire profiter une nouvelle page de la popularité de l&amp;rsquo;ancienne. C&amp;rsquo;est-à-dire que lorsque qu&amp;rsquo;un internaute, ou le Googlebot, demandera l&amp;rsquo;accès à la page supprimée, le serveur renverra une autre page à la place. Habituellement, on renvoit vers une page indiquant que la page n&amp;rsquo;est plus disponible et on place un lien vers la page d&amp;rsquo;accueil du site. Mais pour plaire à Google, mieux vaut rediriger vers un plan de site en indiquant non pas que la page n&amp;rsquo;existe plus, mais qu&amp;rsquo;elle a été déplacée définitivement. La mise en place des redirections peut se faire de deux manières, en fonction des capacités du serveur. La première utilise le php ou l&amp;rsquo;asp... ou tout autre type de langage de programmation dynamique orienté web. La seconde utilise un fichier .htaccess que l&amp;rsquo;on place à la racine du site web. La technique utilisée n&amp;rsquo;a aucune importance, c&amp;rsquo;est pour cela qu&amp;rsquo;on les laisse sous silence. Ce qu&amp;rsquo;il faut retenir, c&amp;rsquo;est le type de code d&amp;rsquo;erreur http que l&amp;rsquo;on envoi au navigateur de l&amp;rsquo;internaute, ou à Googlebot. Seuls trois codes nous intéressent.


404 : la page demandée n&amp;rsquo;existe pas


Le code d&amp;rsquo;erreur 404 est à éviter. Il indique que la page n&amp;rsquo;existe plus. Si on redirige vers une page d&amp;rsquo;erreur personnalisée, celle-ci risque d&amp;rsquo;être pénalisée par Google, ou dans la plupart des cas, non indexée.


302 : document déplacé de façon temporaire


Le code d&amp;rsquo;erreur 302 est idéal pour rediriger vers une page indiquant une indisponibilité. Il ne doit être utilisé que dans l&amp;rsquo;optique d&amp;rsquo;une remise en ligne de l&amp;rsquo;ancienne page.


301 : document déplacé de façon permanente


Le code d&amp;rsquo;erreur 301 est celui qu&amp;rsquo;il convient d&amp;rsquo;utiliser pour ne pas perdre le bénéfice d&amp;rsquo;une page indexée par Google mais que l&amp;rsquo;on souhaite faire disparaître. Il indique que la page a changé d&amp;rsquo;url. En réalité la page n&amp;rsquo;existe plus, mais Google ne peut pas le détecter. On redirige donc vers un plan de site, ce qui permet de ne pas perdre l&amp;rsquo;internaute et de faire profiter le site de la popularité de l&amp;rsquo;ancienne page.


Il faut s&amp;rsquo;assurer qu&amp;rsquo;en cas de disparition de plusieurs pages l&amp;rsquo;url du plan de site est le même, sinon, on risque d&amp;rsquo;être pénalisé par Google pour la présence de plusieurs page identiques.
</description>
		<pubDate>Fri, 07 Jul 2006 19:39:00 GMT</pubDate>
      </item><item>
        <title>De l\'importance des titres et des urls pour google</title>
        <link>http://espace-g.blog2geek.com/de-l-importance-des-titres-et-des-urls-pour-google-127.html</link>
        <description>
Le titre de la page est un élément primordial d&amp;rsquo;une page internet. Il doit être assez précis pour permettre de résumer en quelques mots la globalité de la page. Tout naturellement Google le prend en compte de manière très forte. Il est indispensable de le rédiger avec attention : une courte phrase, voire même, si possible, une association de seulement quelques mots, sera le gage de voir la page être mieux classées sur les mots choisis. Plus le titre est long et plus la pertinence est diluée entre les mots. Supprimer les articles et les termes parasites permet d&amp;rsquo;éviter ce phénomène. Le plus difficile est d&amp;rsquo;obtenir un bon compromis entre pertinence pour Google et intérêt du titre pour l&amp;rsquo;internaute. Il ne faut pas oublier que le titre est un élément affiché dans les résultats de recherche de Google. S&amp;rsquo;il est trop peu explicite, la page risque, bien qu&amp;rsquo;étant bien classée, de ne pas attirer les clics des internautes.


Le titre doit être indiqué dans la partie de la page sous la forme suivante :


&lt;title&gt;titre de la page&lt;/title&gt;


Un autre élément joue en quelque sorte le rôle de titre de la page. Il s&amp;rsquo;agit de l&amp;rsquo;url. En effet, Google détecte les mots-clefs présents dans celle-ci. Il est donc très intéressant de rendre l&amp;rsquo;url explicite. Par exemple, au lieu de nommer une page « page01.html », il est préférable de l&amp;rsquo;appeler « legislation-travail.html » si on souhaite positionner la page sur ces termes. Les caractères séparateurs de mots dans les urls sont : « / », « , », « . », « - ». Il en existe sans doute d&amp;rsquo;autres, mais bien moins explicites. Les séparateurs ne doivent être utilisés que si l&amp;rsquo;on souhaite se positionner sur les mots clefs indépendamment. Par exemple, pour améliorer son référencement sur la requête « artiste peintre », il est préférable de mettre en place l&amp;rsquo;url « artiste_peintre.html » (le caractère « _ » n&amp;rsquo;est pas un séparateur) plutôt que « artiste-peintre.html ». Mais dans la plupart des cas, seuls des tests permettront de connaître la meilleurs combinaison. Il faut toutefois éviter d&amp;rsquo;aligner plus de cinq mots-clefs dans une url au risque d&amp;rsquo;être pénalisé par Google.
</description>
		<pubDate>Fri, 07 Jul 2006 19:39:00 GMT</pubDate>
      </item>		</channel>
</rss> 
