Les résultats de recherche sur Internet sont de plus en plus parasités par du spam. Le fléau ne se limite pas en effet aux seules messageries électroniques et vient altérer les résultats des moteurs. Les différentes techniques de fraude mises en uvre par les Web spammeurs visent à améliorer artificiellement leur référencement et à générer des revenus publicitaires. Deux chercheurs en cybercriminalité de Microsoft associés à deux confrères de l'Université de Californie se sont penchés sur le phénomène.
Intitulée "Spam double funnel : connecting web spammers with advertisers", l'étude lève en partie le voile sur les techniques employées et les compagnies impliquées dans ce lucratif business du spam sur Internet. Les publicités d'entreprises réputées se retrouvent ainsi souvent en ligne sur des domaines clairement identifiés comme appartenant à des spammeurs, tels que vip-online-search.info, searchadv.com, et webresourses.info.
Pour les chercheurs, le mécanisme serait le suivant : un annonceur fait ainsi appel aux services d'un intermédiaire, un syndicator, Google AdSense par exemple. Ce dernier va ensuite acheter de l'espace sur des pages Web auprès d'un agrégateur, qui lui achète du trafic à des spammeurs. Ceux-ci, pour générer de la fréquentation et des revenus publicitaires, vont accroître leur référencement dans les moteurs de recherche via de fausses pages et faire de la redirection, ou en insérant en masse des Url sur des commentaires de blogs ou de forums.
En chiffres, ces pratiques se traduisent par une densité de spam moyenne de 11%. C'est-à-dire que 11% des pages remontées sur les requêtes, portant sur 1 000 mots-clés, étaient du spam. Les chercheurs ont identifié les principales catégories de mots-clés visées par ces procédés de référencement artificiel. Par ordre décroissant il s'agit ainsi des médicaments, des sonneries de téléphone et des services pour adultes, avec des taux respectifs de spam de 30,8%, 27,7% et 14,2%.
Au niveau des noms de domaine, le .info apparait comme une source importante de spam puisque 60% des pages en .info remontant lors des requêtes conduisent à des sites de spam. Le taux est de 53% pour les .biz. Suivent .net avec 12% et .org avec 11%. Seulement 4,1% des pages ont une extension en .com.
Pour les chercheurs, les services de blogs ont permis une véritable explosion du spam. Il est en effet aisé pour les spammeurs d'automatiser l'insertion d'Url dans des commentaires ou trackbacks (rétroliens). Et l'ouverture aux internautes de blogs par de plus en plus de sites Internet, comme ceux d'informations, accentue encore l'ampleur du phénomène.
Un service en ligne philippin (Newsbreak) a ainsi identifié 27 000 liens sur son site pointant vers des pages Web pour adultes. Seules solutions pour les administrateurs, désactiver la fonction trackback et imposer une inscription préalable aux internautes souhaitant poster des commentaires.