Tuesday, May 02, 2006

Arcani Fattori di Spam

Spamdexing o search engine spamming è la pratica con cui si deliberatamente si creano pagine web che verranno indicizzate dai motori di ricerca per incrementare la possibilità di un sito di essere visibile e posizionato tra i risultati di una ricerca.

Spamdexing si riferisce esclusivamente a pratiche disoneste che ingannano i motori di ricerca dando ad una pagina un ranking che non merita. Le tecniche “white Hat” per creare un sito ottimizzato per il posizionamento sui motori di ricerca, senza ingannare il processo di indicizzazione, sono conosciute come Search Engine Optimizations (SEO).

I search engine spammers, al contrario, sanno generalmente che il contenuto che promuovono non è veramente utile o rilevante al popolo dei navigatori di internet.


Leggiamo da Wikipedia:

La nascita e la crescita dello spamdexing, nella metà degli anni 90, danneggiò l’utilità dei motori di ricerca del tempo, e fece il successo di Google che produceva i migliori risultati combattendo il “keyword spamming” attraverso il suo sistema di analisi dei collegamenti PageRank PageRank determinò il successo di Google, facendolo attestare come motore di ricerca più usato al mondo.

Nonostante le elevate risorse e tecnologie per combattere lo spam, anche Google non è immune da eventi indesiderati: il Google Bombing è una forma di SPAM che consiste nel creare pagine con collegamenti mirati capaci direttamente di incrementare il rank di altri siti.

I motori di ricerca usano una varietà di algoritmi per determinare il posizionamento a seguito di una certa ricerca.

Content SPAM
Queste tecniche servono per alterare la visione logica che un motore di ricerca ha dei contenuti di una pagina

Sono tutte tecniche basate sulla variazione del vector space model per il recupero delle informazioni da collezioni di testi.

Link SPAM
Lo spam dei link dovrebbe portare vantaggi negli algoritmi di valorizzazione basati sui link, come il PageRank di Google che funziona principalmente sulla quantità dei link che puntano a un certo documento. Queste tecniche sono usate anche per influenzare quegli algoritmi di valorizzazione come HITS

No comments: