Los objetivos del spammer
Muy claro: tener una enorme cantidad de visitas que abran muchas páginas en su web. Todos los webmasters que encontraron un link en su listado de referrers y que buscan el link desde donde les "mandan las visitas".
Un segundo objetivo lo alcanzan en los casos en que las estadísticas de nuestro sitio sean públicas: hacer que en cientos o miles de páginas de terceros (en sus estadísticas públicas) aparezcan links hacia su sitio. Y todos sabemos el beneficio que esto implica para el posicionamiento en buscadores, y en particular en Google, donde esta situación se reflejará tarde o temprano en el pagerank del spammer.
Las técnicas del spammer
Encontré swoftware para realizar esta fechoría. Pero como mi objetivo no es promocionar esta técnica (ni este software, por supuesto), no lo mencionaré en este artículo. Pero sí voy a describir cómo es que funcionan estos programas.
En principio, el trabajo del spammer se divide en dos partes:
El punto 1 parece ser obvio: se puede usar la información de buscadores o directorios en la web para obtener una lista de víctimas. También es posible poner a funcionar un crawler (un software de indexación que navega en la web siguiendo los links hacia otros sitios, y de ahí a otros, y otros más... de esta forma construyen sus bases de datos los buscadores).
En la mayoría de los casos, estos sistemas buscan sus víctimas en el DMOZ (Open Directory). Se ha comprobado una relación directa entre la figuración de una web en DMOZ y la recepción de spam de esta naturaleza.
El punto 2 es el verdadero "secuestro": un software especialmente diseñado "visita" cada una de las páginas de la lista, enviándoles una petición HTTP manipulada:
GET / HTTP/1.1
Host: www.estadisticasweb.com
Referer: http://www.soy-un-sucio-spammer.com/
User-Agent: Mozilla/5.0 Galeon/1.2.0 (X11; Linux i686;) Gecko/20020
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*
Accept-Language: en-us, en
Accept-Encoding: gzip, deflate, compress;q=0.9
Accept-Charset: ISO-8859-1, utf-8;q=0.66, *;q=0.66
Keep-Alive: 300
Connection: keep-alive
Este es el tipo de petición que envía nuestro browser cuando seguimos el link desde el sitio soy-un-sucio-spammer.com Y eso es lo que registra nuestro servidor: la URL www.soy-un-sucio-spammer.com nos acaba de enviar una visita.
Otra variente de esta técnica consiste en un crawler que realiza los pasos 1 y 2 en uno solo: cuando "abre" nuestra página para seguir los links hacia páginas de otras víctimas, ya nos está mandando el campo "Referer: http://www.soy-un-sucio-spammer.com/" modificado. De esta forma es mucho más rápido, y el spammer se puede dar el gusto de secuestrar varias decenas de sitios web por segundo (10 a 40 sitios web por segundo típicamente: la carga se limita sólo al texto excluyendo las imágenes de modo que el spammer gana tiempo y ahorra ancho de banda).
Qué podemos hacer para evitarlo
Existen múltiples aproximaciones, ya que estamos en una etapa muy temprana del problema. Analizaremos algunas de ellas, con sus correspondientes ventajas y desventajas.
Usuarios que han visto este tema también han visto...
- Estrategia para el mercadeo: la necesidad sentida
- Consejos para principiantes de SEO
- Formatos de imagen
- Cómo crear una imagen HDR
- Optimización de páginas web para su impresión
Información legal | Política de Privacidad | Contacte con nosotros
Otro proyecto de Factoría de Internet. Copyright© 2003-2008 Factoría de Internet S.L.. Todos los derechos reservados.