Hay  bastantes artículos escritos ya sobre como eliminar el spam en Google Analytics. En todos nos cuenta que existe el spam, que es un problema,que hay que hacer filtros para evitarlo. Además, parece que cada maestrillo tiene su librillo, unos excluyen referers, otros ponen filtros, los mas radicales hasta aniquilan todo el tráfico que venga de Rusia y tenga rebote 100%.

Yo no voy a ir por ese camino. Lo que voy a intentar es mostraros las bases de cómo se hace el Spam en GA para que podáis responder con la misma moneda.

¿Por qué haces esto?

Hasta ahora este tipo de SPAM no me incordiaba demasiado. No dejaban de ser unas visitas «mierder» que me encaminaban hacia ali express o similar. Hasta ahi vale, un «mierder» haciendo «mierder». El problema e indignación viene cuando te encuentras al Spam entre los eventos de Analytics, y encima de un tipo/a que te pone la documentación de eventos de Universal analytics con publicidad adsense… ¿ qué será lo siguiente?

ejemplo de spam en analytics

¿Cómo  hacer  Spam en Google Analytics?

Tenemos varias formas de hacerlo. La mas sencilla es utilizar el etiquetado de campañas. Si, usando las UTM puedes enviar la información que te dé la gana para que aparezca como FUENTE o como MEDIO en los informes de  aquel al que quieres spamear. Es un método tan simple como rudimentario.

  1. Elige la URL a la que quieres tocar las narices y…
  2. con la «Herramienta creador de URL» introduce en medio y fuente tu spam favorito

VAs a obtener una url parecida a ésta:

http://www.URL_A_SPAMEAR.COM/?utm_source=fUENTEspam&utm_medium=MEDIOspam&utm_campaign=SPAM

Ahora lo que tienes que hacer es recargarla en tu navegador cuantas veces quieras... ( obviamente, si eres un poco habil con el código sabras hacerlod e forma automática)

Con el método de las UTM se pueden obtener algunos resultados, pero no es ni mucho menos, el mejor de los métodos.

Como segunda opción, podemos utilizar el «protocolo de medición» de Universal Analytics. Es un sistema creado en origen para poder enviar información a nuestra cuenta de Google Analyitcs desde cualquier sitio desde el que podamos hacer una llamada HTTP. Se puede usar para hacer el bien, como cuando vemos que lo combinan con detectores de presencia o para hacer el mal, como los casos de Spam que estamos sufriendo.

El funcionamiento es el siguiente. Tenemos que hacer una llamada a la siguiente URL:

http://www.google-analytics.com/collect?

Además tenemos que añadirle los siguientes parámetros (copiado de la documentación de GA):

NombreParámetroEjemploDescripción
Versión del protocolovv=1La versión del protocolo. El valor debe ser 1.
ID de seguimientotidtid=UA-123456-1El ID que señala la propiedad de Google Analytics a la que hay que enviar los datos.
ID de clientecidcid=xxxxxUn ID único para un usuario en particular.
Tipo de hittt=pageviewEl tipo de interacción recopilada para un usuario concreto.

Aquí encontramos varios puntos importantes.

El ID de seguimiento, que es el id de la web que queremos spamear. Se saca mirando el código fuente o, de una forma mucho mas fácil utilizando Google TAG Assistant:

tag assistante de google

Como podéis comprobar la «confesión» de la información es instantánea.

El ID de CLIENTE: Puede que sea el más difícil de generar, debe cumplir una serie de características, definidas en http://www.ietf.org/rfc/rfc4122.txt. el resultado es algo como ésto:

cid=35009a79-1a05-49d7-b876-2b884d0f825b

El tipo de HIT: Aquí es donde empieza la marcha, puede ser:

  • «pageview», para páginas vistas,
  • «screenview», para pantallas vistas de aplicaciones móviles
  • «event», para eventos.
  • «transaction»,  ¡ojocuidao! que podemos realizar compras falsas en cualquier ecommerce
  •  «social», interacciones sociales.

Como véis lo de SPAM en referers y eventos es un juego de niños comparado con el escabeche que te pueden realizar…

Hasta aquí los parámetros obligatorios, porque con el Protocolo de medición podemos enviar todo lo que se nos antoje,

Fuentes, medios, nombres de navegador, hacer desaparecer la ip, user agent… os paso la documentación para que empecéis a llorar muy fuerte: https://developers.google.com/analytics/devguides/collection/protocol/v1/parameters?hl=es

De esta forma es como actualmente estan enviando todo tipo de Spam nuestros queridos amigos spammers.

No se si vosotros veis el peligro, pero no quiero ni pensar que pasaría si en vuestro querido ecommerce empiezan a aparecer ventas de productos que no tenéis y que curiosamente pertenecen a la competencia….

¿Cómo eliminar SPAM en Google Analytics?

Ya hay gente intentando solucionarlo, pero creo que la solución no pasa por eliminar tráfico, el riesgo de cargarnos lo que no queremos es bastante grande.

Dándole unas cuantas vueltas, creo que la solución la debería aportar directamente Google. Básicamente porque si no lo hacen nos pasaremos todos a yandex o similares.

Soluciones que se me ocurren:

Para el etiquetado de campañas. Estaría bien generar las campañas desde dentro de Google Analyitcs, de forma que la herramienta tenga el control de las campañas reales que estamos utilizando y, todo loq ue no corresponda con lo que hemos implementado simplemente no aparezca. Algo parecido a lo que ocurre con adwords, cuando enlazamos vemos sólo nuestros datos, si alguien comete el error de anunciarnos con su cuenta no enlazada, sólo veremos que es tráfico de adwords, pero nada mas, la suciedad queda perfectamente delimitada

Para el «protocolo de medición». Un poco más complicado que lo anterior, pero pasa también por hacer un «entorno cerrado», es decir, que lo activen aquellos que lo están utilizando, no todo el mundo, de forma que quede controlado y reducido en número. Algo así como activar el User ID ¿no?

Con esto la única alternativa que quedaría para los spammers es tener que simular clics en enlaces desde un dominio real y luego… redirección que te crió ( un coña marinera..)

Otra opción es contraatacar, hagamos lo mismo, que las tiendas y webs que nos spameam empiecen a ver cosas raras…aunque no seré yo el que os incite a delinquir…¿ o si?

 

Shares