Hay bastantes artículos escritos ya sobre como eliminar el spam en Google Analytics. En todos nos cuenta que existe el spam, que es un problema,que hay que hacer filtros para evitarlo. Además, parece que cada maestrillo tiene su librillo, unos excluyen referers, otros ponen filtros, los mas radicales hasta aniquilan todo el tráfico que venga de Rusia y tenga rebote 100%.
Yo no voy a ir por ese camino. Lo que voy a intentar es mostraros las bases de cómo se hace el Spam en GA para que podáis responder con la misma moneda.
¿Por qué haces esto?
Hasta ahora este tipo de SPAM no me incordiaba demasiado. No dejaban de ser unas visitas «mierder» que me encaminaban hacia ali express o similar. Hasta ahi vale, un «mierder» haciendo «mierder». El problema e indignación viene cuando te encuentras al Spam entre los eventos de Analytics, y encima de un tipo/a que te pone la documentación de eventos de Universal analytics con publicidad adsense… ¿ qué será lo siguiente?
¿Cómo hacer Spam en Google Analytics?
Tenemos varias formas de hacerlo. La mas sencilla es utilizar el etiquetado de campañas. Si, usando las UTM puedes enviar la información que te dé la gana para que aparezca como FUENTE o como MEDIO en los informes de aquel al que quieres spamear. Es un método tan simple como rudimentario.
- Elige la URL a la que quieres tocar las narices y…
- con la «Herramienta creador de URL» introduce en medio y fuente tu spam favorito
VAs a obtener una url parecida a ésta:
http://www.URL_A_SPAMEAR.COM/?utm_source=fUENTEspam&utm_medium=MEDIOspam&utm_campaign=SPAM
Ahora lo que tienes que hacer es recargarla en tu navegador cuantas veces quieras... ( obviamente, si eres un poco habil con el código sabras hacerlod e forma automática)
Con el método de las UTM se pueden obtener algunos resultados, pero no es ni mucho menos, el mejor de los métodos.
Como segunda opción, podemos utilizar el «protocolo de medición» de Universal Analytics. Es un sistema creado en origen para poder enviar información a nuestra cuenta de Google Analyitcs desde cualquier sitio desde el que podamos hacer una llamada HTTP. Se puede usar para hacer el bien, como cuando vemos que lo combinan con detectores de presencia o para hacer el mal, como los casos de Spam que estamos sufriendo.
El funcionamiento es el siguiente. Tenemos que hacer una llamada a la siguiente URL:
http://www.google-analytics.com/collect?
Además tenemos que añadirle los siguientes parámetros (copiado de la documentación de GA):
Nombre | Parámetro | Ejemplo | Descripción |
---|---|---|---|
Versión del protocolo | v | v=1 | La versión del protocolo. El valor debe ser 1 . |
ID de seguimiento | tid | tid=UA-123456-1 | El ID que señala la propiedad de Google Analytics a la que hay que enviar los datos. |
ID de cliente | cid | cid=xxxxx | Un ID único para un usuario en particular. |
Tipo de hit | t | t=pageview | El tipo de interacción recopilada para un usuario concreto. |
Aquí encontramos varios puntos importantes.
El ID de seguimiento, que es el id de la web que queremos spamear. Se saca mirando el código fuente o, de una forma mucho mas fácil utilizando Google TAG Assistant:
Como podéis comprobar la «confesión» de la información es instantánea.
El ID de CLIENTE: Puede que sea el más difícil de generar, debe cumplir una serie de características, definidas en http://www.ietf.org/rfc/rfc4122.txt. el resultado es algo como ésto:
cid=35009a79-1a05-49d7-b876-2b884d0f825b
El tipo de HIT: Aquí es donde empieza la marcha, puede ser:
- «pageview», para páginas vistas,
- «screenview», para pantallas vistas de aplicaciones móviles
- «event», para eventos.
- «transaction», ¡ojocuidao! que podemos realizar compras falsas en cualquier ecommerce
- «social», interacciones sociales.
Como véis lo de SPAM en referers y eventos es un juego de niños comparado con el escabeche que te pueden realizar…
Hasta aquí los parámetros obligatorios, porque con el Protocolo de medición podemos enviar todo lo que se nos antoje,
Fuentes, medios, nombres de navegador, hacer desaparecer la ip, user agent… os paso la documentación para que empecéis a llorar muy fuerte: https://developers.google.com/analytics/devguides/collection/protocol/v1/parameters?hl=es
De esta forma es como actualmente estan enviando todo tipo de Spam nuestros queridos amigos spammers.
No se si vosotros veis el peligro, pero no quiero ni pensar que pasaría si en vuestro querido ecommerce empiezan a aparecer ventas de productos que no tenéis y que curiosamente pertenecen a la competencia….
¿Cómo eliminar SPAM en Google Analytics?
Ya hay gente intentando solucionarlo, pero creo que la solución no pasa por eliminar tráfico, el riesgo de cargarnos lo que no queremos es bastante grande.
Dándole unas cuantas vueltas, creo que la solución la debería aportar directamente Google. Básicamente porque si no lo hacen nos pasaremos todos a yandex o similares.
Soluciones que se me ocurren:
Para el etiquetado de campañas. Estaría bien generar las campañas desde dentro de Google Analyitcs, de forma que la herramienta tenga el control de las campañas reales que estamos utilizando y, todo loq ue no corresponda con lo que hemos implementado simplemente no aparezca. Algo parecido a lo que ocurre con adwords, cuando enlazamos vemos sólo nuestros datos, si alguien comete el error de anunciarnos con su cuenta no enlazada, sólo veremos que es tráfico de adwords, pero nada mas, la suciedad queda perfectamente delimitada
Para el «protocolo de medición». Un poco más complicado que lo anterior, pero pasa también por hacer un «entorno cerrado», es decir, que lo activen aquellos que lo están utilizando, no todo el mundo, de forma que quede controlado y reducido en número. Algo así como activar el User ID ¿no?
Con esto la única alternativa que quedaría para los spammers es tener que simular clics en enlaces desde un dominio real y luego… redirección que te crió ( un coña marinera..)
Otra opción es contraatacar, hagamos lo mismo, que las tiendas y webs que nos spameam empiecen a ver cosas raras…aunque no seré yo el que os incite a delinquir…¿ o si?
Hasta hace poco era un pequeño problema, pero se está desmadrando. Y además, a quien más afecta es a esa páginas pequeñas, con pocas visitas y poco presupuesto para analítica que se fian de lo que les dice analytics tal cual.
Yo confío en que cualquier día Google nos sorprenda con una solución eficaz.
Lo que no termino de ver es lo de cambiar GA por Yandex. Tiene cosas interesantes, pero tanto como sustituirlo…
Bueno… Quien dice yandex dice cualquier otra que no sufra tanto el spam, aunque lo que estoy viendo es que afecta a todas las herramientas… Hasta a awstats del servidor…
Pero a las estadisticas de servidor solo le afectan las visitas reales de robots. No la que está liando el ruso con el Measurement Protocol.
Tengo una lista interminable de refferer suyos, ya he empezado a verlo en keywords y si dices que tambien en eventos…
Y eso por no pensar en la que puede liarte un competidor con mala baba en algo más dirigido… Al final te obliga a revisar todo cada vez que consultas un dato, filtrar, y aumentar el muestreo. Más horas de trabajo y menos precisión o perder fiabilidad