Categories: Análisis web

Muestreo. Introducción

Llega un momento e que te planteas hacer una encuesta. En ese momento te coges unas cuantas preguntas y las lanzas a ver que pasa. Mas tarde tienes tus respuestas que puedes analizar y todo solucionado…

Como esta sea tu historia te retiro la palabra. #hedicho
Efectivamente, todo lo anterior es caca ( si, caca) si quieres tener alguna certeza de que las conclusiones que saques del grupo al que preguntas represente al total del grupo que estas estudiando, mas vale que hagas las cosas bien, vamos paso por paso:
1.-Especifica y acota la población a analizar:
Si, para escoger una muestra lo primero es saber cuál es el total. Y eso es así. En el caso de una web pueden ser todas las visitas, o sólo los nuevos, o sólo los que compran,  en fin lo que necesites según el caso.
2.-Realiza un diseño de la muestra:
Esta muestra va a ser representativa. Es decir que las conclusiones que saquemos de su estudio se podrán inferir a la población (universo).
Una de las decisiones mas importantes en lo referente a la muestra es el tamaño. Es (casi) cierto que con una muestra mas grande mas probable es que obtengamos resultados representativos, pero no siempre es así. Es mas importante conseguir una muestra representativa que una gran muestra, que encarecería el estudio y lo haría todo mas complicado. Recuerda que precisamente se utilizan los estudios mediante muestra por la imposibilidad e ineficiencia de trabajar sobre todo el censo, ya que si eso fuera posible ¿qué sentido tendría estudiar una muestra?
No me desvío, la forma más básica de escoger una muestra es mediante la siguiente fórmula:
N=(Z^2pq)/E^2
En otras palabras, N=tamaño muestral. Z=nivel de confianza.P=variabilidad positiva Q=variabilidad negativa y E=precisión del error que estamos dispuestos a asumir.
Lo mas habitual es que no conozcamos la varianza poblacional (pq) por eso nos encontraremos la mayoría de las veces que su valor asignado es 50.
El nivel de confianza puede variar, pero mi recomendación es que sea 2sigma (95,5%) ya que elevarlo puede suponer un incremento brutal del tamaño de la muestra, y con un nivel menor la gente empieza a no sentirse cómoda.
En lo referente al error que asumimos, un par de datos. SI eliges un 5% obtendrás una muestra de 400 unidades mientas que si tienes poca tolerancia (0,1) el tamaño se dispara a 1.000.000… tu verás que eliges. Los errores elegidos habitualmente están entre el 2% y e l 2,5%.
Con todo esto no aseguramos la representatividad de la muestra. Además se tienen que cumplir unas cuantas cosas mas:
  • Cada unidad que participe en la muestra debe tener LA MISMA PROBABILIDAD de ser elegida para la muestra. ( no vale poner la encuesta a primera hora de la mañana en la web, no).
  • La elección de cada elemento de la muestra debe de ser independiente del resto.
Ahora si. Ahora ya tenemos una muestra en condiciones…
Para elegir la muestra podemos hacerlo de las siguientes formas:
  • Mediante muestreo aleatorio simple: La forma mas simple, como su propio nombre indica. Se escoge el marco muestral y generamos una tabla de números aleatorios que asignamos a los diferentes elementos para que sean elegidos. En el caso de la web es complicado. Los usuarios vienen cuando quieren… tendremos que afinar un poco más.
  • Mediante muestreo Sistemático: Elegimos a la «primera víctima» y volvemos a escoger cada «N» individuos. Esto afina un poco mas ¿no crees?, el problema que nos encontramos es que las visitas están ordenadas según el factor tiempo, lo que puede favorecer la sobrerepresentación de algún segmento. También tenemos el:
  • Muestreo Aleatorio estartificado: Muy útil cuando tenemos información sobre características de la población de interés (nuevos, recurrentes, etc) Supone clasificar a la población según esas caracterísitcas que nos interesan para asegurarnos que tienen representación en el estudio. Dentro del mundo de la «estartificación» hay muchas formas de hacerlo, de forma proporcional, por afijación simple u óptima ( no proporcionales)… sobre eso ya hablaremos más adelante.
  • Muestreo por Conglomerados: es otra forma de clasificación, pero ahora, en lugar de elegir grupos que son homogéneos, elegimos una muestra de conglomerados que son heterogéneos en su composición…
En fin no me alargo mucho mas, que como siempre… es tarde mi entra el sueño.
Shares
CarlosMlebron

CarlosMlebron

Share
Published by
CarlosMlebron

Recent Posts

Audita tu configuración de Google Tag Manager con R

De los creadores de Audita tu configuración de Google Analytics con R y de Usa R para…

3 años ago

Audita tu configuración de Google Analytics con R

Seguro que mas de una vez te ha tocado auditar una o varias cuentas de…

3 años ago

Usa R para auditar tu instalación de Adobe Analytics

No se si te habrá pasado ya, pero si estas en estas cosas de Adobe…

4 años ago

Eventos en Google Analytics 4

Alguna vez me habréis oído decir eso de "En la web como en el mar…

4 años ago

Empezar a medir con GA4 (Google Analytics 4)

Si te estas preguntando ¿Debería pasarme a GA4? o ¿Debería medir con GA4 ? ya …

4 años ago