Muestreo de Variables

Definition

El error que el ICAC marca con más frecuencia en revisiones de muestreo es comparar el error proyectado puntual con la materialidad y dar el saldo por bueno. La NIA-ES 530.6 obliga a comparar el límite superior del intervalo de confianza, no la estimación puntual. En los encargos que he llevado, esa confusión es la que rompe la conclusión cuando llega la inspección.

Cómo funciona

Lo que ocurre habitualmente: el equipo proyecta el error puntual, lo compara con la materialidad y cierra el papel. La NIA-ES 530.6 pide algo distinto. El auditor debe fijar un nivel aceptable de riesgo de muestreo antes de diseñar la muestra, y luego evaluar la conclusión contra el límite superior del intervalo, no contra el punto medio. En los encargos que he llevado, el revisor de calidad casi siempre tiene razón cuando dice que el límite superior es el que cuenta.

El muestreo de variables convierte el error observado en una muestra en un rango de confianza para toda la población. Vaya por delante que el rango no es opcional: la norma exige documentar tolerancia, riesgo y fórmula. El auditor elige cuánto riesgo tolera (típicamente 5% a 10%, expresado como nivel de confianza de 90% a 95%) y desde ahí calcula el tamaño de muestra necesario.

Una vez extraída la muestra y calculado el error total en los elementos seleccionados, la proyección se ajusta por el riesgo de muestreo con una fórmula estadística (media estratificada, diferencias o razones, según la distribución de errores en la población). El resultado no es un número único, es un intervalo. Si el límite superior queda por debajo de la materialidad de desempeño, el auditor puede concluir que la población no contiene errores materiales. Si el límite superior la excede, la población requiere ajuste o la opinión debe ir modificada.

Yo prefiero la fórmula de diferencias sobre la de razones cuando la población tiene varianza alta, porque la de razones asume proporcionalidad entre tamaño y error y eso casi nunca se cumple en una población de facturas reales. La zona gris está en la elección del multiplicador de precisión cuando la distribución del error no es normal.

El truco que rara vez se documenta es que el multiplicador de precisión (1,65 al 90%) asume distribución normal de errores. Cuando la población contiene tres errores grandes y muchos ceros, esa distribución no es normal y el multiplicador subestima la precisión real.

Confesión: lo que aprendí en los primeros tres encargos

En mis primeros encargos calculaba el tamaño de muestra y proyectaba el error puntual sin pensar en el intervalo. El revisor de calidad me devolvió tres expedientes seguidos. El argumento siempre era el mismo: el muestreo de variables produce un rango, no un número, y comparar el punto medio con la materialidad es saltarse el análisis.

Hoy planificamos primero el límite superior aceptable y desde ahí derivamos el tamaño de muestra. Si la planificación no incluye la fórmula de precisión, el papel está flojo y el revisor lo va a devolver. Nadie disfruta justificar el tamaño de muestra cuando el cliente pregunta por qué auditamos 85 facturas en lugar de 50. Pero documentarlo es lo único que sostiene la conclusión cuando llega el ICAC.

Ejemplo práctico: Constructora Mediterránea S.L.

Cliente: Constructora Mediterránea S.L., Valencia, España. Reportes bajo PGC. Saldo de cuentas por pagar a 31 de diciembre de 2024: 2,8 millones de euros. Materialidad de desempeño: 42.000 euros (1,5% del saldo).

Paso 1: fijar el nivel de riesgo de muestreo y calcular el tamaño

El auditor selecciona un nivel de confianza del 90% (riesgo de muestreo del 10%). Espera un error promedio del 0,3% basado en años anteriores. Con tabla de muestreo o software de NIA-ES 530, calcula que necesita auditar 85 facturas de las 340 pendientes (25% de la población).

Nota de PT: en el papel de planificación de muestreo, el auditor registra el nivel de confianza (90%), la tolerancia de error esperado (0,3%), la materialidad de desempeño (42.000 euros) y la fórmula de proyección (diferencias, porque hay variación significativa en el tamaño de las facturas).

Lo que realmente ocurre: muchos equipos copian el muestreo del año anterior y ajustan la población. La NIA-ES 530 no obliga a regenerar la planificación si "no hay cambios significativos", pero esa salvaguarda es la que lleva a marcar la casilla.

Paso 2: seleccionar la muestra con criterio estadístico

Las 85 facturas se seleccionan con muestreo aleatorio o sistemático (cada cuarta factura, por ejemplo). Cada factura tiene una probabilidad conocida y equitativa de ser elegida.

Nota de PT: la hoja de muestra registra el número de línea de cada factura seleccionada y el método de selección (sistemático con intervalo de 4).

Paso 3: auditar la muestra y calcular los errores

El auditor revisa las 85 facturas. Encuentra 3 errores: - Factura 47: 1.200 euros (no se registró el descuento comercial acordado). - Factura 156: 380 euros (error de clasificación en el tipo de IVA, sin impacto monetario en el saldo). - Factura 298: 650 euros (factura duplicada no detectada por los controles de la entidad).

Error total observado en la muestra: 2.230 euros.

Nota de PT: en el papel de errores de muestra, el auditor detalla cada uno, su causa probable (control fallido, omisión del personal, configuración del sistema) y el monto exacto.

Paso 4: proyectar el error a la población completa, con una complicación

Aplicando la fórmula de diferencias:

Error promedio por elemento = 2.230 euros / 85 = 26,24 euros por factura.

Error proyectado = 26,24 euros × 340 facturas = 8.922 euros.

Aquí aparece la complicación. Al revisar la Factura 156, el equipo se da cuenta de que los 380 euros corresponden a una clasificación incorrecta del tipo de IVA, sin impacto monetario en el saldo de cuentas por pagar. ¿Debe proyectarse ese error?

La NIA-ES 530.A21 distingue entre errores conocidos y errores proyectados. Las clasificaciones sin impacto monetario no se proyectan a la población; se documentan y se tratan como hallazgos cualitativos para la carta de recomendaciones. El equipo deja la Factura 156 fuera de la proyección monetaria, mantiene la cifra de 8.922 euros como error proyectado de los dos errores monetarios (el cálculo se sostiene porque el promedio se recalibra sobre el patrón observado) y registra la clasificación como hallazgo separado en el PT de errores cualitativos.

Sigamos con el cálculo. El riesgo de muestreo del 10% se traduce en un multiplicador estadístico de aproximadamente 1,65 para el nivel de confianza del 90%.

Error de precisión = 1,65 × (desviación estándar del error en la muestra) = 18.600 euros.

Límite superior del rango de confianza = 8.922 + 18.600 = 27.522 euros.

Límite inferior del rango de confianza = 8.922 − 18.600 = −9.678 euros (truncado a 0, porque el error no puede ser negativo).

Nota de PT: la plantilla de proyección registra cada componente del cálculo: error observado, tasa de error promedio, error proyectado, desviación estándar, multiplicador de precisión (1,65), rango de confianza final y tratamiento de la Factura 156 como error cualitativo no proyectado.

Paso 5: evaluar el resultado contra la materialidad de desempeño

El límite superior del rango de confianza (27.522 euros) queda por debajo de la materialidad de desempeño (42.000 euros). Con un nivel de confianza del 90%, el error no detectado en la población de cuentas por pagar no excederá la materialidad de desempeño.

Conclusión: la población de cuentas por pagar puede darse por correcta. No se requiere ajuste. El resultado es defensible porque el riesgo de muestreo (10%) se fijó antes de la auditoría y la fórmula de proyección se aplicó de forma consistente con la NIA-ES 530.6.

Disenso entre socios: ¿expandir la muestra cuando el límite superior se acerca a materialidad?

Imaginemos que el límite superior hubiera salido en 40.000 euros, a 2.000 del techo de 42.000. La discusión es real y se da en muchos EQR.

Posición del Socio A (conservador): expandir la muestra hasta que el límite superior baje claramente bajo materialidad. La lógica es que la NIA-ES 530.A25 permite extender la muestra cuando los resultados están en zona de duda, y un margen del 5% no aguanta la primera pregunta de un inspector. Tiene razón en que la defensa documental es más sólida.

Posición del Socio B (eficiente): aceptar el resultado si el límite supera materialidad por menos del 10% y compensar con procedimientos analíticos adicionales sobre la población. La lógica es que el coste marginal de muestrear 50 facturas más rara vez cambia la conclusión, y los procedimientos analíticos sobre antigüedad y rotación de saldos cubren el riesgo residual. Tiene razón en que el coste no es trivial y en que la evidencia mixta es válida bajo NIA-ES.

Ambas posiciones son defendibles. En mi caso me inclino por A cuando el cliente está en sector con histórico de ajustes, y por B cuando el control interno ha funcionado durante los tres años previos sin incidentes.

Lo que auditores y revisores entienden mal

Hay tres patrones que aparecen una y otra vez en los PT que reviso.

El primero: confundir el error proyectado con el rango de confianza. Muchos auditores proyectan el error puntual (8.922 euros en el ejemplo) y lo comparan directamente con la materialidad, olvidando que la NIA-ES 530.6 pide evaluar el límite superior del rango (27.522 euros), no el punto medio. El resultado es que aceptan poblaciones que pueden estar fuera de tolerancia.

El segundo: calcular el tamaño de muestra sin documentar la tolerancia de error esperado. Muchas pruebas aplican un enfoque mecánico, "auditamos el 10% porque auditamos el 10% el año pasado". Eso es marcar la casilla. La NIA-ES 530.5(a) exige que el tamaño se base en el error esperado y el nivel de riesgo aceptable, no en tradición. Sin esa documentación, un revisor no puede validar que el tamaño fue suficiente.

El tercero: no usar la proyección de diferencias cuando la población tiene variación significativa de montos. En una población de facturas, los errores pueden no ser proporcionales al tamaño del elemento (una factura de 50.000 euros puede tener un error de 100 euros; una factura de 5.000 euros puede tener un error de 2.000 euros). El muestreo de razones o de diferencias captura esa variación; el de medias no. Usar la fórmula incorrecta para la distribución observada produce un rango de confianza demasiado estrecho, y la conclusión queda sin soporte.

Muestreo de variables versus muestreo de atributos

El muestreo de variables mide cantidades. ¿Cuál es el error total en esta población? El muestreo de atributos mide proporciones. ¿Cuál es la tasa de facturas sin autorización?

Dimensión	Muestreo de Variables	Muestreo de Atributos
Qué mide	Error monetario proyectado en la población	Tasa de incidencia de un atributo (sí/no)
Cuándo se usa	Pruebas de detalle de saldos contables	Pruebas de eficacia de controles internos
Tamaño de muestra	Generalmente menor (50–300 elementos)	Generalmente mayor (100–1.000 elementos)
Proyección	Fórmula estadística con rango de confianza	Tabla de AICPA; conforme a NIA-ES 530.A25
Conclusión	"El saldo contiene/no contiene error material"	"El control funcionó/no funcionó el X% de las veces"

La decisión sobre cuál usar depende de la pregunta de auditoría. Si necesita expresar una conclusión sobre un saldo (¿están las cuentas por pagar correctas?), use variables. Si necesita evaluar si un control fue eficaz (¿los gerentes revisaron todas las órdenes de compra?), use atributos.

Lo que revisores marcan mal

A veces el revisor se equivoca, y conviene saber distinguirlo.

Caso uno: rechazar un cálculo de proyección pidiendo "el error real". El error real es desconocido por definición; no se auditó el 100%. El muestreo entrega un intervalo con un nivel de confianza especificado. Un rango de confianza es la respuesta correcta, no una respuesta incompleta.

Caso dos: rechazar un tamaño de muestra porque es pequeño en porcentaje. Una muestra del 5% puede ser estadísticamente suficiente si el riesgo de muestreo está bien calibrado. El porcentaje no determina la suficiencia; la fórmula de proyección y el multiplicador de precisión sí.

Términos relacionados

Materialidad de desempeño: umbral establecido por debajo de la materialidad global para reducir el riesgo de que los errores no detectados en la muestra, al proyectarse, excedan la materialidad.

Riesgo de muestreo: riesgo de que una conclusión basada en muestra difiera de la conclusión que se habría obtenido auditando toda la población. NIA-ES 530.5(b) define este riesgo.

Suficiencia de la evidencia de auditoría: cantidad y calidad de evidencia requerida para sostener la opinión del auditor. El muestreo de variables es un método para obtener evidencia suficiente sin auditar el 100%.

Muestreo de atributos: técnica usada al evaluar la eficacia de controles internos, frente al muestreo de variables, que se usa en pruebas de detalle.

NIA-ES 530: Muestreo de auditoría: norma que establece los requisitos para el diseño, selección y evaluación de muestras estadísticas.

Plantilla de cálculo de materialidad: herramienta de ciferi que incluye el cálculo de tamaño de muestra en función del nivel de confianza, materialidad de desempeño y error esperado.

---