Muestreo estadístico

Definition

La mayoría de papeles de trabajo de muestreo no documentan cómo se calculó el tamaño de la muestra. Es la primera cosa que pregunta el revisor del Instituto de Contabilidad y Auditoría de Cuentas (ICAC), y la primera que falta.

Cómo funciona, y por qué se rompe

No es la fórmula lo que falla en revisión. Lo que falla es el orden. Muchos auditores calculan la muestra después de seleccionarla, o ajustan el riesgo aceptable cuando los resultados no encajan. La NIA-ES 530.5(b) presupone que el riesgo de muestreo se cuantifica antes, no después.

La diferencia entre muestreo estadístico y "selección al azar" no es semántica. En el primero, cada elemento de la población tiene una probabilidad matemáticamente definida de inclusión, y esa probabilidad se documenta. En el segundo, el auditor escoge transacciones por intuición y luego escribe "muestra representativa" en el papel de trabajo. Esa frase, sola, no defiende nada.

La NIA-ES 530.A20 distingue dos tipos: muestreo de atributos (¿pasó el control o no?) y muestreo de variables (¿cuál es el importe?). En la práctica, los equipos usan atributos para pruebas de controles y muestreo por unidades monetarias (MUS) para auditoría de saldos.

Lo que distingue al estadístico es que el auditor define de antemano el riesgo aceptable de muestreo, el nivel de confianza deseado y, en variables, la precisión. Esos parámetros producen un tamaño de muestra calculado. Cuando se evalúan los resultados, el auditor cuantifica la precisión lograda y compara los hallazgos contra el riesgo predefinido.

La NIA-ES 530.7 obliga a evaluar tres cosas: 1. Los errores encontrados en la muestra. 2. La proyección matemática de esos errores a la población. 3. Si la precisión lograda es aceptable dada la importancia relativa de desempeño.

En la práctica, los papeles registran los errores encontrados y la conclusión salta directamente a "no significativo", sin proyección. Eso es lo que el revisor marca.

Si el auditor no puede aceptar los resultados (precisión insuficiente o demasiados errores), debe ampliar el procedimiento. Cambiar de parámetros retroactivamente no es ampliar; es reescribir.

Ejemplo práctico: Talleres Mecánicos Mediterráneos S.L.

Cliente: empresa mediana de reparación industrial, Madrid, facturación 6,2 millones de euros, NIIF.

Paso 1: definir los parámetros del muestreo

Población: 3.847 órdenes de trabajo emitidas en 2024, importe total 6,1 millones de euros. El auditor determina que la importancia relativa de desempeño (IRD) es 80.000 €, equivalente al 1,3% de la cifra de negocio. Fija un riesgo de muestreo aceptable del 5%, es decir, está dispuesto a asumir un riesgo del 5% de que su conclusión sea incorrecta.

Nota: el PT-530.1 registra el tamaño de la población (3.847), la IRD (80.000 €) y el riesgo aceptable (5%). Lo importante es la fecha. Si el PT lleva fecha posterior a la selección de la muestra, el revisor lo va a ver.

Paso 2: calcular el tamaño de la muestra

Fórmula MUS para auditoría de importes:

Tamaño de muestra = (Importe total × Factor de confianza) / IRD

Tamaño de muestra = (6.100.000 × 3,0) / 80.000 = 228,75 → 229 órdenes de trabajo.

El factor de confianza 3,0 corresponde a un riesgo aceptable del 5% (nivel de confianza del 95%). Un riesgo más bajo requeriría un factor más alto y una muestra más grande.

Nota: PT-530.2 muestra el cálculo con la fórmula aplicada y el justificante del factor de confianza.

Paso 3: seleccionar la muestra de forma aleatoria

El auditor usa un generador de números aleatorios para escoger 229 órdenes de las 3.847. Cada orden tiene una probabilidad conocida de inclusión: 229 / 3.847 ≈ 5,95%.

Nota: el PT-530.3 contiene el listado de números de orden seleccionados y los importes correspondientes. Se documenta la semilla del generador para permitir replicabilidad.

Paso 4: ejecutar el procedimiento

El equipo audita las 229 órdenes verificando importes contra registros de almacén, autorizaciones y clasificación contable. Se encuentran 2 órdenes con importe no concordante: una difiere en 1.200 € (error de digitación), la otra en 340 € (clasificación de costo incorrecta). Importe total de error: 1.540 €.

Hasta aquí el caso parece limpio. No lo es.

Al cruzar con el listado de proveedores, el auditor ve algo incómodo: el error de 1.200 € corresponde a una orden del mismo proveedor (Suministros Industriales del Henares) que ya apareció en otras dos órdenes de la muestra con importes correctos pero idéntica transposición de dígitos en la referencia interna. Tres órdenes del mismo proveedor, con el mismo patrón en la referencia, una de ellas con error de importe. Eso ya no parece accidental.

Aquí toca decidir, y aquí es donde un papel de trabajo bien hecho vale lo que pesa. La opción A es tratar el error como aleatorio y proyectar tal cual; rápido, pero indefendible si el revisor pregunta por el patrón. La opción B es estratificar: separar las órdenes de Suministros Industriales del Henares como subpoblación y testear todas (son 41 en el ejercicio), tratando ese subgrupo aparte. La opción C es escalar a una posible deficiencia de control en el alta de proveedores, lo cual cambia la naturaleza del hallazgo.

En mi caso he optado por la opción B en encargos similares. Estratificar añade horas, sí, pero protege la conclusión: el error en el subgrupo se proyecta sobre 41 órdenes, no sobre 3.847, y el resto de la muestra se evalúa limpia. El equipo audita las 41 órdenes restantes del proveedor; aparece un error adicional de 890 €, lo que confirma que el patrón no era aleatorio. El error proyectado del subgrupo se calcula sobre la subpoblación; el de las 188 órdenes restantes se proyecta sobre las 3.806 órdenes restantes de la población.

Nota: PT-530.4 lista los errores encontrados, el patrón detectado en el proveedor y la decisión de estratificar. El auditor documenta por escrito por qué no se trata el error como aleatorio.

Paso 5: proyectar los errores a la población (subgrupo limpio)

Para las 188 órdenes del estrato general (excluidas las 41 del proveedor sospechoso), el error encontrado es de 340 € sobre un importe de muestra de 487.000 €. Importe de población restante: 5.430.000 €.

Importe de error proyectado (estrato general) = (340 / 487.000) × 5.430.000 = 3.791 €

Para el estrato del proveedor (41 órdenes auditadas al 100%), el error real es 1.200 € + 890 € = 2.090 €. Sin proyección, porque el subgrupo se ha auditado entero.

Total error estimado = 3.791 € + 2.090 € = 5.881 €.

Si se hubiera proyectado sin estratificar, el cálculo original habría dado: (1.540 / 595.000) × 6.100.000 = 15.822 €. La cifra es mayor pero menos defendible, porque mezcla un error sistemático con uno aleatorio.

Paso 6: evaluar la conclusión (NIA-ES 530.7)

El error total estimado (5.881 €) está muy por debajo de la IRD (80.000 €). El auditor calcula también el intervalo superior de confianza al 95%: aproximadamente 28.000 € en el escenario sin estratificar, menor en el estratificado. En ambos casos por debajo de la IRD.

Nota: PT-530.6 calcula el intervalo de confianza, documenta la decisión de estratificar y archiva la comunicación con dirección sobre el patrón detectado en el proveedor. El auditor incluye una recomendación al cliente sobre el control de alta de referencias internas en el almacén.

Conclusión del encargo: la cifra de error proyectada es aceptable frente a la IRD. La estratificación añadió 12 horas al encargo, pero eliminó el riesgo de que el revisor cuestionara la mezcla de un error sistemático con la población general. A nadie le gusta calcular factores de confianza a las once de la noche, pero la alternativa es defender un tamaño de muestra inventado, o peor, una proyección que ignora un patrón visible.

Qué entienden mal los revisores y los auditores

Error 1: confundir tamaño de muestra con poder estadístico.

Muchos auditores creen que más muestra = más confianza. Hay un punto de razón en eso: una muestra mayor reduce el riesgo de no detección. Pero la NIA-ES 530.5(b) dice otra cosa. El tamaño se calcula para lograr un riesgo de muestreo específico. Una muestra de 100 con riesgo del 5% proporciona la misma confianza que una de 500, si ambas están diseñadas correctamente. Ampliar arbitrariamente sin redefinir el riesgo aceptable no es prudencia; es no haber entendido la fórmula.

Error 2: no documentar la fórmula de proyección.

La NIA-ES 530.7 obliga a documentar cómo se proyectaron los errores. Los papeles registran los errores encontrados y, en demasiados casos, la conclusión salta a "el importe no es relevante" sin cálculo. Sin proyección matemática, el revisor no puede evaluar si la conclusión es defensible. La proyección no es opcional, ni se sustituye con un argumento cualitativo.

Error 3: cambiar parámetros después de ver resultados.

Si el riesgo definido era 5% y, tras encontrar errores, el papel se reescribe a 10%, el expediente está abierto. Los parámetros se documentan antes. Si los resultados no son aceptables, se amplía el procedimiento; no se redefine el riesgo.

Error 4: el desacuerdo legítimo sobre errores sistemáticos.

Aquí dos auditores con experiencia pueden discrepar de buena fe. Si en una muestra aparece un error que parece sistemático (por proveedor, por mes, por usuario que registra), una posición sostiene que el auditor debe ampliar el muestreo dentro de la subpoblación afectada y proyectar por separado, como en el ejemplo de Mediterráneos S.L. Otra posición, igual de defendible, sostiene que un patrón sistemático ya no es un problema de muestreo sino una posible deficiencia de control, y debería tratarse como hallazgo bajo NIA-ES 265, no proyectarse como error de auditoría sustantiva. La NIA-ES 530 no resuelve la cuestión por usted. En mi caso prefiero la primera (estratificar y proyectar separado) porque deja más rastro documental, pero conozco socios que aplican la segunda y la defienden bien.

Muestreo estadístico frente a muestreo no estadístico

La paradoja del muestreo estadístico es esta: cuanto más detallado el método, más fácil es para el revisor cuestionarlo, porque cada parámetro está expuesto. El muestreo no estadístico es más blando, pero más fácil de defender con un argumento cualitativo bien escrito. Por eso la mayoría de papeles de trabajo de pequeñas firmas usan no estadístico, y por eso el ICAC pone más reparos al estadístico mal documentado que al no estadístico bien justificado.

El estadístico fija parámetros de riesgo de forma cuantificada. El no estadístico permite seleccionar elementos de alto importe a mano, pero exige una explicación escrita de por qué la muestra es representativa. Ambos cumplen la NIA-ES 530. El estadístico es defendible cuando los parámetros están documentados antes; si no lo están, es indefendible. El no estadístico exige un argumento como este: "Seleccioné 80 transacciones del trimestre con mayor volumen, que representa el 32% del importe anual, porque esos meses tenían cambios en plantilla que aumentaban el riesgo de error. Esta muestra cubre los períodos de mayor riesgo identificado en el procedimiento analítico de planificación."

Hay una tensión estructural detrás de todo esto. El muestreo estadístico requiere parámetros documentados antes de ver resultados. El presupuesto del encargo presiona a "completar el procedimiento" lo antes posible, idealmente sin volver atrás. Esa tensión, no la dificultad técnica, es la causa real de los hallazgos del ICAC en muestreo. Si el revisor pregunta de dónde sale el 60, y la respuesta es "es lo que solemos hacer", el expediente está abierto. Llámelo "muestreo a ojo", "lo saqué del bolsillo" o como prefiera. El nombre técnico que circula entre auditores anglosajones es PIOOMA, pero el problema es el mismo en cualquier idioma: una cifra sin fórmula detrás.

Términos relacionados

- Importancia relativa de desempeño: umbral establecido por el auditor por debajo del cual los errores se consideran no significativos; usada para determinar el tamaño de la muestra. - Riesgo de muestreo: posibilidad de que el auditor llegue a una conclusión diferente sobre la población si hubiera verificado el 100% de los elementos en lugar de una muestra. - Procedimientos analíticos: evaluación de relaciones entre datos contables para identificar áreas de mayor riesgo que podrían justificar un tamaño de muestra diferente. - Muestreo por unidades monetarias (MUS): método estadístico que selecciona elementos en proporción a su importe en el balance, usado con frecuencia en auditoría de saldos finales. - Prueba de controles: procedimientos para evaluar si los controles internos operaron de forma efectiva, ejecutados con frecuencia mediante muestreo de atributos. - Evaluación de resultados de muestreo: análisis de los errores encontrados en la muestra y proyección a la población bajo NIA-ES 530.7.

---