Cómo usar el módulo statistics en Python

El módulo incorporado statistics de Python es una herramienta perfecta para realizar cálculos rápidos y análisis estadísticos básicos.

No requiere instalaciones adicionales y es ideal para obtener medidas descriptivas, regresión lineal, correlación y distribuciones normales de forma sencilla.

Importar el módulo

Para comenzar, solo necesitas importar la librería:

import statistics

Si trabajas en modo interactivo, también puedes importar funciones específicas para mayor comodidad.

Estadística Descriptiva

Supón que tienes un conjunto de datos:

a = [4, 4, 3, 6]

Puedes calcular diferentes medidas con una sola línea de código:

  • Media (promedio):
    statistics.mean(a)       # Media aritmética
    statistics.fmean(a)      # Media en formato float
    
  • Media ponderada y geométrica:
    weights = [1, 2, 3, 4]
    statistics.fmean(a, weights)
    statistics.geometric_mean(a)
    statistics.harmonic_mean(a)
    
  • Mediana y moda:
    statistics.median(a)
    statistics.mode(a)
    
  • Desviación estándar y varianza:
    statistics.stdev(a)      # Muestra
    statistics.pstdev(a)     # Población
    statistics.variance(a)
    statistics.pvariance(a)
    
  • Cuartiles o percentiles:
    statistics.quantiles(a)
    

Y naturalmente, también puedes obtener el valor mínimo y máximo:

min(a)
max(a)

Regresión y Correlación

El módulo statistics también permite realizar regresión lineal simple y calcular la correlación entre dos variables.

x = [1,2,3,4,5]
y = [5,7,9,11,13]
slope, intercept = statistics.linear_regression(x, y)

La ecuación resultante será:
y = slope × x + intercept

Para obtener el coeficiente de correlación (r):

statistics.correlation(x, y)

Estas funciones son muy útiles para identificar relaciones lineales en pequeños conjuntos de datos sin recurrir a librerías más complejas.

Distribución Normal

El submódulo NormalDist permite modelar una distribución normal fácilmente:

from statistics import NormalDist
men_height = NormalDist(mu=175.1, sigma=28.41)

Puedes calcular la probabilidad entre dos valores de forma directa:

prob_160_to_180 = men_height.cdf(180) - men_height.cdf(160)

Esto resulta ideal para simulaciones básicas o validaciones rápidas en experimentos y análisis preliminares.

Cuándo usar el módulo STATISTICS

Este módulo es ideal para principiantes, tareas educativas, verificaciones rápidas o pequeños proyectos donde no necesites manejar grandes volúmenes de datos.

✅ Perfecto para: análisis exploratorios, cálculos de aula, ejemplos en notebooks o scripts ligeros.
⚠️ No recomendable para: proyectos de ciencia de datos, aprendizaje automático o análisis masivos.
En esos casos, conviene migrar a librerías como NumPy, SciPy, pandas o statsmodels.


Conclusión

El módulo statistics convierte a Python en una potente calculadora estadística integrada, sin dependencias externas.

Es la mejor forma de entender los fundamentos de la estadística descriptiva antes de pasar a herramientas más avanzadas.

Con unas pocas líneas de código puedes medir, comparar y modelar datos de forma profesional.


Descubre más desde CIBERED

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario