El módulo incorporado statistics de Python es una herramienta perfecta para realizar cálculos rápidos y análisis estadísticos básicos.
No requiere instalaciones adicionales y es ideal para obtener medidas descriptivas, regresión lineal, correlación y distribuciones normales de forma sencilla.
Importar el módulo
Para comenzar, solo necesitas importar la librería:
import statistics
Si trabajas en modo interactivo, también puedes importar funciones específicas para mayor comodidad.
Estadística Descriptiva
Supón que tienes un conjunto de datos:
a = [4, 4, 3, 6]
Puedes calcular diferentes medidas con una sola línea de código:
- Media (promedio):
statistics.mean(a) # Media aritmética statistics.fmean(a) # Media en formato float - Media ponderada y geométrica:
weights = [1, 2, 3, 4] statistics.fmean(a, weights) statistics.geometric_mean(a) statistics.harmonic_mean(a) - Mediana y moda:
statistics.median(a) statistics.mode(a) - Desviación estándar y varianza:
statistics.stdev(a) # Muestra statistics.pstdev(a) # Población statistics.variance(a) statistics.pvariance(a) - Cuartiles o percentiles:
statistics.quantiles(a)
Y naturalmente, también puedes obtener el valor mínimo y máximo:
min(a)
max(a)
Regresión y Correlación
El módulo statistics también permite realizar regresión lineal simple y calcular la correlación entre dos variables.
x = [1,2,3,4,5]
y = [5,7,9,11,13]
slope, intercept = statistics.linear_regression(x, y)
La ecuación resultante será:
y = slope × x + intercept
Para obtener el coeficiente de correlación (r):
statistics.correlation(x, y)
Estas funciones son muy útiles para identificar relaciones lineales en pequeños conjuntos de datos sin recurrir a librerías más complejas.
Distribución Normal
El submódulo NormalDist permite modelar una distribución normal fácilmente:
from statistics import NormalDist
men_height = NormalDist(mu=175.1, sigma=28.41)
Puedes calcular la probabilidad entre dos valores de forma directa:
prob_160_to_180 = men_height.cdf(180) - men_height.cdf(160)
Esto resulta ideal para simulaciones básicas o validaciones rápidas en experimentos y análisis preliminares.
Cuándo usar el módulo STATISTICS
Este módulo es ideal para principiantes, tareas educativas, verificaciones rápidas o pequeños proyectos donde no necesites manejar grandes volúmenes de datos.
✅ Perfecto para: análisis exploratorios, cálculos de aula, ejemplos en notebooks o scripts ligeros.
⚠️ No recomendable para: proyectos de ciencia de datos, aprendizaje automático o análisis masivos.
En esos casos, conviene migrar a librerías como NumPy, SciPy, pandas o statsmodels.
Conclusión
El módulo statistics convierte a Python en una potente calculadora estadística integrada, sin dependencias externas.
Es la mejor forma de entender los fundamentos de la estadística descriptiva antes de pasar a herramientas más avanzadas.
Con unas pocas líneas de código puedes medir, comparar y modelar datos de forma profesional.
Artículos Relacionados
Descubre más desde CIBERED
Suscríbete y recibe las últimas entradas en tu correo electrónico.
