06 Introduction to the Analysis of Patterns & Relationships.
Análisis de la Demanda y Recursos Policiales
Introducción a la Demanda de Servicios Policiales
- La demanda pública por servicios policiales ha aumentado más rápidamente que los recursos disponibles, lo que ha llevado a las fuerzas policiales a implementar métodos para priorizar y gestionar su respuesta.
- Este comentario se basa en un informe del UK Audit Commission de 1993, el cual sigue siendo relevante hoy debido a la crisis económica y la reducción de recursos en el ámbito policial.
Importancia del Análisis en la Respuesta Policial
- Los analistas juegan un papel crucial al identificar patrones significativos en grandes volúmenes de datos, permitiendo una utilización más eficiente de los recursos limitados.
- Se menciona el orden de operaciones matemáticas como una analogía para resaltar la importancia de seguir reglas básicas al analizar datos.
Ejemplos Prácticos de Operaciones Matemáticas
- Se presenta un ejemplo sencillo: resolver 30 / 5 * 2 + 1 siguiendo el orden correcto, enfatizando que realizar operaciones en el orden incorrecto puede llevar a respuestas erróneas.
- En otro ejemplo más complejo (5 + 4 - 2 en (2^2 * 3 / 6 - 1)), se demuestra cómo aplicar correctamente las operaciones matemáticas para llegar al resultado final.
Estadísticas y su Relevancia
- La mención de estadísticas provoca reacciones negativas entre muchos, incluidos investigadores; sin embargo, son herramientas útiles utilizadas diariamente.
- La aversión hacia las estadísticas proviene generalmente de una falta de comprensión sobre estas herramientas matemáticas simples pero poderosas.
Herramientas Estadísticas Básicas
- Las estadísticas se definen como el estudio sobre la colección, organización, análisis e interpretación de datos con fines específicos.
- Desde los tiempos del padre del policía moderno, Sir Robert Peele, las agencias han recolectado datos que muchas veces no se utilizan adecuadamente.
- A pesar del avance tecnológico y herramientas sofisticadas disponibles para manejar datos, es esencial entender herramientas estadísticas básicas para identificar relaciones subyacentes dentro de áreas geográficas específicas.
Tipos Básicos de Estadísticas
- Existen dos ramas principales: estadísticas descriptivas e inferenciales. Las descriptivas resumen o describen colecciones de datos mediante métodos tabulares o gráficos.
Estadísticas Descriptivas e Inferenciales
Importancia de las Estadísticas Descriptivas
- Las estadísticas descriptivas son herramientas útiles que permiten extraer conclusiones de datos sujetos a variación aleatoria, facilitando la comprensión y visualización de grandes volúmenes de información.
- Este tipo de estadísticas utiliza herramientas para analizar datos cuantitativos, ayudando a identificar patrones mediante descripciones tabuladas, gráficas y comentarios estadísticos.
- Aunque no permiten hacer inferencias más allá del conjunto de datos analizado, son esenciales para resumir y presentar la información de manera significativa.
Limitaciones y Funciones
- Los datos cuantitativos se miden en una escala numérica y pueden ser presentados en tablas, gráficos e histogramas; sin embargo, las estadísticas descriptivas tienen limitaciones al no permitir conclusiones sobre poblaciones más amplias.
- Estas estadísticas solo permiten hacer sumas sobre los individuos u objetos medidos, iluminando el pensamiento pero sin ofrecer inferencias directas.
Estadísticas Inferenciales
- Las estadísticas inferenciales permiten realizar generalizaciones o predicciones sobre una población a partir de una muestra representativa.
- Una población incluye todos los datos relevantes; por ejemplo, si se estudian delitos en un área específica, esa sería la población objetivo.
Muestras y Parámetros
- Cuando no se tiene acceso a toda la población, se utilizan muestras (por ejemplo, encuestar a mil personas para representar al Reino Unido), lo que permite aplicar técnicas inferenciales.
- Es crucial que la muestra represente con precisión a la población; mientras que las propiedades como media o rango son parámetros en poblaciones completas, en muestras se denominan estadísticas.
Herramientas Estadísticas
- En este módulo se examinarán más detalladamente las estadísticas descriptivas junto con sus herramientas: medidas de tendencia central, dispersión y distribución.
- Las medidas de ubicación resumen un conjunto de datos mediante un valor central representativo. Esto incluye conceptos familiares como media aritmética.
Cálculo de Medidas Centrales
- Para determinar medidas centrales es necesario ordenar los datos cronológicamente. La medida central busca capturar lo típico del conjunto mediante un único número representativo.
Medidas de Tendencia Central: Media, Mediana y Moda
La Media
- La media se calcula como la suma de todos los datos (Σx) dividida por el número de variables (n). En un conjunto de datos con 20 elementos que suman 708, la media es 78 / 20 = 35.4.
- La media tiene ventajas significativas, como utilizar todos los valores del conjunto de datos y permitir cálculos estadísticos adicionales. Sin embargo, su desventaja principal es que se ve afectada por valores atípicos.
La Mediana
- La mediana es el valor central que separa la mitad superior e inferior de un conjunto ordenado. Su cálculo varía según si hay un número impar o par de variables en el conjunto.
- Para conjuntos con un número impar de variables, la mediana es simplemente el número en el medio. En un ejemplo dado, con números ordenados, la mediana sería el número 13.
- Para conjuntos con un número par de variables, se identifican los dos números centrales y se promedian. Por ejemplo, para los números 11 y 13: (11 + 13)/2 = 12.
- Las ventajas de la mediana incluyen ser menos susceptible a valores extremos; sin embargo, no considera todos los valores del conjunto ni puede usarse para cálculos estadísticos adicionales.
La Moda
- La moda es el valor más frecuente en un conjunto de datos. Aunque no es obligatorio ordenar los datos para encontrarla, facilita su identificación.
- Identificar la moda requiere observación directa; no existe una fórmula útil para calcularla. Un ejemplo muestra que en un conjunto ordenado donde el número 12 aparece tres veces, este es unimodal.
- Si hay múltiples modos (por ejemplo, dos números representados tres veces), se dice que el conjunto es bimodal; si hay más de dos modos, se clasifica como multimodal.
Comparación entre las Medidas
- Todas las medidas discutidas tienen sus ventajas y desventajas. Es crucial considerar todas ellas para obtener una imagen precisa del conjunto de datos analizado.
Otras Medidas Menos Comunes
- Existen otras medidas menos familiares como la media truncada (promedio después de descartar ciertos valores extremos), rango medio (promedio entre máximo y mínimo), y medias ponderadas que integran componentes específicos a ciertos elementos del dato.
- También están las medias geométrica y armónica; estas son más complejas pero útiles en contextos específicos. Sin embargo, generalmente las medidas más comunes son suficientes si los datos siguen una distribución normal.
Importancia del Centro en Conjuntos de Datos
¿Cuál es la medida de tendencia central más adecuada?
Medidas de ubicación y su relevancia
- En un conjunto de datos normalmente distribuido, la media, mediana y moda tienen el mismo valor. La elección de la medida de ubicación depende del uso previsto de la información resultante.
- La media es relevante para calcular totales; por ejemplo, el ingreso medio en una familia indica cuánto puede gastar cada miembro en necesidades.
- Para determinar ahorros para unas vacaciones, se considera que el fondo vacacional depende del ahorro total familiar, calculado como la media multiplicada por el número de miembros.
- En una familia con cinco miembros (dos adultos trabajadores y tres niños sin ingresos), la media podría sugerir que todos ahorran cuando solo los adultos lo hacen.
- Elegir una medida que respalde un punto de vista puede ser engañoso; esto es común entre políticos y líderes poco éticos.
Estadísticas salariales y su interpretación
- Las estadísticas salariales del Reino Unido muestran que el salario promedio era £30,000 en 2012/13, creando una impresión errónea sobre los ingresos reales.
- Mientras que un trabajador con salario mínimo ganaba £12,200 al año, algunos ejecutivos ganaban hasta £16,000. Esto plantea preguntas sobre qué promedio realmente representa a las personas comunes.
- La diferencia notable entre la media (£30,000) y la mediana (£22,000) resalta cómo los promedios pueden ser engañosos. La moda probablemente se agrupa alrededor del salario mínimo.
- El sesgo hacia salarios bajos sugiere que el gobierno podría querer dar una imagen más favorable sobre la riqueza general.
- Aislando solo la media puede resultar inútil debido a su susceptibilidad a valores atípicos; es crucial examinar múltiples medidas para obtener una imagen realista.
Medidas de dispersión
- Se discutirán las limitaciones individuales de las medidas de ubicación y su idoneidad según diferentes tipos de conjuntos de datos.
- No todas las medidas son apropiadas para todos los tipos; por ejemplo, solo se puede usar la moda para datos categóricos como nombres o tipos de vehículos.
- Para datos ordinales (como categorías salariales), solo se pueden utilizar moda y mediana. Los datos cardinales permiten usar todas las medidas: media, mediana y moda.
- Un pequeño conjunto ilustrativo muestra robos en una división policial; determinar cuál medida mejor representa estos datos requiere considerar factores adicionales como outliers.
Importancia de las medidas de dispersión
- Las medidas de dispersión describen cómo varía un conjunto de datos; son esenciales junto con las medidas de ubicación para ofrecer una descripción completa del mismo.
Medidas de Dispersión en Estadística
Conceptos Básicos de Dispersión
- Los valores individuales son considerados una característica negativa, a diferencia de las medidas de localización que muestran similitudes en los datos. Las medidas de dispersión indican cómo varían los datos.
- La combinación de medidas de localización y dispersión proporciona una visión más completa del conjunto de datos que cualquiera por sí sola. La desviación estándar es un cálculo complejo, definido como la raíz cuadrada de la varianza.
Cálculo y Utilidad
- El rango se calcula como la diferencia entre el valor máximo y mínimo del conjunto de datos. La desviación estándar es útil para medir la dispersión y será analizada con mayor detalle en otro módulo.
- Aunque el cálculo puede parecer complicado, se recomienda usar hojas de cálculo para facilitar el proceso.
Medidas Adicionales
- Otras medidas incluyen el rango intercuartílico, que indica la dispersión en la región central del conjunto. Se calcula restando el cuartil inferior del cuartil superior.
- Los cuartiles dividen un conjunto ordenado en cuatro grupos iguales; cada grupo representa un cuarto del total.
Forma de Distribución
- La forma o distribución se refiere a cómo se grafica el conjunto de datos, evaluando su normalidad respecto a una distribución normal (campana).
- Las características gráficas incluyen picos, asimetría (skewness), y curtosis (kurtosis). Las estadísticas paramétricas asumen que los datos provienen de una distribución específica.
Asimetría y Curtosis
- La asimetría mide la simetría; un valor cero indica simetría perfecta. Valores extremos sugieren distribuciones no normales.
- Si la asimetría está entre -1.0 y 1.0, se considera moderadamente sesgada; si está entre -0.5 y 0.5, aproximadamente simétrica.
Interpretación Práctica
- Al analizar muestras, es importante considerar que la asimetría no necesariamente refleja toda la población; puede ser resultado de variabilidad muestral.
- La curtosis evalúa si los datos son puntiagudos o planos comparados con una distribución normal; valores altos indican picos pronunciados cerca del promedio.
Resumen sobre Curtosis
- Una curtosis mayor a tres indica una distribución más picuda que lo normal; menos que tres sugiere una curva más plana.
Análisis de la Distribución de Datos
Herramientas Estadísticas: Asimetría y Curtosis
- Microsoft Excel reporta valores de exceso, donde un valor real de 5.5 se reporta como 1.5 y un valor de 1.4 como -1.6, lo que indica desviaciones significativas respecto a la normalidad.
- La asimetría y la curtosis son herramientas estadísticas que ayudan a entender la distribución de los datos en un conjunto analizado, reflejando la forma del histograma correspondiente.
- Si la asimetría está entre +1 y -1 y la curtosis es mayor a 2 pero menor a 4, se puede considerar que los datos siguen una distribución normal; siempre interpretando las estadísticas en el contexto adecuado.
Resumen de Cinco Números
- El resumen de cinco números incluye estadísticos descriptivos clave: media, moda, mediana, máximo y mínimo, proporcionando una visión concisa sobre la distribución del conjunto de datos.
- Este resumen es útil para datos ordinales, cardinales o intervalares/razonales, pero no es adecuado para datos nominales sin orden jerárquico.
Identificación de Valores Atípicos
- El resumen permite identificar valores atípicos y evaluar la asimetría en los datos; aunque no hace suposiciones sobre su distribución.
- Se pueden comparar rápidamente varios conjuntos de datos utilizando tablas o diagramas boxplot (diagrama de caja).
Diagramas Boxplot
- Los diagramas boxplot muestran características como mediana (50% superior e inferior), máximo (sin outliers), mínimo (sin outliers), cuartiles superior e inferior.
- La longitud de las "whiskers" indica si hay más valores extremos hacia el extremo positivo o negativo; esto ayuda a determinar si hay sesgo positivo o negativo en los datos.
Comparación entre Conjuntos de Datos
- Al comparar conjuntos mediante boxplots se pueden observar diferencias notables en las distribuciones; por ejemplo, variaciones en el número total entre diferentes categorías.
- Las observaciones generales pueden indicar similitudes o discrepancias significativas entre grupos comparados; cualquier diferencia evidente merece una investigación adicional.
Variabilidad dentro del Boxplot
- Las secciones desiguales del boxplot indican variabilidad en ciertos rangos; por ejemplo, un whisker largo puede señalar mayor variabilidad entre valores altos.
Análisis de Datos con Diagramas de Caja
Comparación de Regiones a través de Diagramas de Caja
- Es importante considerar el patrón completo de la distribución en un diagrama de caja al comparar conjuntos de datos, buscando características individuales y similitudes o diferencias entre ellos.
- Se han calculado resúmenes estadísticos para tres regiones durante un período de 20 meses, lo que permite una comparación inicial utilizando diagramas de caja.
- Aunque se pueden dibujar a mano, es más fácil y ordenado crear diagramas en Excel; sin embargo, no son gráficos estándar y requieren ajustes específicos.
- Al comparar los diagramas, se observan características notables: la región A tiene valores significativamente más altos que las otras dos, mientras que la región B presenta los valores más bajos y compactos.
- Las diferencias en las ventas (por ejemplo, hamburguesas) y llamadas policiales entre las regiones plantean preguntas sobre por qué existen estas variaciones.
Estadísticas Descriptivas y Herramientas en Excel
- Se ha discutido cómo calcular estadísticas descriptivas básicas para analizar datos; aunque son sencillas, pueden ser tediosas si se hacen manualmente.
- Se recomienda utilizar el paquete de herramientas analíticas en Microsoft Excel para facilitar cálculos rápidos y creación de diagramas.
- El paquete añade funciones financieras, estadísticas e ingenierías adicionales a Excel, permitiendo análisis más profundos mediante ANOVA, pruebas T y otros métodos estadísticos.
- Este paquete permite calcular simultáneamente varias estadísticas descriptivas como medidas de ubicación y dispersión, proporcionando información valiosa sobre los datos analizados.
- Aunque los datos no siguen una distribución normal perfecta, indican similitudes entre media, mediana y moda; además presentan baja curtosis y asimetría.
Comprendiendo Porcentajes
- Un porcentaje es un número dividido por 100; su uso cotidiano incluye descuentos comerciales o informes económicos donde puede transmitir mensajes engañosos si no se interpreta correctamente.
- La relación entre fracciones y porcentajes es fundamental: un porcentaje representa partes por cada 100. Esto simplifica su representación al tener solo un número seguido del símbolo %.
Entendiendo el Impacto de los Porcentajes en Comparaciones
La Importancia del Contexto en los Porcentajes
- Un aumento del 100% puede ser engañoso si no se considera la base; por ejemplo, un incremento de 1 a 2 es diferente que de 1,000 a 2,000.
- Los porcentajes representan partes de un total; el 20% equivale a 20 partes de 100 y se puede expresar como una fracción (20/100).
- Es crucial saber qué representa un porcentaje; incluir el número correspondiente proporciona contexto, como en el caso de descuentos en tiendas.
Comparación de Ofertas y Descuentos
- Al comparar dos ofertas con diferentes porcentajes de descuento, es importante calcular el precio final para entender cuál es más atractivo; ambos ejemplos resultan en £8.
- Las comparaciones entre datos con diferentes tamaños muestren la necesidad de convertir cifras a porcentajes para facilitar la comparación.
Análisis Temporal y Cambios Relativos
- Para analizar cambios en delitos entre años, convertir números absolutos a porcentajes permite una comparación más clara.
- El cálculo del porcentaje implica determinar la fracción que representa un tipo específico de delito respecto al total.
Ejemplo Práctico: Robos entre Años
- En 2012, los robos representaron el 16.1% del total de delitos; esta cifra cayó al 12.8% en 2013, mostrando una disminución significativa.
- Calcular cambios porcentuales ayuda a entender las variaciones entre años; por ejemplo, hubo una caída del 20.78% en robos entre estos años.
Cálculo del Cambio Porcentual
- Es esencial identificar correctamente la base al calcular cambios porcentuales; esto afecta cómo interpretamos aumentos o disminuciones.
- La diferencia porcentual varía según si se calcula desde un valor alto hacia uno bajo o viceversa.
Aplicación Práctica: Precios y Descuentos
- Los precios reducidos se expresan frecuentemente como porcentajes; por ejemplo, un descuento del 12% significa que se reduce £0.12 por cada libra.
- Existen métodos para calcular nuevos valores tras incrementos o reducciones porcentuales; conocer ambos métodos facilita decisiones informadas sobre compras.
Cálculo de Porcentajes y Estadísticas Básicas
Métodos para Calcular Precios con Descuento
- Se explica cómo calcular el precio con descuento multiplicando el precio original por 0.85, resultando en un valor de 155.3 al aplicar esta fórmula a un precio de 180.
- Se presentan dos métodos para calcular el aumento porcentual en una inversión: primero, calculando el monto real del aumento (5% de 100 es igual a 5), y luego sumándolo al valor original (100 + 5 = 105).
Cálculo del Valor Actual de Inversiones
- Alternativamente, se puede calcular el incremento porcentual total (100% + 5% = 105%) y multiplicarlo por el valor original (1.05 * 100 = £105), utilizando formato decimal.
- Ambos métodos producen resultados equivalentes, lo que refuerza la comprensión sobre las diferentes formas de abordar cálculos financieros.
Conceptos Básicos en Estadística
- Se han revisado medidas básicas como la localización y dispersión que ayudan a describir datos y entender los conjuntos ajenos.
- También se ha discutido un resumen estadístico de cinco cifras que permite identificar características dentro de un conjunto de datos y comparar diferentes conjuntos.
Uso de Porcentajes en Comparaciones