Qué es un valor atípico en estadística: un método rápido y fácil

Los valores atípicos en las estadísticas se tratan como valores de datos que difieren significativamente de la mayor parte de un conjunto de datos determinado. Estos valores de datos se encuentran fuera de la tendencia general, que ya reside en los datos. Los valores atípicos son desviaciones extremadamente bajas o extremadamente altas en un conjunto de datos determinado que pueden generar un error en sus estadísticas. Por ejemplo, si uno midió la longitud de la nariz de un niño, su valor común podría ser si Pinocho estuviera implicado en la clase dada de valores de datos.

Es necesario examinar el conjunto de datos para estudiar los valores atípicos en las estadísticas, y cómo encontrar valores atípicos en las estadísticas que podrían causar algunas dificultades. Aunque esto podría ser fácil de reconocer con la ayuda de un diagrama de tallo donde algunos valores varían de los valores de datos dados. Entonces, ¿cuánta variación tiene el valor como valor atípico? Estudiaremos un análisis particular que proporciona un estándar externo sobre lo que desarrolla un valor atípico en los datos.

Los valores atípicos en las estadísticas tienen una diferencia significativa de los otros datos. Hay varias personas que se han confundido acerca del ruido y los valores atípicos. Pero hay una diferencia significativa entre los dos. Por otro lado, el ruido se considera un error aleatorio, mientras que los valores atípicos son parte de los datos.

A continuación he mencionado todos los detalles necesarios con respecto a los valores atípicos en las estadísticas. Además, he proporcionado algunos ejemplos para una mejor comprensión también. Desplácese hacia abajo en la página para conocer todos estos detalles.

Índice de contenidos
  1. ¿Qué son los valores atípicos en estadística?
    1. Ejemplos de valores atípicos en estadística:
  2. ¿Qué es un valor atípico en estadística?
  3. ¿Cómo clasificar los valores atípicos?
    1. 1. Valores atípicos univariados
    2. 2. Valores atípicos multivariados
    3. Lee mas:
    4. ¿Cómo encontrar valores atípicos en las estadísticas utilizando el rango intercuartil (IQR)?
  4. ¿Cómo lidiar con los valores atípicos?
    1. 1. Eliminar registros anómalos
    2. 2. Congelar datos atípicos
    3. 3. Proporcione el nuevo valor
    4. 4. Prueba a cambiar el valor
  5. ¿Cuándo eliminar los valores atípicos en las estadísticas?
  6. Conclusión
  7. Preguntas frecuentes
    1. Q1. ¿Cómo se determina un valor atípico en las estadísticas?
    2. Q2. ¿Cuáles son los valores atípicos con el ejemplo?

¿Qué son los valores atípicos en estadística?

Una definición de valores atípicos en estadística se puede considerar como una sección de datos utilizada para representar un rango extraordinario de un punto a otro. O podemos decir que son los datos que quedan fuera de los demás valores dados con un conjunto de datos. Si uno tuviera a Pinocho en una clase de adolescentes, la longitud de su nariz se consideraría un valor atípico en comparación con otros niños.

Ejemplos de valores atípicos en estadística:

En el conjunto dado de valores aleatorios, 5 y 199 son valores atípicos. “5” se considera un valor extremadamente bajo, mientras que “199” se reconoce como un valor extremadamente alto. Pero los valores atípicos no siempre se toman como estos valores simples.

Supongamos que uno ha aceptado los cheques de pago entregados en el último mes: $220, $245, $20 y $230.

Se considera que su salario promedio es de $ 130. Pero el cheque de pago más pequeño es de $ 20, puede ser porque esa persona se fue de vacaciones; es por eso que un sueldo semanal promedio es de $ 130, que no es una representación real de sus ganancias. Su promedio es más como $ 232 si acepta el valor atípico ($ 20) del conjunto de datos especificado. Es por eso que buscar valores atípicos puede no ser tan simple como parece.

El conjunto de datos proporcionado podría verse así:

Podría suponerse que 2 es un valor atípico y posiblemente 60. Pero se espera que 60 sea el valor atípico en el conjunto de datos.

Los bigotes y los gráficos de cajas a menudo representan valores atípicos:

Sin embargo, uno puede no tener una transición al bigote y al gráfico de caja. Y si lo hace, es posible que los pocos diagramas de caja no expliquen los valores atípicos. Por ejemplo, el gráfico tiene bigotes que se destacan para incorporar valores atípicos como:

Gráfico de caja y bigote que incluye valores atípicos en el bigote.

y por esto No creo en obtener valores atípicos en estadísticas de bigotes y un gráfico de caja. Dijo que los bigotes y los gráficos de caja podrían ser un recurso valioso para presentar después determinaremos cuáles son sus valores atípicos: el método eficiente para obtener todos los valores atípicos con la ayuda del rango intercuartílico (RIC). Estos IQR incluyen la cantidad promedio de datos; por lo tanto, los valores atípicos podrían determinarse rápidamente una vez que se comprenda el IQR.

¿Qué es un valor atípico en estadística?

El IQR (rango intercuartílico) no se ve afectado por los valores atípicos. Una de las razones más significativas es que la mayoría de las personas prefieren usar el IQR mientras miden la "difusión" de los datos proporcionados. Dado que el IQR considera el rango del centro que es el 50% del valor de los datos proporcionados, no afecta el valor de los valores atípicos.

¿Cómo clasificar los valores atípicos?

Los valores atípicos se pueden clasificar en dos categorías diferentes, a saber, univariados y multivariados. Verifiquemos ambos con el ejemplo relevante.

1. Valores atípicos univariados

Por lo general, representa una sola variable. O podemos decir que los valores atípicos representan una sola columna. Veamos un ejemplo.

En la columna de salario anterior, el valor 5000 es el valor atípico. Este valor atípico se representa en la columna única (es decir, salario). Por lo tanto, es el valor atípico univariante.

2. Valores atípicos multivariados

Es el valor atípico, que se da en las combinaciones conjuntas de dos o más variables. Tomemos un ejemplo:

Lo anterior muestra un gráfico de dispersión entre las variables edad y salario. Los valores atípicos bivariados se representan aquí. Puede notar que los datos de una sola variable no tienen valores atípicos en algunos casos. Pero cuando se combina con otros datos, aumenta la posibilidad de que ocurran valores atípicos. Estos se conocen como valores atípicos multivariados.

Lee mas:

¿Cómo encontrar valores atípicos en las estadísticas utilizando el rango intercuartil (IQR)?

Un valor atípico se describe como un punto de datos que varía por encima de 1,5 IQR por debajo del primer cuartil (Q1). También se encuentra por encima del tercer cuartil (Q3) dentro de un conjunto de datos.

Bajo = (Q1) - 1.5 IQR, alto = (Q3) + 1.5 IQR

Ejemplo de problema: Encuentra todos valores atípicos en las estadísticas del conjunto de datos proporcionado: 10, 20, 30, 40, 50, 60, 70, 80, 90, 100.

Paso 1: Obtenga el rango intercuartílico, Q1 (percentil 25) y Q3 (percentil 75).

RIC = 50

Q1 (percentil 25) = 30 Q3 (percentil 75) = 80
Q2 (percentil 50) = 55 Q3 (percentil 75) = 80
Cómo calcular el IQR del valor del conjunto de datos anterior:
Ordene todos los valores de datos y dibuje una línea entre los valores para encontrar Q1 (percentil 25) y Q3 (percentil 75). [Q1:(10,20,30,40,50) | Q2: (60,70,80,90,100)]Encuentra la mediana de Q1 y Q2, que es 30 y 80. Resta Q1 de Q2. [80-30 = 50] RIC = 50.

¿Cómo lidiar con los valores atípicos?

Hay 4 enfoques diferentes para tratar con valores atípicos. Y estos son los siguientes:

1. Eliminar registros anómalos

En algunos casos, siempre es mejor eliminar o eliminar registros del conjunto de datos. Ayuda a evitar que los eventos o la persona distorsionen el análisis estadístico.

2. Congelar datos atípicos

Uno de los otros enfoques para manejar el valor atípico es cerrarlo. Por ejemplo, en la variable salario, observa que el salario por encima del valor particular se comporta como el salario más bajo. En estos casos, limita el valor del salario para mantenerlo sin cambios durante el análisis.

3. Proporcione el nuevo valor

Si encuentra un valor atípico que se eligió por error, puede asignarle el nuevo valor. Un método común para esto incluye un modelo de regresión que puede predecir el valor faltante.

4. Prueba a cambiar el valor

A veces, es mejor transformar los datos en lugar de utilizar los datos en sí. Por ejemplo, intente cambiar el valor como un porcentaje. Esto hace que sus datos sean más confiables y puede administrarlos más fácilmente.

Ahora aquí viene una pregunta: ¿De dónde vienen los valores atípicos en las estadísticas?
Es bastante importante tener en cuenta que es posible que se requieran habilidades analíticas y de dominio en profundidad. Además, es difícil saber de dónde vienen o de dónde vienen los valores atípicos en las estadísticas. Pero siempre trate de considerar varias oportunidades, ya que siempre ayuda a proceder mejor.
Por lo tanto, podemos decir que siempre es útil comprender sus datos y luego continuar con la investigación. Pruebe diferentes enfoques para ver el sentido teórico y obtener respuestas adecuadas a los problemas de sus valores atípicos.

¿Cuándo eliminar los valores atípicos en las estadísticas?

Hay algunas condiciones bajo las cuales es necesario abandonar la idea de valores atípicos. Y estos son:

  1. Si los valores atípicos son causados ​​por datos medidos o ingresados ​​incorrectamente, abandone la idea de los valores atípicos.
  2. Si los valores atípicos no afectan el resultado y los supuestos, entonces se debe abandonar la idea de los valores atípicos.
  3. Cuando los valores atípicos afecten sus suposiciones y resultados, ejecute su análisis de datos sin o con el valor atípico.

Conclusión

Varios estudiantes tienen dificultad para encontrar valores atípicos en estadística; por eso mencionamos dos métodos diferentes para calcularlos. Aparte de esto, también existen otros métodos avanzados para obtener el valor atípico. Cómo prueba Q de Dixon, ESD generalizado y mucho más. Utilice el método IQR y Tukey mencionado anteriormente para solucionar los valores atípicos.

Si todavía tiene dificultades con alguna de las asignaciones de estadísticas y tareas. Nuestros expertos entregarán el uso de nuestros servicios para obtener datos de alta calidad para todas las tareas y tareas antes de la fecha límite. La ayuda de expertos está disponible las 24 horas del día, los 7 días de la semana, ya que nuestros ejecutivos de servicio al cliente están disponibles las 24 horas del día, los 7 días de la semana. Y utiliza nuestros servicios para obtener calificaciones A+ en tus estudios. Obtenga los mejores servicios de ayuda con la tarea de estadísticas en línea de los expertos.

Preguntas frecuentes

Q1. ¿Cómo se determina un valor atípico en las estadísticas?

El punto de datos es un valor atípico si es más de 1,5 veces el IQR por debajo del primer cuartil o 1,5 veces el IQR por encima del tercer cuartil. Esta es la regla general para usarlo.
Si desea calcular el IQR, necesita saber el percentil del primer y tercer cuartiles.

Q2. ¿Cuáles son los valores atípicos con el ejemplo?

Un valor atípico es un valor que se encuentra fuera de la mayoría de los demás valores en un conjunto de datos. Por ejemplo, en este valor 33,12,45,77,12,4,45,44, tanto 4 como 77 son "valores atípicos".

¿Ha sido útil el contenido?

Promedio de puntuación 0 / 5. Votos: 0

Hasta ahora, ¡no hay votos!. Sé el primero en puntuar este contenido.

Más contenido relacionado

Subir