organización de datos

 ¿que son los datos?

Los datos representan un fragmento de una cantidad, medida, descripción o palabra, los cuales son agrupados o clasificados de una determinada manera para generar de información



diagrama de tallos y hojas 

El diagrama de tallos y hojas permite obtener una distribución de frecuencias y su representación gráfica de manera simultánea. Se separa cada punto de datos en una "hoja" (normalmente el último dígito) y un "tallo" (el dígito o dígitos principales)




Éste es un diagrama de tallos y hojas que
muestra gráficamente el conteo del número de pares de botas en cada una de las tiendas de una cadena que vende zapatos, la cual se basa en los datos: 17, 18, 20, 25, 28, 34, 34, 37, 38 y 50.




Escalas de medición: nominal, ordinal, de intervalo y de razón

Las variables cualitativas tienen escalas de medición nominales y ordinales. Las nominales, como su nombre lo dice, nombran y ordenan datos según su característica; y las ordinales ordenan datos de acuerdo con las necesidades.

















Las variables cuantitativas tienen escalas de intervalo y razón. Las de intervalo, como su nombre lo dice, se caracterizan por tener intervalos decimales. Las variables de razón poseen números enteros o características propias.




Tablas de frecuencias para variables discretas y continuas

Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos y a cada uno de ellos le asigna una frecuencia que, en pocas palabras, son las veces que se repite un número o dato. 

Tipos de frecuencias

  • Frecuencias absolutas: son el número de veces que se repite un número en un conjunto de datos.
  • Frecuencias absolutas acumuladas: es la suma de las frecuencias absolutas.
  • Frecuencia relativa: corresponde a las veces que se repite un número en un conjunto de datos respecto al total, pero se expresa en porcentajes (%).
  • Frecuencia relativa acumulada: es la suma de las frecuencias
  •  relativas.
  1. Valores o categorías: Son los diferentes valores o categorías que se están analizando en la variable. Por ejemplo, si se está analizando la altura de las personas, los valores o categorías podrían ser «bajo», «medio» y «alto».
  2. Frecuencia absoluta: Es el número de veces que cada valor o categoría ocurre en el conjunto de datos. Esta columna muestra el recuento de ocurrencias para cada valor.
  3. Frecuencia relativa: Es la proporción o porcentaje de veces que cada valor o categoría ocurre en el conjunto de datos. Se calcula dividiendo la frecuencia absoluta de cada valor entre el tamaño total de la muestra y se expresa como un decimal o un porcentaje.
  4. Frecuencia acumulada: Es la suma acumulada de las frecuencias absolutas o relativas a medida que se avanza a través de los valores o categorías en la tabla. Puede ser ascendente (sumando desde el valor más bajo hasta cada valor sucesivo) o descendente (sumando desde el valor más alto hacia abajo).

Dependiendo del propósito del análisis, una tabla de frecuencias también puede incluir otros elementos como frecuencia relativa acumulada, porcentajes acumulados, rangos, intervalos, entre otros. Estos elementos adicionales proporcionan información adicional sobre la distribución de los datos y permiten un análisis más detallado.

Conoce también qué es la media, la mediana y la moda.

Cómo hacer una tabla de frecuencias

Para hacer una tabla de frecuencias de manera fácil y sencilla, puedes seguir los siguientes pasos:

  • Recopila tus datos: Reúne los datos que deseas analizar y determina la variable que vas a estudiar. Por ejemplo, si estás analizando las edades de un grupo de personas, tendrás una serie de valores numéricos.
  • Identifica los valores únicos: Identifica todos los valores únicos o categorías presentes en tus datos. Ordena estos valores de manera ascendente o descendente, según tu preferencia.
  • Cuenta las ocurrencias: Para cada valor único, cuenta cuántas veces aparece en tus datos. Esto te dará la frecuencia absoluta de cada valor.
  • Calcula las frecuencias relativas: Opcionalmente, si deseas incluir la frecuencia relativa en tu tabla, divide la frecuencia absoluta de cada valor entre el tamaño total de la muestra y expresa el resultado como decimal o porcentaje.
  • Organiza los datos en una tabla: Crea una tabla con columnas para los valores o categorías, la frecuencia absoluta y, si lo deseas, la frecuencia relativa. Asegúrate de etiquetar cada columna correctamente.
  • Completa la tabla: Ingresa los valores únicos en la columna correspondiente y anota las frecuencias absolutas y relativas en las columnas respectivas.
  • Opcional: Calcula la frecuencia acumulada: Si deseas incluir la frecuencia acumulada en tu tabla, agrega una columna adicional y realiza la suma acumulada de las frecuencias absolutas o relativas a medida que avanzas en la tabla.


como construir una tabla de frecuencia 


como crear un una tabla de frecuencia con muchos datos 

primer paso tomaremos el salario anual de x empresa 

como primer paso  ordenaremos los datos de menor a mayor como se muestra en la tabla

paso dos como son cantidades altas sacaremos el mínimo y el máximo  
mínimo 16,950
máximo 60,985  
--------------------------
              44,035   estas dos cantidades se resta 

como 3 paso voy a dividir la cantidad de 44,035 entre 4 intervalos que quiero que halla en mis distribución

dividiremos 44,035/ 4 no da un resultado de 11,008.75

 4 paso estableceremos un rango para que podamos hacer el conteo de los datos que tenemos en la tabla 

entonces colocaremos el mínimo que es 16950 y a este le sumaremos la cantidad de 11,008.75 ( que fue la división de 44,035 entre los 4 intervalos que tendrá mi tabla de distribución) obtendremos una cantidad de 27,958.75 del primer intervalo

los numero que se encuentren atrapados entre 16950 y 27958.75 (1 intervalo)
los números que se encuentren atrapados entre 27959 y 38,967.75 ( 2 intervalo)
los números que se encuentren atrapados entre 38.968 y 49,976.75 ( 3 intervalo)
los números que se encentren a trepados entre 49,977 y 60,985.75 (4 intervalo)

16,950                                                              
11,008.75
________________ ( primer intervalo)
29,958.75



                  27,959
                   11,008.75
____________________
                  38,967.75    ( segundo intervalo)


                               38,968
                               11,008.75
                           ___________________( tercer intervalo)
                                49,976.75
          

                            49,977
                            11,008.75
                   ________________ ( cuarto intervalo)
                           60,985.75

como quinto paso ordenaremos los intervalos de menor a mayor














6to paso para sacar la frecuencia absoluta (f.a) 
 contabilizaremos cuantos datos se encuentra atrapados entre (16950 y 27958),(27,959 y 38,967)
(38,968 y 49,976) ( 49,977 y 60,985) observando la columna de los datos del salario anual 












7mo paso sacaremos la frecuencia relativa ( fe.re) 
dividiremos la frecuencia absoluta / 40 ( que es el numero de datos de la tabla del salario anual de los trabajadores) 



como octavo paso sacaremos el porcentaje de la tabla  multiplicando la frecuencia relativa por 100



noveno pasa sacaremos la frecuencia absoluta acumulada es iniciar con el 15 por que es el  primer dato de la tabla, mas 16 








TikTok - Make your day. (s. f.-c). https://vm.tiktok.com/ZMr6AE2N2/


Rinott, Y., O'Keefe, C., Shlomo, N., & Skinner, C. (2018). Confidencialidad y privacidad diferencial en la difusión de tablas de frecuencias. Ciencia Estadística. https://doi.org/10.1214/17-STS641.






Comentarios

Entradas populares de este blog

FUNDAMENTOS DE ESTADISTICA📊💻📈📏

probabilidad