Estadistica Basica Sesion 1 - Universidad Tecnológica de

Curso de Estadística Básica
SESION 1
INTRODUCCIÓN A LA ESTADÍSTICA
M. en C. José Gonzalo Lugo Pérez
José Gonzalo Lugo Pérez
Estadística Básica
Objetivo
Crear una imagen inicial del campo de la estadística así como
introducir y comprender los términos básicos aplicados en su
estudio.
José Gonzalo Lugo Pérez
Estadística Básica
Agenda Sesión 1
•
Introducción a la
Estadística
–
Términos básicos
–
Recolección de
datos
–
Comparación entre
la probabilidad y la
estadística
–
Proceso estadístico
José Gonzalo Lugo Pérez
Estadística Básica
¿Qué es la estadística?
Diccionario de la Real Academia Española:
1.
Estudio de los datos cuantitativos de la población, de los recursos
naturales e industriales, del tráfico o de cualquier otra
manifestación de las sociedades humanas.
2.
Conjunto de estos datos.
3.
Rama de la matemática que utiliza grandes conjuntos de datos
numéricos para obtener inferencias basadas en el cálculo de
probabilidades.
José Gonzalo Lugo Pérez
Estadística Básica
¿Qué es la estadística?
“Medio para recolectar y
representar grandes
cantidades de
información”
“Medio para tomar
decisiones de frente a la
incertidumbre”
José Gonzalo Lugo Pérez
Estadística Básica
¿Qué es la estadística?
Descriptiva
Recolección,
descripción
muestrales
presentación y
de
los
datos
Estadística
Inferencial
Técnica de interpretación de los
valores
resultantes
de
las
técnicas descriptivas y a la toma
de decisiones y obtención de
conclusiones sobre la población
muestreada
José Gonzalo Lugo Pérez
Estadística Básica
¿Qué es la estadística?
•
Ciencia de recolectar,
describir e interpretar
datos
José Gonzalo Lugo Pérez
Estadística Básica
Caso
•
Ocupar un asiento
incómodo
durante
largos periodos no es
gracioso. Ocupar su
sitio en el asiento de
un avión cuando se es
más grande que el
promedio de la gente,
puede
ser
verdaderamente
penoso.
José Gonzalo Lugo Pérez
Estadística Básica
Viajar es un problema
Lo que menos agrada a los viajeros robustos y altos cuando viajan:
Asientos estrechos en aviones
99%
Alquiler de automóviles
económicos y el gasto para
obtener un automóvil más
grande
Camas de hotel demasiado
pequeñas, estrechas o suaves
Sillas y mesas de restoranes
sujetas al piso
Regaderas demasiado bajas en
hoteles y moteles
87%
83%
80%
77%
Nota: Se permitió más de una respuesta.
Fuente: Encuesta aplicada a 10 000 clientes de King-Size Co.
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio
•
¿Quién fue
encuestado?
•
¿Cuántos fueron
encuestados?
•
Explique el significado
de “Asientos estrechos
en aviones: 99%”
•
¿Porqué se han
reportado porcentajes
tan elevados?
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio
•
Determine cuál de las siguientes proposiciones es
de naturaleza descriptiva y cuál es inferencial.
a)
Lo que menos agrada al 99% de todos los
viajeros robustos y altos son los asientos
estrechos de los aviones.
b)
Lo que menos agrada al 99% de los 10 000
clientes de la King-Size Co. Son los asientos
estrechos de los aviones.
José Gonzalo Lugo Pérez
Estadística Básica
Términos Básicos
•
Población
•
Muestra
•
Variable
•
Dato
•
Datos
•
Experimento
•
Parámetros
•
Estadística
José Gonzalo Lugo Pérez
Estadística Básica
Población
•
Es la colección o conjunto
de individuos, objetos o
eventos cuyas propiedades
serán analizadas.
Ejemplo de población bien
definida
•
“Todos los estudiantes
que han asistido
alguna vez a una
universidad mexicana”
•
“El conjunto de
trabajadores de la
industria entre 20 y 40
años en el Estado de
Querétaro”
José Gonzalo Lugo Pérez
Estadística Básica
Muestra
•
Es un subconjunto de
la población
Una muestra consta de
los individuos, objetos
o medidas
seleccionados de la
población por el
recolector de la
muestra
José Gonzalo Lugo Pérez
Estadística Básica
Variable
•
Característica de
interés sobre cada
elemento individual de
una población o
muestra
•
Ejemplo: La edad de
un estudiante que
ingresa a la
universidad, el color de
su cabello, su estatura
y su peso
José Gonzalo Lugo Pérez
Estadística Básica
Dato
•
Valor de la variable asociada a
un elemento de una población
o muestra. Este valor puede
ser un número, una palabra o
un símbolo
•
Ejemplo: José Hernández
ingresó a la universidad a la
edad de “23” años, su cabello
es “café”, mide “1.80m” y pesa
“83 kg”. Estas cuatro piezas de
datos son los valores de las
cuatro variables aplicadas a
José Hernández.
José Gonzalo Lugo Pérez
Estadística Básica
Datos
•
Conjunto de valores
recolectados para la
variable de cada uno de
los elementos que
pertenecen a la muestra
•
Ejemplo: El conjunto de
25 estaturas
recolectadas de 25
estudiantes.
José Gonzalo Lugo Pérez
Estadística Básica
Experimento
•
Actividad planeada
cuyos resultados
producen un conjunto de
datos
•
El experimento incluye
las actividades para
seleccionar los
elementos y obtener los
valores de los datos
José Gonzalo Lugo Pérez
Estadística Básica
Parámetro
•
Valor numérico que resume
todos los datos de una
población completa. Es un
valor que describe a toda la
población.
•
Ejemplo: La edad
“promedio” en el momento
de admisión de todos los
estudiantes que han
asistido alguna vez a una
universidad o la
“proporción” de estudiantes
que tenían más de 21 años
de edad cuando ingresaron
a la universidad.
José Gonzalo Lugo Pérez
Estadística Básica
Estadística
•
Valor numérico que resume
los datos de la muestra. Es un
valor que describe una
muestra. Casi todas las
estadísticas muestrales se
determinan con ayuda de
fórmulas y suele asignárseles
denominaciones simbólicas.
•
Ejemplo: La estatura
“promedio” encontrada al
utilizar el conjunto de 25
estaturas es un ejemplo de
una estadística muestral.
José Gonzalo Lugo Pérez
Estadística Básica
Determinar los términos básicos...
•
Una estudiante de estadística
está interesada en determinar
algo sobre el promedio del
valor en pesos de los
automóviles que pertenecen al
cuerpo docente de nuestra
universidad.
•
Cada uno de los ocho
términos descritos pueden
identificarse en esta situación
José Gonzalo Lugo Pérez
Estadística Básica
Determinar los términos básicos...
•
La población es la colección de todos los automóviles que pertenecen a todos los miembros
del cuerpo docente de la universidad.
•
Una muestra es cualquier subconjunto de esa población. Por ejemplo, una muestra serían los
automóviles que pertenecen a los profesores del departamento de matemáticas.
•
La variable es el “valor en pesos” de cada automóvil individual.
•
Un dato podría ser el valor en pesos de un automóvil en particular. El automóvil del profesor
Juan Pérez está valuado en $100,000 pesos
•
Los datos serían el conjunto de valores que corresponden a la muestra obtenida ($100,000;
$148,000; $30,000; $23,000...)
•
El experimento serían los métodos aplicados para seleccionar los automóviles que integren
la muestra y determinar el valor de cada automóvil de la muestra. Podría efectuarse
preguntando a cada miembro del departamento de matemáticas o de otras maneras.
•
El parámetro sobre el que se está buscando información es el valor “promedio” de todos los
automóviles de la población.
•
La estadística que se encuentre es el valor “promedio” de todos los automóviles de la
muestra.
José Gonzalo Lugo Pérez
Estadística Básica
Variable
Cualitativa
Variable que clasifica o
describe un elemento
de una población. Las
operaciones aritméticas
como sumar y obtener
promedios no son
significativas para datos
que resultan de una
variable cualitativa
Cuantitativa
Variable que cuantifica
un elemento de una
población. Las
operaciones aritméticas
como sumar y obtener
promedios sí son
significativas para datos
que resultan de una
variable cuantitativa
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio 1
•
Un fabricante de medicamentos está interesado en la proporción de
personas que padecen hipertensión (presión arterial elevada) cuya
condición pueda ser controlada por un nuevo producto desarrollado por
la empresa. Se condujo un estudio en el que participaron 5000 personas
que padecen de hipertensión, y se encontró que 80% de las personas
pueden controlar su hipertensión con el medicamento. Suponiendo que
las cinco mil personas son representativas del grupo con hipertensión,
conteste las siguientes preguntas:
a)
¿Cuál es la población?
b)
¿Cuál es la muestra?
c)
Identifique el parámetro de interés
d)
Identifique la estadística y proporcione su valor
e)
¿Se conoce el valor del parámetro?
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio 2
•
Un técnico de control de calidad selecciona piezas ensambladas de una
línea de montaje y registra la siguiente información sobre cada pieza:
–
A: defectuosa o no defectuosa
–
B: el número de identificación del trabajador que ensambló la
pieza.
–
C: el peso de la pieza.
a)
¿cuál es la población?
b)
La población ¿es finita o infinita?
c)
¿cuál es la muestra?
d)
Clasifique las respuestas para cada una de las tres variables
como datos de atributo o cuantitativos.
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio 3
•
Identifique las siguientes expresiones como ejemplos de variables de
atributos (cualitativas) o variables numéricas (cuantitativas)
a)
La resistencia a la rotura de un tipo de cuerda dado
b)
El color de cabello de los niños que se presentan a una audición
para la revista musical Annie
c)
El número de señales de alto que hay en poblaciones con menos
de quinientos habitantes
d)
Si un grifo es o no defectuoso
e)
El número de reactivos contestados correctamente en una prueba
estandarizada
f)
El tiempo necesario para contestar una llamada telefónica en cierta
oficina de bienes raíces.
José Gonzalo Lugo Pérez
Estadística Básica
Recolección de Datos
•
Definir los objetivos de la investigación o del experimento.
–
•
Definir la variable y la población de interés.
–
•
Ejemplos: duración del tiempo de recuperación de los pacientes
que sufren alguna enfermedad particular; ingreso total de los
hogares en algún municipio.
Definir los esquemas para recolectar y medir los datos.
–
•
Ejemplos: comparar la eficacia de un nuevo medicamento con la
eficacia del medicamento normal; estimar el ingreso familiar
medio en algún municipio.
Esto incluye los procedimientos de muestreo, el tamaño de la
muestra y el instrumento de medición (cuestionario, por teléfono,
etc.) de los datos.
Determinar las técnicas idóneas para realizar el análisis de datos:
descriptivas o inferenciales.
José Gonzalo Lugo Pérez
Estadística Básica
Nota:
•
A menudo ocurre que un analista se encuentra con datos ya
recolectados, tal vez, incluso, recolectados para otros fines, lo
cual imposibilita determinar si los datos son “buenos” o no. Es
mucho mejor recolectar los datos propios.
•
A continuación se describe la población y la variable de interés
para una investigación específica:
–
La oficina de inscripciones de nuestra universidad desea
estimar el costo “promedio” actual de los libros de texto
por semestre, por estudiante. La población de interés es
la “matrícula estudiantil actual”, y la variable es la
“cantidad total gastada en libros de texto” por cada
estudiante en este semestre.
José Gonzalo Lugo Pérez
Estadística Básica
Métodos para recolectar datos
Se controla o modifica el entorno y
se observa el efecto sobre la variable
bajo estudio.

Experimento
Los datos se obtienen al muestrear
alguna parte de la población de
interés.
No se modifica el entorno

Encuesta
José Gonzalo Lugo Pérez
Estadística Básica
Marco Muestral
•
Es una lista de los elementos que pertenecen a la
población de la cual se obtendrá la muestra.
José Gonzalo Lugo Pérez
Estadística Básica
Diseño de la Muestra
•
Es importante que el marco muestral sea representativo de la población.
Una vez establecido, se procede a la selección de los elementos de la
muestra. Este proceso de selección se denomina Diseño de la Muestra.
Este se clasifica en dos categorías:
–
Muestreo de Juicio (o de Selección intencional)
–
Muestreo probabilístico
José Gonzalo Lugo Pérez
Estadística Básica
Muestreo de Juicio (o de Selección
intencional)
•
Las muestras son elegidas con base en el hecho de
que son “típicas”
José Gonzalo Lugo Pérez
Estadística Básica
Muestreo Probabilístico
•
Son muestras en que los
elementos a seleccionar se
obtienen con base en la
probabilidad.
Cada
elemento de una población
tiene cierta probabilidad de
ser elegido como parte de
la muestra. Uno de los
métodos más comúnmente
utilizado para recolectar
datos es el muestreo
aleatorio.
José Gonzalo Lugo Pérez
Estadística Básica
Muestreo Aleatorio
•
Una muestra es seleccionada
de modo que todos los
elementos de la población
tienen la misma probabilidad
de ser elegidos. De igual
manera, todas las muestras de
tamaño n tienen la misma
probabilidad de ser elegidas.
Las muestras aleatorias se
obtienen por muestreo con
reemplazamiento
en
una
población finita o por muestreo
sin reemplazamiento en una
población infinita.
José Gonzalo Lugo Pérez
Estadística Básica
Ejemplo
•
El señor Hernández quien trabaja en la oficina de inscripciones, ha
obtenido un listado por computadora de la matrícula de tiempo completo
para este semestre. Hay 4265 nombres de estudiantes en la lista. El
señor Hernández numeró los nombres de los estudiantes como 0001,
0002, 0003, etc., hasta 4265; luego, usando números aleatorios de
cuatro cifras, identificó una muestra: 1288, 2177, 1952, 2463, 1644,
1004, etc.
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio 4
•
Considere una población simple que consta sólo de los números 1, 2 y 3
(una cantidad ilimitada de cada uno). Hay nueve muestras distintas de
tamaño dos que pueden obtenerse de esta población: (1,1), (1,2), (1,3),
(2,1), (2,2), (2,3), (3,1), (3,2), (3,3).
a)
Explique porqué la lista anterior de muestras representa todas
las posibles muestras aleatorias de tamaño dos que pueden
extraerse aleatoriamente de la población {1, 2, 3}.
b)
Si la población consta de los números 1, 2, 3 y 4, enumere
todas las muestras de tamaño dos que pueden elegirse.
c)
Si la población consta de los números 1, 2 y 3, enumere todas
las muestras de tamaño tres que pueden elegirse
d)
Si la población consta de los números 1, 2, 3 y 4, enumere
todas las muestras de tamaño tres que pueden elegirse
José Gonzalo Lugo Pérez
Estadística Básica
Probabilidad vs Estadística
La probabilidad es el vehículo de la estadística
José Gonzalo Lugo Pérez
Estadística Básica
Ejercicio 5
•
Clasifique cada una de las siguientes afirmaciones como problema de probabilidad o de
estadística.
–
Determinar si un nuevo medicamento reduce el tiempo de recuperación de cierta
enfermedad.
–
Determinar la posibilidad de obtener “cara” cuando se lanza una moneda
–
Determinar el tiempo de espera necesario para pagar y salir de una tienda
–
Determinar la posibilidad de obtener una mano de “veintiuno”
–
Determinar cuánto tiempo es necesario para manejar un sondeo telefónico típico
en una oficina de bienes raíces
–
Determinar la duración de la vida de los focos de 100 watts producidos por una
empresa
–
Determinar la posibilidad de extraer una bola azul de un tazón que contiene 15
bolas, de las cuales 5 son azules.
–
Determinar la resistencia al corte de los remaches recientemente adquiridos por
una compañía para construir aviones.
José Gonzalo Lugo Pérez
Estadística Básica
El proceso estadístico
Población
estadística
Recolección de
datos sobre los
cuales se desea
reunir información
Conclusiones
Determinar lo
que se quiere
saber
Analizar las
estadísticas.
Determinar lo que
indican sobre la
población
Objetivo del análisis
¿Qué es necesario
conocer?
¿Qué espera
encontrarse?
¿Cómo se obtendrán los
datos de la muestra?
Recolectar
datos
Estadísticas de la
muestra
Gráfica numérica
Muestra
Datos
recolectados de
la población
y
Análisis de
datos
x
José Gonzalo Lugo Pérez
Estadística Básica