Estadística básica para los negocios - Julio Ramos - E-Book

Estadística básica para los negocios E-Book

Julio Ramos

0,0

Beschreibung

Julio Ramos, Víctor del Águila y Ana Bazalar son profesores de la Universidad de Lima con vasta experiencia en la enseñanza universitaria. Trabajan en el área de ciencias del Programa de Estudios Generales, con estudiantes de las carreras de negocios. El trabajo propuesto puede ser abordado tanto por docentes, desde la enseñanza, como por estudiantes, desde sus aprendizajes, pues privilegia el desarrollo de la organización de datos utilizando tablas y gráficos estadísticos, la resolución de problemas por medio de las principales medidas estadísticas y el uso de herramientas gráficas para el análisis exploratorio de datos. En este libro, que fue diseñado para el curso Estadística básica para los negocios, el primero de los cuatro cursos de estadística que recibe el estudiante en su formación universitaria, se propone como texto de consulta y, a la vez, como un cuaderno de trabajo para que le permita desarrollar sus habilidades mediante el ejercicio práctico.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 292

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Colección Textos Universitarios

Estadística básica para los negocios

Primera edición impresa: julio, 2017

Primera edición digital: abril, 2020

© Universidad de Lima

Fondo Editorial

Av. Javier Prado Este 4600,

Urb. Fundo Monterrico Chico, Lima 33, Perú

Apartado postal 852, Lima 100

Teléfono: 437-6767, anexo 30131

[email protected]

www.ulima.edu.pe

Diseño, edición y carátula: Fondo Editorial de la Universidad de Lima

Imagen de portada: Portrait Images Asia by Nonwarit/Shutterstock.com

Versión e-book 2020

Digitalizado y distribuido por Saxo.com Perú S. A. C.

https://yopublico.saxo.com/

Teléfono: 51-1-221-9998

Avenida Dos de Mayo 534, Of. 404, Miraflores

Lima - Perú

Se prohíbe la reproducción total o parcial de este libro, por cualquier medio,sin permiso expreso del Fondo Editorial.

ISBN 978-9972-45-523-0

Índice

Presentación

Capítulo 1. Nociones básicas de la estadística

1. Definición, clasificación e importancia de la estadística

1.1 Estadística

1.2 Clasificación de la estadística

1.2.1 Estadística descriptiva

1.2.2 Estadística inferencial

1.3 Importancia y necesidad de la estadística

2. Términos básicos en estadística

2.1 Población y parámetro

2.1.1 Población o universo

2.1.2 Parámetro

2.2 Muestra y estadístico

2.2.1 Muestra

2.2.2 Estadístico

2.3 Unidad de análisis

2.4 Variables

2.4.1 Clasificación de las variables

2.5 Datos

3. Concepto de medición

3.1 Niveles de medición

4. Fases del método estadístico

Ejercicios y problemas resueltos 1

Ejercicios y problemas propuestos 1

Capítulo 2. Fuentes y técnicas de recolección de datos

1. Fuentes de recolección de datos

1.1 Fuente primaria

1.2 Fuente secundaria

2. Técnicas de recolección de datos primarios

2.1 La observación

2.2 La experimentación

2.3 La encuesta

3. Encuestas por muestreo y censos

3.1 Encuesta por muestreo

3.1.1 Tipos de encuestas por muestreo

3.1.2 Etapas de una encuesta por muestreo

3.1.3 Principales encuestas por muestreo en el Perú

3.2 Censo

3.2.1 Etapas del censo

3.2.2 Principales censos en el Perú

4. Instrumento de medición para encuestas: el cuestionario

4.1 Etapas para su construcción

4.2 Tipos de cuestionario

4.3 Tipos de preguntas en el cuestionario

4.4 Un modelo de cuestionario de encuesta

Ejercicios y problemas resueltos 2

Ejercicios y problemas propuestos 2

Capítulo 3. Técnicas de procesamiento y presentación de datos

1. Uso de sumatorias e intervalos para datos estadísticos

1.1 Sumatorias

1.2 Intervalos

2. Organización de los datos: objetivos y pasos

2.1 Pasos en la organización de los datos

3. Procesamiento o tabulación de datos

3.1 Cuadro estadístico

3.1.1 Estructura y elementos de un cuadro estadístico

3.2 Tablas de frecuencias

3.2.1 Clasificación de las tablas de frecuencias

3.2.2 Estructura y elementos de una tabla de frecuencias

3.3 Gráficos estadísticos

3.3.1 Clasificación de los gráficos estadísticos

3.3.2 Estructura y elementos de un gráfico estadístico

3.4 Procesamiento de datos de una variable cualitativa

3.4.1 Tabla de frecuencias

3.4.2 Gráfico de barras

3.4.3 Gráfico de sectores circulares

3.5 Procesamiento de datos de una variable cuantitativa discreta de recorrido corto

3.5.1 Tabla de frecuencias

3.5.2 Gráfico de bastones

3.6 Procesamiento de datos de una variable cuantitativa continua y discreta de recorrido largo

3.6.1 Tabla de frecuencias

3.6.2 Histograma

3.6.3 Polígono de frecuencias

3.6.4 Ojiva

3.7 Diagrama de dispersión para dos variables cuantitativas

Ejercicios y problemas resueltos 3

Ejercicios y problemas propuestos 3

Capítulo 4. Medidas estadísticas de resumen

1. Definición y clasificación de las medidas estadísticas

1.1 Definición

1.2 Clasificación de las medidas estadísticas

2. Medidas estadísticas de centralización y posición

2.1 Media aritmética (X)

2.1.1 Propiedades de la media aritmética

2.1.2 Cálculo de la media aritmética con datos agrupados en una tabla de frecuencias

2.1.3 Media ponderada

2.2 Mediana (Me)

2.2.1 Cálculo de la mediana con datos no agrupados

2.2.2 Cálculo de la mediana con datos agrupados (tabulados sin intervalos)

2.2.3 Cálculo de la mediana con datos agrupados (tabulados con intervalos)

2.3 Moda o valor modal (Mo)

2.3.1 Cálculo de la moda con datos no agrupados

2.3.2 Cálculo de la moda con datos agrupados (tabulados con intervalos)

2.4 Comparación entre la media aritmética, la mediana y la moda

2.5 Cuantiles

2.6 Cuartiles (Qk)

2.6.1 Cálculo de cuartiles con datos no agrupados

2.6.2 Cálculo de cuartiles con datos agrupados (tabulados con intervalos)

2.7 Percentiles (Pk)

2.7.1 Cálculo de percentiles con datos no agrupados

2.7.2 Cálculo de percentiles con datos agrupados (tabulados en intervalos)

2.8 Media geométrica (XG)

Ejercicios y problemas resueltos 4.1

Ejercicios y problemas propuestos 4.1

3. Medidas estadísticas de dispersión o variabilidad

3.1 Clasificación de las medidas de dispersión o variabilidad

3.1.1 Medidas absolutas de variabilidad

3.1.2 Medidas relativas de variabilidad

3.2 Rango o amplitud total (R)

3.3 Rango intercuartil (RQ)

3.4 Desviación media (Dm)

3.4.1 Cálculo de la desviación media con datos no agrupados

3.4.2 Cálculo de la desviación media con datos agrupados

3.5 Varianza (S2)

3.5.1 Cálculo de la varianza con datos no agrupados

3.5.2 Cálculo de la varianza con datos agrupados

3.5.3 Propiedades de la varianza

3.6 Desviación estándar (S)

3.6.1 Propiedad de la desviación estándar

3.7 Coeficiente de variación (CV)

3.7.1 Interpretación del coeficiente de variación

3.8 Comparación de la desviación media con la desviación estándar

Ejercicios y problemas resueltos 4.2

Ejercicios y problemas propuestos 4.2

4. Medidas estadísticas de asimetría

4.1 Coeficiente de asimetría de Fisher (AF)

4.2 Coeficientes de asimetría de Pearson

4.2.1 Primer coeficiente de Pearson (AP1)

4.2.2 Segundo coeficiente de Pearson (AP2)

4.3 Interpretación del coeficiente de asimetría

Ejercicios y problemas resueltos 4.3

Ejercicios y problemas propuestos 4.3

5. Gráficos para el análisis exploratorio de datos

5.1 Diagrama de tallos y hojas

5.1.1 Construcción del diagrama de tallos y hojas

5.2 Diagrama de caja y bigotes

5.2.1 Detección de datos atípicos u outliers

Ejercicios y problemas resueltos 4.4

Ejercicios y problemas propuestos 4.4

Capítulo 5. Técnicas de conteo de posibilidades

1. Utilidad de las técnicas de conteo

2. Principios de conteo

2.1 Principio de multiplicación

2.2 Principio de adición

3. Permutaciones

3.1 Permutaciones de n objetos diferentes

3.2 Permutaciones de n objetos diferentes tomados de k en k

3.3 Permutaciones con grupos de objetos iguales o repetidos

4. Combinaciones

Ejercicios y problemas resueltos 5

Ejercicios y problemas propuestos 5

Respuestas a los ejercicios y problemas propuestos

Referencias bibliográficas

Presentación

Las primeras formas simples de estadística aparecieron con el inicio de la civilización; se utilizaba representaciones gráficas en rocas, madera y paredes para contar el número de personas, animales o ciertos objetos. En Babilonia, en el año 3000 antes de Cristo, se usaba tablas de arcilla para recolectar información sobre la producción agrícola. Los egipcios ya analizaban los datos de su población y la renta del país mucho antes de construir las pirámides; del mismo modo, la cultura China realizaba censos ordenados por el emperador Tao, hacia el año 2200 antes de Cristo.

En el siglo XIX, la estadística entra en una nueva fase de su desarrollo debido a la generalización del método para estudiar fenómenos de las ciencias naturales y sociales. Se puede considerar a Galton y Pearson los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la estadística inductiva (Estadística para todos, 2008).

En la actualidad, con la popularización de las computadoras la estadística se ha convertido en una ciencia poderosa. El núcleo central de la metodología estadística se basa en técnicas de computación intensiva, aplicadas a grandes masas de datos en búsqueda del modelo ideal. Sin embargo, los fundamentos de la estadística actual, y muchos de sus métodos inferenciales iniciados por Fisher, parten de la estadística descriptiva.

El presente libro trata sobre la estadística descriptiva y ha sido orientado a los negocios, basado en la experiencia docente de los autores en el dictado de los cursos de estadística en la Universidad de Lima. El contenido temático corresponde a la asignatura Estadística Básica para los Negocios, que se dicta en el Programa de Estudios Generales de la Universidad de Lima y comprende cinco capítulos.

En el capítulo 1 se presentan las nociones básicas de la estadística, aquí se desarrollan los términos básicos, así como las fases del método estadístico.

En el capítulo 2 se tratan las fuentes y técnicas de recolección de datos, que es el tema más desarrollado, por su importancia en el procedimiento estadístico.

Las técnicas de procesamiento y presentación de los datos se desarrollan en el capítulo 3, y se agrega una pequeña introducción sobre el uso de sumatorias e intervalos para el resumen de los datos. En este capítulo se trabaja, principalmente, la elaboración de las tablas de frecuencias y los gráficos estadísticos de acuerdo al tipo de variable que se está estudiando.

En el capítulo 4 se estudian las medidas estadísticas de resumen y los gráficos estadísticos para el análisis exploratorio de datos. El estudio de las medidas estadísticas de resumen se dividió en tres partes: medidas de tendencia central y posición, medidas de dispersión o variabilidad y medidas de asimetría. Los gráficos utilizados en el análisis exploratorio de datos son: diagrama de tallos y hojas, y gráfico de caja y bigotes.

En el capítulo 5 se desarrollan las técnicas de conteo de posibilidades de ocurrencias, los principios básicos del conteo de posibilidades, las permutaciones y combinaciones; los cuales son temas importantes para el cálculo de probabilidad basado en la definición clásica.

Finalmente, agradecemos a las personas que nos han apoyado en la elaboración de este libro, en especial al profesor Máximo Mitacc, quien revisó este material y nos alcanzó sugerencias y observaciones; de igual modo, al profesor Fernando Hoyos, quien nos motivó y brindó su decidido apoyo para la culminación de este proyecto.

Los autores

Capítulo

1

Nociones básicas de la estadística

La Estadística es una ciencia fundamental para la toma de decisiones, sobre todo cuando prevalecen situaciones de incertidumbre en los campos sociales, salud, negocios, entre otros. En este capítulo se enfatizarán las aplicaciones en los negocios (finanzas, comercio, estudios de mercado y otros).

Para emplear métodos y procedimientos para la medición, clasificación, análisis e interpretación de datos es necesario conocer la clasificación, los términos técnicos, el método de medición de las características y las fases del método estadístico en la investigación científica.

Contenido

1. Definición, clasificación e importancia de la estadística.

2. Términos básicos en estadística.

3. Concepto de medición.

4. Fases del método estadístico.

Sabes

Capacidades adquiridas

Entender y describir un problema de investigación identificando sus distintas etapas

Identificar los diferentes tipos de investigación y las características que cada uno de ellos representan.

Piensas

Competencias por lograr

Identificar los términos estadísticos.

Clasificar las variables bajo estudio según su naturaleza y nivel de medición.

Reconocer las distintas fases del método estadístico.

Haces

Habilidades por desarrollar

Analizar un problema de investigación en los negocios y describirlo utilizando los términos estadísticos.

Distinguir entre estadística descriptiva e inferencial en un problema de investigación en los negocios.

Perú ocupa el puesto 42 en tamaño de población con más de 31 millones de habitantes. ¿La estadística descriptiva nos permite conocer esto?

La población del Perú asciende a 31 488 625 personas, informó el Instituto Nacional de Estadística e Informática (INEI), en el Día Mundial de la Población del 2016.

De esa cifra, el 50,1 % son hombres y el 49,9 % mujeres y 9 985 664 de personas se encuentran en la región Lima.

La estadística descriptiva utiliza técnicas para recolectar, ordenar, resumir y clasificar datos con la finalidad de tener una visión más precisa y conjunta de un fenómeno o problema de investigación. El análisis de datos ayuda a descubrir posibles relaciones entre las unidades estudiadas, determinando cuáles toman valores parecidos, cuáles difieren grandemente del resto y destacando hechos de posible interés.

En el Perú, el INEI es el organismo oficial encargado de realizar estudios basados en la estadística descriptiva, que nos permitan saber ¿cuántos somos?, y ¿cómo estamos distribuidos?

Otro objetivo de la estadística descriptiva es presentar los resultados de tal modo que describan fácilmente el fenómeno estudiado.

Para aplicar las técnicas de la estadística descriptiva se requiere conocer previamente sus términos técnicos, el nivel de medición de los datos y las etapas que se siguen para realizar una investigación estadística.

1. DEFINICIÓN, CLASIFICACIÓN E IMPORTANCIA DE LA ESTADÍSTICA

1.1 Estadística

La actividad estadística surge en civilizaciones como la egipcia, la griega, la romana y la china, que periódicamente realizaban censos en los que sus funcionarios recababan informaciones tales como: número de habitantes, matrimonios, defunciones, tipos de recursos, número de nacimientos, entre otros, de toda la población. En el Perú, el primer censo general habría sido realizado por el inca Sinchi Roca (1230-1260), en el Imperio del Tahuantinsuyo, que habría determinado la existencia de 200 000 hombres aptos para la guerra (INEI, 2016).

Como la función de los diversos niveles del Estado es, entre otras cosas, llevar los registros de la población, nacimientos, indicadores agrarios, impuestos y demás, tradicionalmente se definió a la estadística como un instrumento de compilación, organización, presentación y análisis de los datos numéricos que necesitan los Estados.

Por esta razón, etimológicamente el término “estadística” se deriva de la palabra que proviene del latín statisticus que significa ‘del Estado’.

Pero cuando realizamos investigaciones en los campos de la economía, la administración, la medicina, la psicología, la física, la química, la biología, nos damos cuenta de que la estadística es fundamental y, en varios casos, es el único instrumento con que contamos hoy para poder medir, clasificar, analizar e interpretar datos de cualquiera de las dos ramas de las ciencias fácticas.

Los métodos estadísticos son uno de los medios por los que el hombre trata de comprender las relaciones entre determinados grupos de objetos, elementos o personas y encontrar tendencias o similitudes a partir de la compilación e interpretación de datos numéricos. Estos métodos son fundamentalmente los mismos, independientemente de que se apliquen en el análisis de fenómenos físicos, en el estudio de mediciones educacionales, en el estudio de datos provenientes de experimentos biológicos, o del análisis cuantitativo de teoría en economía.

Por lo expuesto, la estadística es una ciencia que se aplica a cualquiera de las ramas de las ciencias fácticas y nos proporciona un conjunto de métodos y procedimientos para la medición, clasificación, análisis e interpretación de datos en forma adecuada, para que nos permitan tomar decisiones cuando prevalezcan situaciones de incertidumbre.

1.2 Clasificación de la estadística

Existen dos formas conocidas de clasificar la estadística. Según el orden de ejecución de las actividades, la estadística se clasifica en descriptiva e inferencial, y según el número de variables se clasifica en univariante y multivariante. En esta sección abordaremos la clasificación según el orden de ejecución de las actividades.

1.2.1 Estadística descriptiva

Se encarga de recolectar, clasificar, presentar, describir, resumir o simplificar datos, cuyo análisis no pretende ir más allá del conjunto de los datos obtenidos de la muestra o de la población. La estadística descriptiva es, pues, un conjunto de procedimientos que tienen por objeto presentar grupos de datos simplificados en tablas, gráficos o medidas de resumen. En definitiva, la estadística descriptiva comprende aquellas técnicas que se usan para simplificar la información (usualmente largas listas de datos) de la forma más precisa posible, a través de medidas de resumen, tablas, cuadros y gráficos, para facilitar las descripciones y comparaciones. Los elementos de la estadística descriptiva, de acuerdo a su ocurrencia, se presentan a continuación:

Figura 1.1

Elementos de la estadística descriptiva

Elaboración propia

Ejemplo 1.1

El gerente de una empresa midió el nivel de conocimiento de todo su personal administrativo en el manejo de hojas electrónicas de cálculo. Aplicó una prueba y representó las calificaciones en algunos gráficos, tablas y calculó algunos indicadores. Concluyó que su personal administrativo posee un dominio aceptable de las hojas electrónicas.

1.2.2 Estadística inferencial

Podemos considerar que la estadística es inferencial cuando pretende inferir, predecir o hacer conclusiones de una población a partir de los datos de su muestra. Como algunos de los resultados, pueden ser completa o parcialmente ciertos y otros no, están ligados a cierto grado de incertidumbre dentro de los límites de error y probabilidad, los mismos que se pueden determinar estadísticamente en cada caso (Sierra, 1997). Los elementos de la estadística inferencial se presentan a continuación:

Figura 1.2

Elementos de la estadística inferencial

Elaboración propia

Ejemplo 1.2

Una empresa de investigación de mercados realizó un estudio por muestreo de consumidores de bebidas energéticas, seleccionó una muestra de consumidores (mujeres y hombres) de este tipo de bebidas y con base en los datos obtenidos, probó que los hombres consumen más bebidas energéticas que las mujeres.

1.3 Importancia y necesidad de la estadística

La estadística es una disciplina que implica la recolección y la organización de los datos para describir, interpretar y predecir el comportamiento futuro de estos. Por esta razón, la estadística se utiliza en casi todas las actividades y áreas del saber humano, por ejemplo, en las industrias alimentarias, farmacéuticas, las compañías aseguradoras, el gobierno central y en los distintos conocimientos humanos (ciencias sociales: economía, medicina, biología, psicología, entre otras; ciencias naturales: física, química, entre otras). En estas últimas se utilizan diferentes técnicas para realizar investigaciones cuantitativas con la finalidad de conocer, por ejemplo, el comportamiento de los clientes sobre productos nuevos y el mejoramiento de los existentes; así como para realizar investigaciones estadísticas en los ámbitos estatal o académico.

Estadística en los negocios

La estadística es fundamental para gestionar y mejorar temas o actividades relacionados con los negocios, por ejemplo:

– Los niveles de satisfacción de los clientes y usuarios

– Los tipos de accidentes y sus frecuencias

– Ventas por clientes, vendedores, zonas y productos

– Predicciones de ventas por zonas, productos, servicios o sucursales

– Proyectos de inversión

– Evolución de las distintas ratios económicas-financieras y patrimoniales a lo largo del tiempo

– Estudios e investigación de mercado

– Productos más demandados, en el ámbito global, por zona y por canal de comercialización

– Estadística del personal (directivo y empleado)

– El control de calidad

2. TÉRMINOS BÁSICOS EN ESTADÍSTICA

La estadística, al ser ciencia, posee su propia terminología técnica. A continuación se presentan los términos básicos y definiciones del lenguaje estadístico.

2.1 Población y parámetro

2.1.1 Población o universo

Es el conjunto de todos los elementos que comparten una característica que se desea investigar. Estas características deben estar claramente definidas, en el espacio y el tiempo. Dichos elementos pueden ser personas, hogares, manzanas, distritos, ciudades, escuelas, hospitales, empresas, latas de leche, televisores, periódicos, revistas, series televisivas, entre otros (Hernández, Fernández y Baptista, 1994)

La población se clasifica en:

•Población finita. Es aquella cuyos elementos son susceptibles de ser contados. Para estudios en las ciencias sociales, una población se considera finita cuando el número total de elementos es menor o igual a 100 000 (Sierra, 1997). Por lo general, una población finita se define con límites de espacio y de tiempo.

•Población infinita. Es aquella cuyos elementos no son susceptibles de ser contados; es decir, cuando son ilimitados. Para estudios en las ciencias sociales, una población se considera infinita cuando el número total de sus elementos es mayor a 100 000 (Sierra, 1997).

Cuando nos interesa estudiar una población o universo en un problema de investigación, esta se denomina población objetivo.

Ejemplo 1.3

En un estudio de mercado se define la población objetivo como “las personas residentes en el distrito de La Molina, que consumieron gaseosa en el mes pasado”. Es decir, la investigación tendrá que recolectar datos de las personas que consumieron gaseosa el mes pasado en el distrito de La Molina.

2.1.2 Parámetro

Es una medida de resumen de toda la población. Se expresa, por ejemplo, como total poblacional, media poblacional, proporción o porcentaje poblacional, razón poblacional, entre otros. Su valor representa una característica numérica de la población; los parámetros son difíciles de calcular porque en muchos casos la recolección de datos de toda la población es prácticamente imposible pero pueden ser inferidos mediante los estadígrafos, de donde proviene el nombre de “estadística inferencial” (Hernández, Fernández y Baptista, 1994).

En el siguiente cuadro se presentan los parámetros más utilizados en la estadística inferencial.

Parámetros

Símbolos

Total poblacional

T

Media poblacional

µ

Proporción poblacional

π

Varianza poblacional

σ2

Desviación estándar poblacional

σ

Ejemplo 1.4

En el estudio de mercado en el distrito de La Molina se definió la población objetivo como “las personas residentes en el distrito de La Molina, que consumieron gaseosa en el mes pasado”; entonces, algunos parámetros de interés podrían ser los siguientes:

– Gasto promedio mensual en consumo de gaseosa de los consumidores que residen en el distrito de La Molina, el mes pasado.

– Porcentaje de consumidores de gaseosas que residen en el distrito de La Molina que prefieren la marca “Kola Sabor”, el mes pasado.

Los valores de los parámetros anteriores son desconocidos, se necesitaría consultar a todos los consumidores de gaseosas de La Molina para conocer el verdadero valor de cada parámetro.

2.2 Muestra y estadístico

2.2.1 Muestra

Es un subconjunto de la población, debidamente seleccionado mediante el uso de técnicas estadísticas o mediante el juicio de un experto. Si los datos de una muestra se han obtenido haciendo uso de procedimientos que utilizan el cálculo de probabilidades, se puede realizar inferencias de la población de donde procede (Sierra, 1997). La muestra puede ser probabilística y no probabilística.

•Muestra probabilística. Es aquella muestra que se obtiene por métodos probabilísticos de selección, en el cual cada elemento de la población o universo tiene una probabilidad conocida de selección. La estadística inferencial requiere este tipo de muestra para poder expandir sus resultados obtenidos a la población de estudio. La principal ventaja de este tipo de muestra es que puede medirse el tamaño del error muestral en nuestras predicciones (Hernández, Fernández y Baptista, 1994).

•Muestra no probabilística. Llamada también muestra dirigida, es aquella que se obtiene mediante el juicio o criterio de una persona, generalmente un experto en la materia que selecciona los elementos de la muestra. Este método está basado en los puntos de vista subjetivos de una persona y suponen un procedimiento de selección informal y algo arbitraria. La teoría de la probabilidad no puede ser empleada para medir el error de muestreo, lo cual constituye su mayor desventaja. Entre sus principales ventajas podemos mencionar que es fácil de obtenerla a través de convocatorias; por ejemplo: muestra de sujetos voluntarios, sujetos-tipos, entre otros; o acudiendo a instituciones u organizaciones que posean la información que se requiere. De este modo se abarata el costo, ya que usualmente es más bajo que el de las muestras probabilísticas (Hernández, Fernández y Baptista, 1994).

Ejemplo 1.5

En el estudio de mercado en La Molina se definió la población objetivo como “las personas residentes en el distrito de La Molina que consumieron gaseosa en el mes pasado”. Entonces, la muestra podría estar conformada por “400 consumidores de gaseosas que residen en La Molina, seleccionados mediante algún método de muestreo probabilístico, en el mes pasado”.

2.2.2 Estadístico

Conocido también como estadígrafo, es el valor calculado basado en los datos que se obtienen de una muestra y, por lo tanto, es una estimación o aproximación del parámetro. En estadística inferencial, los estadísticos sirven para estimar los parámetros de población que generalmente se desconocen. Entre los estadísticos conocidos se tienen la media muestral (promedio), la proporción o porcentaje muestral, entre otros.

En el siguiente cuadro, se presentan los estadísticos más utilizados en la estadística inferencial.

Estadísticos

Símbolos

Total muestral

Media muestral

X

Proporción muestral

p

Varianza muestral

S2

Desviación estándar muestral

S

Ejemplo 1.6

En el estudio de mercado de La Molina se consideró una muestra de 400 consumidores de gaseosas, seleccionados del mecionado distrito, el mes pasado; entonces, los estadísticos de interés podrían ser:

– Gasto promedio mensual en consumo de gaseosa de los 400 consumidores seleccionados del distrito de La Molina, en el mes pasado.

– Porcentaje de consumidores que prefieren la marca “Kola Sabor”, de los 400 consumidores seleccionados del distrito de La Molina, en el mes pasado.

El valor de los estadísticos anteriores es fácil de conocer y calcular, debido a que solo se utiliza los datos de una muestra. Estos valores son estimaciones o aproximaciones de los parámetros definidos en el ejemplo 1.4.

2.3 Unidad de análisis

Conocido también como unidad elemental, unidad de observación o unidad estadística. Es el elemento o unidad base de la población, o de la muestra, del cual se obtendrán datos referidos a ciertas características o variables que nos interesan para explicar un determinado fenómeno. Estas pueden ser: una persona, un programa televisivo, un periódico, una revista, un banco, una empresa, etc.

Ejemplo 1.7

En el estudio de mercado del distrito de La Molina la unidad de análisis es un consumidor de gaseosa que reside en La Molina, en el mes pasado.

2.4 Variables

En estadística, la variable es una característica de la unidad de análisis, cuya medida puede cambiar de valor, y este cambio es capaz de “medirse”. El término variable proviene del latín variabilis, que significa cambiante. Una variable es una propiedad que puede variar y se puede medir (Hernández, Fernández y Baptista, 1994). Se representa simbólicamente mediante las letras mayúsculas del alfabeto español (X, Y, Z).

2.4.1 Clasificación de las variables

A las variables se les da diferentes clasificaciones, las más usuales son las siguientes (Pino Gotuzzo, 2007):

a) Según su naturaleza

De acuerdo a su naturaleza, las variables se clasifican en cualitativas y cuantitativas.

•Variables cualitativas: Son aquellas que representan cualidades, atributos, modalidades o categorías no numéricas; por ejemplo: sexo, lugar de nacimiento, religión, tipo de atención a un cliente en una institución, entre otros. Estas categorías deben estar bien definidas, de tal modo que ninguna unidad de análisis puede estar clasificada en más de una categoría a la vez, ni pueda quedar fuera de alguna de las categorías de la variable.

Las variables cualitativas pueden ser nominales u ordinales.

– Variables cualitativas nominales: son aquellas que solo permiten asignar nombres o etiquetas a los datos, formando categorías que no tienen ningún orden entre ellas.

A continuación se presentan algunos ejemplos de variables cualitativas nominales.

Ejemplo 1.8

Tipo de atención a un cliente de una entidad financiera.

Categorías

 

Atención personal en agencia

No existe orden (de menos a más o de más a menos) entre las categorías

Atención vía telefónica

Atención por Internet

Ejemplo 1.9

Uso de tarjeta de crédito por un cliente en una tienda por departamentos.

Categorías

 

Sí usa

No existe orden (de menos a más o de más a menos) entre las categorías.

No usa

Ejemplo 1.10

Carrera profesional que estudia un alumno de la Universidad de Lima.

Categorías

 

Administración

No existe orden (de menos a más o de más a menos) entre las categorías.

Arquitectura

Comunicación

Contabilidad

Derecho

Economía

Ingeniería Industrial

Ingeniería de Sistemas

Marketing

Negocios Internacionales

Psicología

– Variables cualitativas ordinales: son aquellas cuyas categorías pueden ser ordenadas con algún criterio, de menos a más o de más a menos.

A continuación se presentan algunos ejemplos de variables cualitativas ordinales:

Ejemplo 1.11

Frecuencia de uso de tarjeta de crédito por un cliente en una tienda por departamentos.

Categorías

 

Uso poco frecuente

Existe orden, de menos a más frecuencia de uso, entre las categorías.

Uso frecuente

Uso muy frecuente

Ejemplo 1.12

Grado de instrucción de un ciudadano en el Perú.

Categorías

 

Primaria

Existe orden, de menos a más grado de instrucción, entre las categorías.

Secundaria

Superior

Ejemplo 1.13

Calificación de un postulante a un puesto de trabajo.

Categorías

 

Excelente

Existe orden, de más a menos calificación, entre las categorías.

Muy bueno

Bueno

Regular

Deficiente

•Variables cuantitativas

Son aquellas características de la unidad de análisis que son posibles de representar numéricamente. Se obtienen como resultados de mediciones o conteos. Las variables cuantitativas pueden ser continuas o discretas.

– Variables cuantitativas continuas: son aquellas cuyos valores están representados mediante el conjunto de los números reales. Se obtienen por medición y pueden tomar cualquier valor real dentro de un intervalo de la recta numérica. Podemos distinguir varios tipos de variables continuas, entre las más importantes se mencionan las siguientes:

a. Variables de medida son aquellas que se expresan en unidades de medida generadas por un instrumento de medición, tales como: peso de una persona (en kilogramos), presión arterial de un paciente (en milímetros de mercurio), longitud de una barra (en centímetros), temperatura del ambiente (en grados Fahrenheit).

b. Variables de tiempo son aquellas que se expresan en unidades de tiempo, tales como: duración de un foco (en días), tiempo que espera un cliente para ser atendido (en minutos), tiempo que emplea un médico para operar un paciente (en horas).

c. Variables económicas son aquellas que se expresan en unidades monetarias, tales como: sueldo de un trabajador (en soles), ganancia de una empresa (en dólares), precio de un vehículo (en dólares).

– Variables cuantitativas discretas: son aquellas que toman valores numéricos aislados y no pueden tomar ningún valor entre dos consecutivos. Se obtienen por conteo y están representados mediante el conjunto de los números naturales. Podemos distinguir varios tipos de variables discretas, entre las más importantes se mencionan las siguientes:

a. Variables de conteo de objetos son aquellas que cuentan la cantidad de objetos que posee la unidad de observación, tales como: número de celulares por cliente, número de habitaciones por vivienda, número de tarjetas de crédito por cliente.

b. Variables de conteo de personas son aquellas que cuentan la cantidad de personas que posee la unidad de observación, tales como: número de hijos por familia, número de trabajadores por empresa, número de estudiantes por sección.

c. Variables de conteo de ocurrencias son aquellas que cuentan la cantidad de ocurrencias en un periodo de tiempo, tales como: número de llamadas telefónicas recibidas por hora, número de clientes atendidos por día, número de veces por día que un estudiante revisa su correo electrónico, llegadas de turistas en un día al Perú.

b) Según el rol o dominio que desempeñan en la investigación

Teniendo en cuenta el criterio de su causalidad, las variables se clasifican en dependientes e independientes.

•Variables dependientes

Son aquellas mediciones que resultan de manipular los valores que asuman otras variables, llamadas independientes. La variable dependiente está asociada al fenómeno que se pretende explicar.

•Variables independientes

Son aquellas en que la manipulación de su valor determina cambios en los valores de la variable dependiente. La manipulación de la variable independiente puede hacerse variando sus cantidades o grados. Estas pretenden explicar el fenómeno.

Cabe señalar que los roles de las variables pueden intercambiarse de una investigación a otra; es decir, en una investigación puede ser variable independiente y en otra puede ser variable dependiente, y viceversa.

2.5 Datos

Los valores obtenidos para cada variable, en cada unidad de análisis, constituyen los datos. Son valores numéricos o no numéricos que se recogen en mediciones u observaciones y que después de ser codificados y criticados se presentan y analizan los resultados.

Ejemplo 1.14

En una encuesta, se le preguntó a Pedro Saldaña por su edad y este respondió que había cumplido 23 años. El valor numérico 23 es el dato.

Ejemplo 1.15

A un estudiante de la Universidad de Lima se le solicitó que mencione la especialidad que está estudiando y este respondió Economía. El valor no numérico “Economía” es el dato.

Ejemplo 1.16

En un proceso de inspección se encontró que un objeto era defectuoso. El valor no numérico “defectuoso” es el dato.

3. CONCEPTO DE MEDICIÓN

En las ciencias exactas, la medición se define como la asignación de un símbolo, numérico o no numérico, a la característica de un objeto o evento de acuerdo con reglas establecidas. Cuando se realizan mediciones a variables que son conceptualizadas de manera abstracta, como la calidad académica, la actitud de un docente, la atención de un estudiante, se requiere definir la medición como un proceso de vincular conceptos abstractos con indicadores empíricos. Este proceso se realiza mediante un plan explícito y organizado para clasificar (y frecuentemente cuantificar) los datos disponibles bajo el concepto que el investigador tiene en mente (Hernández, Fernández y Baptista, 1994).

3.1 Niveles de medición

Los niveles o escalas de medición utilizados en el análisis de información son: nominal, ordinal, intervalo y de razón. Estos están asociados con las siguientes cuatro características: clasificación, ordenamiento, intervalos iguales y el cero absoluto. En el siguiente cuadro se presentan las características de los niveles de medición (Gallardo de Parada y Moreno, 1999).

Nivel o escala de medición

Características asociadas permitidas

Nominal

Solo clasificación

Ordinal

Clasificación y ordenamiento

De intervalo

Clasificación, ordenamiento e intervalos iguales y cero relativo

De razón

Clasificación, ordenamiento, intervalos iguales y cero absoluto

En el cuadro anterior se puede ver que en el nivel de medición nominal tan solo se clasifica, mientras en el nivel de razón se acumulan todas las características de los niveles de medición.

•Nivel nominal

Es el nivel más simple o primitivo; ubica los objetos o individuos en categorías diferentes, desde el punto de vista cualitativo y no desde el punto de vista cuantitativo. En este tipo de información se requiere que el investigador sea capaz de distinguir dos o más categorías y que conozca los criterios para su clasificación. Las categorías deben ser mutuamente excluyentes (Gallardo de Parada y Moreno, 1999).

Por ejemplo, un nivel de medición nominal se emplea cuando se clasifica a las personas por su lugar de nacimiento. Los datos obtenidos en este nivel se denominan datos nominales.

Ejemplo 1.17

El sexo masculino (M) o femenino (F) de 15 estudiantes constituye un grupo de datos nominales: F, F, M, F, M, M, M, F, M, F, F, M, M, M, F. Estos datos solo se pueden clasificar en dos categorías, masculinos y femeninos.

•Nivel ordinal

En este nivel, se tiene al menos dos categorías que determinan la posición de objetos o individuos con relación a ciertos atributos, manteniendo una jerarquía pero sin indicar la distancia entre las posiciones. Si se asigna un valor numérico, o de atributos, los valores más altos corresponderán a los individuos que tienen más de la característica que se mide (Gallardo de Parada y Moreno, 1999). Esto hace que necesariamente en este nivel se satisfaga la característica del ordenamiento de los datos. Los datos obtenidos en este nivel de medición se denominan datos ordinales.

Ejemplo 1.18

El grado de instrucción –primaria (PR) secundaria (SE) o superior (SU)– de 10 trabajadores constituye un grupo de datos ordinales: SE, SE, PR, SE, SU, SE, SU, PR, SE, SU. Estos datos se pueden clasificar y ordenar en tres grupos, en el orden: PR, SE, SU.

•Nivel de intervalo

Llamada también interválica, en este nivel o escala numérica se agrupan las variables cuantitativas con intervalos y poseen las propiedades de orden, distancia y un origen no natural (INEI, 2001). Este nivel de medición permite utilizar las operaciones aritméticas básicas como la suma y resta de los valores numéricos (Gallardo de Parada y Moreno Garzón, 1999). Ejemplos de este nivel de medición son: la medición de la temperatura, el puntaje en una prueba de admisión, etc. Los datos obtenidos en este nivel de medición se denominan datos en nivel o escala de intervalo.

Ejemplo 1.19

La temperatura ambiental (en °C) de 10 ciudades del Perú medida en el nivel o escala de intervalo fue 37, 25, 15, 0, –8, 18, 38, 28, 19, 25. La existencia de un cero no supone la ausencia de temperatura en la ciudad, puesto que cero grados centígrados está dado de forma arbitraria por los creadores de la escala. Estos datos se pueden clasificar, ordenar, sumar y restar.

•Nivel de razón o proporción

Este nivel o escala numérica constituye el nivel más alto de medición para las variables cuantitativas. Abarca las características de la escala de intervalo y se puede aplicar las operaciones aritméticas básicas de suma, resta, multiplicación y división de los valores numéricos. El origen o cero que se proporcionan son absolutos. El cero absoluto significa la ausencia de la variable o fenómeno medible (INEI, 2001). Los datos obtenidos en este nivel se denominan datos en escala o nivel de razón.

Ejemplo 1.20

El sueldo mensual de 10 trabajadores (en soles) en el nivel de razón fueron: 1500, 2000, 1850, 1900, 2100, 1750, 1950, 2050, 2200, 2180. El dato 0 representaría que la persona no recibe sueldo porque no trabaja (ausencia del fenómeno). Estos datos se pueden clasificar, ordenar, sumar, restar, multiplicar y dividir. Los datos obtenidos en este nivel de medición se denominan datos en nivel o escala de razón.

Podemos resumir las operaciones que se pueden realizar con los datos en cada nivel de medición, tal como se observa en el siguiente cuadro.