Proyecto analisis de ventas – Probabilidad y estadística

1.1 De qué se trata el proyecto.

Este proyecto consiste en el análisis de datos proporcionados por La Ford Motor Company, o mejor conocido como Ford, que es una Empresa Multinacional Estadounidense fabricante de automóviles con sede en Salina Cruz Oaxaca, los cuales fueron obtenidos mediante la petición al gerente apoyándonos de un documento extendido por las oficinas de la escuela, firmado y sellado  por nuestro director, el cual podrá encontrar más adelante y  para sustentar que lo datos que se nos entregaron son verídicos también está firmado y sellado por el gerente de la Ford.

Este proyecto está basado en las ventas que se realizaron durante el 2017 en dicha empresa ordenados en 12 tablas correspondientes a cada mes, en el cual mostramos los procesos que se le hicieron a los datos para el desarrollo del presente haciendo buen manejo de la información obtenida.

Cabe mencionar que fue seleccionado de entre otras empresas ya que nos parece una empresa seria y reconocida, además de que solo se dedica a la venta de un único producto “automóviles” lo que suponemos nos beneficiaria ya que sería más fácil el manejo de la información.

Es importante recalcar que los cálculos obtenidos, fueron realizados por nosotros alumnos del 6to semestre grupo M del CBTIS 25 ubicado en el puerto de Salina Cruz Oaxaca   basándonos en todo lo aprendido en clase de Probabilidad y Estadística impartida por la Ing. María del Carmen Zavaleta Perea.

Este trabajo se hizo con el fin de evaluar lo que sería nuestro último semestre en la preparatoria 

 A través del texto usted podrá encontrar un análisis metódico y sistemático sobre las variables de estudio que obtuvimos de dichas ventas.

1.2. Objetivo

  • Poder diferenciar entre Población y Muestra además de, Parámetro Poblacional y Estimadores Muéstrales.
  • Utilizar los conocimientos adquiridos en clase para realizar los diferentes literales que se piden en el proyecto.
  • Desarrollar habilidades de análisis crítico y matemático en la materia de ESTADÍSTICA.
  • Realizar proyectos estadísticos de carácter serio y beneficioso para la sociedad.

1.3. Marco teórico

En el proyecto que se presenta a continuación se va a constar de diferentes términos estadísticos los cuales, debemos tener muy claro su definición. Entre estos tenemos:

Población: El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

 En este caso la población consistirá en 192 elementos que son las ventas realizadas en el año 2017.

Intervalos: En estadística son el par de números entre los cuales se estima que estará cierto valor desconocido. Por ejemplo, nosotros tenemos un intervalo de 31 días haciendo referencia a los días del mes ya que la mayoría consta de 31, así pues, cada intervalo engloba los datos de un periodo de 31 días.

Frecuencia: es el número de veces en que dicho evento se repite durante un periodo. Nosotros tomamos como frecuencia las ventas realizadas en cada mes.

A partir de aquí los siguientes términos serán explicados de forma práctica a lo largo del proyecto.

Media: En estadística, la media es una medida de centralización. Se llama media de una distribución de estadística a la media aritmética de los valores de los distintos individuos que la componen.

Varianza: Esta medida se basa en la cuantificación de las distintas de los datos con respecto al valor de la media.

Moda: Es el valor que ocurre con mayor frecuencia en una muestra puede ser que no exista la moda y también es posible que exista más de una moda.

 Mediana: Una mediana es el valor de la variable que deja el mismo número de datos antes y después que él una vez ordenados estos.

Desviación media: la desviación respecto a la media da información de lo alejado o cerca un dato de los demás datos del conjunto. El signo de la desviación respecto a la media indica si el valor está por encima de la media (signo positivo), o por debajo de la media (signo negativo).

Desviación típica: La desviación típica se define como la raíz cuadrada de la varianza de la variable. Sirve principalmente para conocer la desviación que presentan los datos en su distribución respecto a la media aritmética de dicha distribución. Es decir, nos muestra una visión más acorde con la realidad en el momento de tomar las decisiones.

Limite real superior y Limite real inferior: límite superior y límite inferior de una sucesión (xn) como el mayor y menor límite convergente de las subsecuencias de (xn). Análogamente a éste, el límite superior y límite inferior para funciones reales se define de la misma manera. El límite superior y el límite inferior son un sustituto parcial para el límite, si es que éste no existe

Varianza: La varianza mide qué tan dispersos están los datos alrededor de la media. La varianza es igual a la desviación estándar elevada al cuadrado.

Histograma: Es la manera más común de representar gráficamente la distribución de frecuencias de los datos. Se lo construye dibujando rectángulos cuya base corresponda a cada intervalo de clase y su altura, según el valor de la frecuencia.

Cuartil: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Decil: Nos referimos a cada uno de los 9 valores que dividen nuestros datos en diez partes iguales, de manera que cada parte represente un décimo de nuestra población, en este caso, hablando de una población que consiste en 192 elementos que representan las ventas realizadas en el año 2017.

Percentil: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%… y al 99% de los datos.

1.4. Observaciones de los datos estadísticos

  1. El intervalo de meses que obtuvo más ventas en el transcurso del año 2017 fue del 6 de julio al 5 de agosto y a partir del 8 de diciembre haciendo cada una, 24 ventas.
  2. El mes que tuvo menos ventas en el transcurso del año 2017 fue en septiembre obteniendo en total 5 ventas.
  3. Los meses que tuvieron igual número de ventas después del 6 de julio al 5 de agosto y a partir del 8 de diciembre fueron marzo y octubre haciendo cada uno 10 ventas.
  4. El mes que tiene el porcentaje más alto en ventas después de julio y diciembre es agosto con un 10.93 %
  5. El número de meses que obtuvieron una venta menor de 5 fueron 0 ni un mes obtuvo menos.
  6. La cantidad de ventas canceladas fueron 49 en todo el año
  7. El mes que tuvo más ventas canceladas fue en Julio con 8.
  8. El que mes que tuvo menos ventas canceladas fue junio y septiembre
  9. El mes que obtuvo un total de importe más alto fue Agosto con $9,873,148.00
  10. El mes que obtuvo un total de importe más bajo fue septiembre con $917,708.00

Promedio de ventas

En este caso nosotros queremos obtener el promedio de las ventas realizadas durante el periodo de 2017. Para esto realizamos la suma total de los resultados obtenidos de la multiplicación de la Frecuencia(F) por el Punto medio(x), y la división detodo esto por el total de Frecuencia(F). De esta manera obtenemos un total de 187.79.

El siguiente procedimiento para obtener el resultado se llevó a cabo con el fin de saber cuál fue la venta media con datos oficiales de la empresa, para tener un mejor conocimiento acerca del promedio de ventas y aplicarlo en algunos casos.

 DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)  P.M(F)
11-312016320
232-621947893
363-931078780
494-124131091417
5125-155141401960
6156-186151712565
7187-217242024848
8218-248212334893
9249-27952641320
10280-310102952950
11311-341173265542
12342-372243578568
  N=192=36056

Promedio

Para la obtención del promedio se utiliza la fórmula:

En donde:

  • Frecuencia(F)= ventas realizadas
  • Punto medio(x)= Promedio de días
  • Punto medio por frecuencia F(x)= Promedio de días por ventas realizadas

Mediana de las ventas

Para calcularlo se utiliza la siguiente fórmula:   Me=  

Donde:

Lo primero que hicimos para poder calcular la mediana fue identificar la clase mediana. Para esto tenemos que buscar el intervalo donde el valor de las ventas acumuladas (Fi) se encuentre próximo al resultado de la división del total de ventas entre dos.

N / 2= 192 / 2 96

Después de obtener el resultado realizamos la división de la mitad del total de ventas menos la suma total de las ventas anteriores acumuladas a la clase mediana sobre el total de ventas realizadas, todo multiplicado por la amplitud de los días del año, a este resultado se le suma el límite inferior de la clase donde se encuentra la mediana.

El procedimiento anterior se realizó porque para la mediana de ventas es muy importante para saber cuál es el valor (ventas) que separa los datos en grupos iguales.

   DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  FA
11-31200
232-621920
363-931039
494-1241349
5125-1551462
6156-1861576
7187-2172491
8218-24821115
9249-2795136
10280-31010141
11311-34117151
12342-37224168
  N=192192

224.63

Moda de ventas del 2017

Para obtener la moda se realiza la división de la resta del aproximado de la moda con el número anterior a este, el cual representa  , entre la suma de  +  , el cual representa la resta del aproximado a la moda con el numero siguiente a este. Después se multiplica por la amplitud de los días del año y el resultado de este se suma al límite inferior de la clase donde se encuentra la mediana.

   DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  FA
11-31200
232-621920
363-931039
494-1241349
5125-1551462
6156-1861576
7187-2172491
8218-24821115
9249-2795136
10280-31010141
11311-34117151
12342-37224168
  N=192192

 En el caso de la moda con los datos que tenemos se realizó el procedimiento porque se desea obtener el valor con mayor venta, es decir, los días del año en el cual se obtuvo la venta mayor en los datos.

Moda de intervalo 7

Moda=24

Li=187+186/2=186.5

C=31

=24-15=9

=24-21=3

Moda de intervalo 12

Moda=24

Li=342+341/2=341.5

C=31

=24-17=7

=24-0=24

            

 = Diferencia del mayor número de ventas en los días del año y las ventas anteriores a esta.          = Diferencia del mayor número de ventas en los días del año y las ventas siguientes a esta

Li = Es el límite inferior real de los días del año donde hubo mayores ventas.

Media geométrica.

La media geométrica la calculamos dividiendo la suma total de las ventas realizadas por logaritmo de mitad de días de venta, entre el total de ventas.

Se decidió realizarla para tener conocimiento y determinar el crecimiento porcentual promedio en las ventas realizadas por la Ford durante el año 2017.

 DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)  Log(X)  F( LogX)
11-3120161.2024
232-6219471.6731.73
363-9310781.8918.9
494-124131092.0326.39
5125-155141402.1429.96
6156-186151712.2333.45
7187-217242022.3055.2
8218-248212332.3649.56
9249-27952642.4212.1
10280-310102952.4624.6
11311-341173262.5142.67
12342-372243572.5561.2
  N=192 =409.76

Media geométrica

L

Para calcular la media Geométrica se utilizó la siguiente fórmula:

En donde:

logX= Exponente con base 10 de promedio de días

F(logX)= Ventas realizadas por exponente con base 10 de promedio de días

Media armónica

La media armónica se obtuvo de dividir la suma de f/x entre N que es el número total en ventas.

Esto se realizó para calcular el promedio de las ventas realizadas con el fin de saber la media de los datos más bajos.

 DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)  F/X
11-3120161.25
232-6219470.40
363-9310780.12
494-124131090.11
5125-155141400.1
6156-186151710.08
7187-217242020.11
8218-248212330.09
9249-27952640.01
10280-310102950.03
11311-341173260.05
12342-372243570.06
  N=192 =2.41

Media armónica

Método largo

Consiste en aplicar la fórmula ya vista para el cálculo de la media ponderada, con la única salvedad de que se toman como valores representativos de la variable los puntos medios de cada intervalo, que se denotan con xm.

 DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)  P.M(F)
11-312016320
232-621947893
363-931078780
494-124131091417
5125-155141401960
6156-186151712565
7187-217242024848
8218-248212334893
9249-27952641320
10280-310102952950
11311-341173265542
12342-372243578568
  N=192=36056

Método largo

Método corto

Consiste en elegir un intervalo en el que se supone que estará la media (aunque no sea así), y llamamos A al valor de la media supuesta, que coincidirá con el centro del intervalo elegido.

 DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)D (xi-A)  F(D)
11-312016-124-2480
232-621947-93-1767
363-931078-62-620
494-12413109-31-403
5125-1551414000
6156-1861517131465
7187-21724202621488
8218-24821233931953
9249-2795264124620
10280-310102951551550
11311-341173261863162
12342-372243572175208
  N=192 =9176

Método corto

Método clave

Para calcular el método clave nosotros escribimos al lado de cada marca unos números enteros (d) que expresan el número de clases, más uno, que hay desde la marca que consideramos la marca de la media supuesta. A estos números se les asignó signo menos si estaban por debajo de la media considerada y signo más si estaban por encima.

 DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  U  FU
11-3120-4-80
232-6219-3-57
363-9310-2-20
494-12413-1-13
5125-1551400
6156-18615115
7187-21724248
8218-24821363
9249-2795420
10280-31010550
11311-341176102
12342-372247168
  N=192=296

Método clave

Donde:

Fu=ventas realizadas por venta supuesta.

= Amplitud de los Días del año.

N= Total de ventas

Cuartiles

Para el cálculo de los cuartiles se utiliza la siguiente formula:

Esto tiene como función determinar el % de ingresos más altos de las ventas.

En este caso el 25% de las ventas de los meses que comprende el intervalo 11 es de 315.77

En el intervalo 8 determina el 50% que resulta ser de 224.63

   DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  FA
11-31200
232-621920
363-931039
494-1241349
5125-1551462
6156-1861576
7187-2172491
8218-24821115
9249-2795136
10280-31010141
11311-34117151
12342-37224168
  N=192192

N=192

Q3=3(192/4) =144

Intervalo 11

Li=311+310/2=310.5

fk=17

=141

C=31

1

Q2=2(192/4) =96

N=192

=91

fk=21

C=31

Li=218+217/2=217.5

Deciles

Los deciles se calculan de la siguiente manera:

Aquí calculamos el 70% de lo que comprende las ventas del intervalo 9 que es de 368.78

En el siguiente calculamos el 50% del intervalo 8 que es 224.63

   DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  FA
11-31200
232-621920
363-931039
494-1241349
5125-1551462
6156-1861576
7187-2172491
8218-24821115
9249-2795136
10280-31010141
11311-34117151
12342-37224168
  N=192192

D7=7(192/10) =134.4

N=192

=115

fk=5

C=31

Intervalo 9

Li=249+248/2=248.5

D5=5(192/10) =96

N=192

=91

fk=21

C=31

Intervalo 8

Li=218+217/2=217.5

Percentiles

Para el cálculo de los percentiles se utiliza la siguiente formula: 

En el cálculo del percentil 87 calculamos lo que corresponde al 87% del intervalo 12 que 361.9

En el siguiente calculamos el 50% del intervalo 8 que 224.63

   DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  FA
11-31200
232-621920
363-931039
494-1241349
5125-1551462
6156-1861576
7187-2172491
8218-24821115
9249-2795136
10280-31010141
11311-34117151
12342-37224168
  N=192192

P87=87(192/100) =167.04

N=192

=151

fk=24

C=31

Intervalo 12

Li=342+341/2=341.5

P50=50(192/100) =96

N=192

=91

fk=21

C=31

Intervalo 8

Li=218+217/2=217.5

Desviación media

Matemáticamente la desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se realizó con el propósito de analizar y determinar que valores representan una mayor variabilidad y que valores son iguales y coinciden con la media.

  DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)   
11-312016171.793435.8
232-621947140.792675.01
363-931078109.791097.9
494-1241310978.791024.27
5125-1551414047.79664.86
6156-1861517116.79251.85
7187-2172420214.21341.04
8218-2482123345.21949.41
9249-279526476.21381.05
10280-31010295107.211072.1
11311-34117326138.212349.57
12342-37224357169.214061.04
  N=192 =18303.9

Desviación media

Para calcular la Desviación media se utiliza la fórmula: 

En donde:

2 = Ventas realizadas por el cuadrado del valor absoluto de la resta de promedio de ventas con promedio de días.

N= Total de ventas

Varianza

La varianza se calculó a partir de dividir la suma de F(x-x)2 entre el número total de ventas, lo cual nos ayuda a saber que tan juntos o dispersos están los datos dependiendo si el resultado es mayor eso quiere decir que los datos formulados están dispersos conforme a la media

  DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)  2  2
11-31201629511.80590236
232-62194719821.82376614.58
363-93107812053.84120538.4
494-124131096207.8680702.18
5125-155141402283.8831974.32
6156-18615171281.904228.5
7187-21724202201.924846.08
8218-248212332043.9442922.74
9249-27952645807.9629039.8
10280-3101029511493.98114939.8
11311-3411732619102.00324734
12342-3722435728632.02687168.48
  N=192 2=2407944.88

Varianza

12541.37

Desviación típica

La desviación típica es la raíz cuadrada de la varianza. Para calcularla se calcula la varianza y se saca la raíz. La desviación típica se realizó con el propósito de determinar qué tan dispersos están los datos y que valores son próximos los unos a los otros.

Para esto calculamos la media, después calculamos el cuadrado de la distancia a la media para cada dato. Sumamos los valores que resultaron de sacar el cuadrado de la distancia a la media. Dividimos entre el número de datos y sacamos la raíz cuadrada.

La desviación típica se obtiene con el fin de saber que tan dispersos están los datos de las ventas con respecto a la media obtenida

  DIAS DEL AÑO (INTERVALOS)  VENTAS (F)  P.M (X)  2  2
11-31201629511.80590236
232-62194719821.82376614.58
363-93107812053.84120538.4
494-124131096207.8680702.18
5125-155141402283.8831974.32
6156-18615171281.904228.5
7187-21724202201.924846.08
8218-248212332043.9442922.74
9249-27952645807.9629039.8
10280-3101029511493.98114939.8
11311-3411732619102.00324734
12342-3722435728632.02687168.48
  N=192 2=2407944.88

Desviación típica

Donde:

Frecuencia(F)= ventas realizadas.

2= El cuadrado del valor absoluto de la resta de promedio de ventas con promedio de días.

2 = Ventas realizadas por el cuadrado del valor absoluto de la resta de promedio de ventas con promedio de días.

Ventas del 2017 con respecto a los días del año:

Los días del año en donde más venta de autos se obtuvo fue en los días 187-217 y 342-372 con 24 ventas respectivamente, y siendo los días 249-279 en donde menor venta se produjo, siendo solo 5 autos vendidos.

Total de autos vendidos en el 2017 con respecto a los días del año:

Se puede observar la evolución de las ventas a lo largo del año, concluyendo con un total de 192 autos vendidos.

Porcentaje de ventas del 2017 con respecto a los días del año:

En los días del año: 1-31, 187-217, 218-248 y 342-372 se realizaron ventas del más del 10%
Los días del año con ventas del menos del 5% fue del 249-279.

Ventas del 2017 en comparación del tipo de persona con respecto al 2017:

La mayor parte de las ventas son realizadas por personas físicas, tomando un total de 140 ventas por personas físicas y 52 de parte de morales.
Por lo tanto el 72% del total de las ventas son de clientes de personas físicas.

Ventas realizadas en comparación de las diferentes líneas de autos a lo largo de todo el 2017:

La línea de auto más vendida es el FIGO, obteniendo un total de 51 ventas, y los autos menos buscados son el FUSION, EXPEDITION y el EXPLORER, solo siendo vendidos 1 respectivamente a lo largo del 2017

Ventas realizadas en comparación de los diferentes medios de pago a lo largo del 2017:

Más del 50% de las ventas fueron pagadas a crédito, siendo un total de 109 ventas a crédito.
Y las ventas por el medio de pago menos utilizados son BANJERCITO, INVERLAT, y INBURSA, siendo efectuadas 1 venta respectivamente a lo largo del 2017.

Diagrama de venta de una línea de auto comprado por una persona física o moral:

La probabilidad de que un auto FIGO sea comprado por una persona física es de

Diagrama de venta de un auto por diferentes medios de pago comprado por una persona física o moral:

La probabilidad de que una compra sea realizada por BANJERCITO y adquirido por una persona moral es de

Factorial del orden de ventas de los primeros 62 autos vendidos hasta el día 125:

El número de combinaciones posibles para el orden de venta de 62 autos es de

Ventas realizas los días del año 280-310 con las diferentes líneas de autos:

Días del añoFiestaLoboFigoF-150F-350RangerEcosportEdgeFocusTransitEscapeFusionExpeditionExplorerTotal
280-3100220221000100010

Con 14 líneas de autos distintos, ¿En cuántas diferentes órdenes de venta se puede adquirir la compra de 10 autos que se realizaron en los días 280-310?

P= Número de combinaciones posibles en el orden de ventas

Se puede realizar  combinaciones posibles en el orden de la venta de 10 autos en los días del año 280-310, con las 14 líneas distintas que posee la empresa.

Ventas realizas los días del año 249-279 con las diferentes líneas de autos:

Días del añoFiestaLoboFigoF-150F-350RangerEcosportEdgeFocusTransitEscapeFusionExpeditionExplorerTotal
249-279103001000000005

Con 14 líneas de autos distintos, ¿En cuántas diferentes órdenes de venta se puede adquirir la compra de 5 autos que se realizaron en los días 249-279?

P= Número de combinaciones posibles en el orden de ventas

Se puede realizar  combinaciones posibles en el orden de la venta de 5 autos en los días del año 249-279, con las 14 líneas distintas que posee la empresa.

Ventas realizas los días del año 187-217 con las diferentes líneas de autos:

Días del añoFiestaLoboFigoF-150F-350RangerEcosportEdgeFocusTransitEscapeFusionExpeditionExplorerTotal
187-2172170152010401024


¿De cuantas formas distintas se puede realizar el orden de venta de los 24 autos vendidos de los días del año 187-217, si se vendieron: 2 Fiesta, 1 Lobo, 7 Figo, 1 F-350, 5 Ranger, 2 Ecosport, 1 Focus, 4 Escape y 1 Expedition?

P= Número de combinaciones posibles en el orden de ventas

Se puede realizar  combinaciones posibles en el orden de la venta de 24 autos en los días del año 187-217

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *