Tuesday, December 6, 2016

Hypothesis Moving Average

Un jugador de bolos se está jactando de que su promedio es de al menos 180. Lo observamos jugar tres partidos, sus puntuaciones son 125, 155, 140 (, S 15). Si aceptamos o rechazamos su afirmación debemos rechazarla. Por qué Porque un promedio de muestra tan bajo como 140 es poco probable de un jugador de 180 bolos. Qué tan improbable un jugador de bolos 180 bolos un promedio de 3 juegos de 140 o menos sólo el 2 por ciento del tiempo. Es 2 por ciento del tiempo improbable En las estadísticas, sí. 5 por ciento o menos se llama estadísticamente significativa. El proceso de toma de decisiones anterior se denomina prueba de significación 160 160. Aquí está la forma en que un informe estadístico presentaría formalmente la prueba, en etapas numeradas. 1. Hipótesis: versus 2. Estadística de la prueba: 3. Valor P: Presumiendo que H 0 es cierto, la probabilidad de variación del azar que produce una estadística t tan baja como -4.62 es .02. (Detalles del cálculo más adelante). 4. Conclusión: Dado que el valor P, el valor de la muestra observada se declara significativamente improbable bajo. Por lo tanto, rechazamos H 0 y concluimos. La muestra proporciona evidencia para rechazar la reclamación de los jugadores de bolos. Esta es una descripción más detallada de cada componente de la prueba de significación anterior. 1. Las hipótesis nula y alternativa 160 160 160. H 0 160 y H 1 160 se denominan hipótesis nula 160 y hipótesis alternativa 160, respectivamente. Las dos hipótesis describen las dos posibilidades: la afirmación es verdadera (), o la afirmación es falsa (). Tenga en cuenta que (i) las dos hipótesis son declaraciones sobre la población (ii) las dos hipótesis son complementarias si se produce la otra no (iii) la hipótesis con el signo igual es la hipótesis nula Una prueba de significancia rechaza (declaración de población) H 0 y concluye H 1 si los valores de la muestra están significativamente lejos de H 0 y dentro de H 1. Por lo tanto, rechazamos y concluimos si hay alguna distancia significativa por debajo de 180. Cuán lejos por debajo de 180 es significativo? La estadística de prueba nos ayuda a determinar dónde dibujar la línea en la arena. 2. La estadística de prueba Para las pruebas de hipótesis sobre el estadístico de prueba t160 es una relación de la forma Para la hipótesis nula, el estadístico de prueba t es H0 será rechazado si y sólo si será una distancia significativa por debajo de 180, Lo que ocurre si y sólo si t es alguna distancia significativa por debajo de 0. Basándose en las puntuaciones observadas de la muestra, el valor t observado es Is t -4,62 significativamente por debajo de 0 Para responder a esto, necesitaremos la ayuda de la curva t con n - 1 grados de libertad. Usando la curva t con n -12 grados de libertad, la probabilidad de variación del azar que da como resultado un valor de t tan bajo como -4.62 es .02. Dado que esta probabilidad es menor que 0,05 (el estándar para la significación estadística), declaramos que t -4,62 es significativamente por debajo de 0, o que está significativamente por debajo de 180, y rechazar. En general, el valor P es el área total bajo la curva más extrema que t en apoyo de H 1. Si t es profundo en el territorio H 1, entonces el valor P es pequeño. Si P valor 0,05, rechazamos H 0 con significación estadística. Si P-valor .01, rechazamos H 0 con alta significancia estadística. Si el valor P es mayor que .05, aceptamos H 0. 4. Conclusión Si H 0 es rechazado, la conclusión se suele indicar como hay suficiente evidencia para. O hay diferencias estadísticamente significativas. . Si se acepta H 0, la conclusión se suele indicar como no hay pruebas suficientes para. , O no hay diferencias estadísticamente significativas. . Desde P-valor.02 en nuestro ejemplo, llegamos a la conclusión de que la muestra proporciona suficiente evidencia para rechazar la demanda de los jugadores de bolos de un promedio de 180. O su rendimiento () fue mucho menor que su promedio declarado (), y la diferencia es estadísticamente significativa. Pruebas de hipótesis basadas en la bondad de ajuste en el modelo de la serie de tiempo medio móvil Charles R. Nelson Gary S. Shea Universidad de Washington, Resumen Las propiedades de muestra pequeñas de las pruebas t se comparan con las de las pruebas basadas en la bondad de ajuste relativa en el contexto del modelo de la serie de tiempo medio móvil de primer orden. Los experimentos de Monte Carlo reportados en el artículo sugieren que el tamaño real de estas pruebas t excede en gran medida los niveles teóricos de significación de grandes muestras, mientras que la conformidad de las estadísticas de bondad de ajuste con las distribuciones apropiadas de chi cuadrado o F es mucho más estrecha. La evidencia presentada sugiere que los practicantes están bien aconsejados para emplear pruebas de bondad de ajuste como una comprobación de los resultados de las pruebas t, especialmente cuando estos últimos indican significación. Copyright 1979 Publicado por Elsevier B. V. Artículos de referencia () Por qué las estrategias de media móvil son riesgosas Esta es la segunda de una serie de tres partes. Lea la parte 1 aquí. CHAPEL HILL, N. C. (MarketWatch) Las estrategias de media móvil son riesgosas. Esa es la afirmación sacrílega que introduje en mi columna que apareció a principios de esta semana, basada en la investigación en profundidad que realicé durante los últimos meses en los retornos de varias estrategias de media móvil. Como se prometió en la columna inicial de esta serie de tres partes, he aquí un análisis más detallado de cada una de las cuatro conclusiones generales a las que llegué. Conclusión 1: Incluso las mejores estrategias de media móvil no siempre funcionan Para entender por qué las estrategias de media móvil son arriesgadas, es importante entender que hay más de una manera de definir el riesgo. De acuerdo con la definición académica tradicional de riesgo como volatilidad, las estrategias de media móvil son en realidad menos riesgosas que el mercado. Pero hay otro tipo de riesgo también, teniendo que ver con cuánto tiempo la estrategia puede estar bajo el agua. Y cuando se miran de esta manera, las estrategias de media móvil son bastante riesgosas: Incluso en condiciones ideales, las mejores estrategias de media móvil siguen siendo típicamente inferiores al mercado durante largos períodos que a veces duran un par de décadas. Considere la media móvil de 200 días, tal vez la versión más utilizada. Cuando se aplicó al índice SampP 500 SPX, -0,71 y al emplearlo en conjunción con un sobre comercial de 5, esta estrategia fue una de las pocas que hicieron más dinero que el mercado desde finales de la década de 1920 incluso después de comisiones. Esta estrategia en particular, sin embargo, pasó más de la mitad del tiempo durante los últimos 80 años atrás detrás de comprar y retener, como se resume en la siguiente tabla. Tenga en cuenta que estos resultados deprimentes se aplican a uno de los más rentables de cualquiera de las miles de estrategias de media móvil que estudié. De períodos de esta duración estudiados (en una base de año calendario móvil) en la que la estrategia de media móvil hizo menos dinero que el mercado en sí en la que el promedio móvil de las estrategias Sharpe Ratio fue menor que los mercados La pregunta a preguntarse a medida que examina estos resultados: Es usted para pegarse con una estrategia de mercado de tiempo que va 20, 10 o incluso cinco años sin golpear el mercado Mis resultados apuntan a una objeción potencialmente más grave a las estrategias de media móvil: La mayoría de las diversas estrategias de media móvil que probé Superar el mercado en el último siglo han tenido un rendimiento inferior al de 1990, y esto puede ser más que sólo uno de esos períodos periódicos en los que las estrategias de media móvil se esfuerzan por mantenerse al día. Blake LeBaron, profesor de finanzas en la Universidad de Brandies, sospecha que las formas más baratas de comerciar dentro y fuera del mercado han causado un aumento en el número de inversores que siguen estrategias de media móvil y que a su vez ha hecho que sus beneficios disminuyan e incluso desaparezcan. décadas recientes. Adición de credibilidad a la hipótesis del Prof. LeBarons es que, también a principios de la década de 1990, las estrategias de media móvil dejaron de funcionar en el mercado de divisas. Conclusión 2: Las comisiones sabotean incluso las mejores estrategias, por lo que la reducción de la frecuencia de las transacciones es crucial La mayoría de los estudios previos de las medias móviles asumieron que un inversor podría operar sin comisiones u otros costos de transacción. Una vez que deshacerse de esta suposición poco realista, la mayoría de las estrategias de media móvil se quedan a un buy-and-hold por cantidades significativas. Esto es especialmente cierto en los mercados volátiles, cuando muchas de las estrategias de media móvil, especialmente aquellas que dependen de una longitud media corta, no rara vez generan numerosas señales al año. Determinar lo que es una comisión justa no es fácil, por supuesto. Vale la pena recordar que, durante la mayor parte del siglo pasado, no se disponía de fondos negociados en bolsa que permitieran al inversionista comprar las 30 acciones de Dow de una sola vez, y mucho menos los varios cientos de acciones que formaban parte del SampP Composite Index. Tampoco hubo fondos del mercado monetario en los que pudiera estacionar de inmediato y fácilmente los ingresos en efectivo de cualquier venta. Además, no fue hasta el 1 de mayo de 1975 (el Big Bang), que las comisiones de corretaje fueron desreguladas antes de eso, esas comisiones fueron fijos y sustanciales. Al calcular cuán grande fue el impacto que las estrategias de media móvil tomaron debido a las comisiones, asumí que había que pagar por cada compra o venta antes del Big Bang 0.5 en cada sentido hasta finales de 1999 y 0.1 en cada sentido desde entonces . Twitter: Cómo invertir 1.000 en tecnología puede pagar Con los gangbusters Twitter39s IPO el jueves, cuánto dinero podría haber hecho con 1.000 si se metió en el precio de salida Lo que otros IPO39s tecnología han pagado generosamente Cómo bellamente WSJ39s Jason Bellini tiene TheShortAnswer. Al asumir que no hay costos de transacción, muchas de las innumerables estrategias de promedio móvil monitoreadas superan al mercado durante todo el período de tiempo durante el cual los datos estaban disponibles. Sin embargo, al incluir los costos de transacción, virtualmente todos ellos se retrasan. Por lo tanto, reducir la frecuencia de las transacciones es absolutamente crucial para cualquier estrategia de media móvil. Si bien hay más de una manera de hacerlo, tal vez el más simple y más común es utilizar un sobres denominado. Este método permite al inversionista elegir una cantidad arbitraria que el índice del mercado necesita para moverse por encima o por debajo del promedio móvil para generar una transacción. Por ejemplo, si está usando un sobre de 1 y ya está en el mercado, entonces el índice tendrá que caer más de 1 por debajo del promedio móvil para generar un movimiento en efectivo. Por el contrario, si usted está en efectivo, entonces sólo volverá a estar en el mercado sólo si el índice sube a por lo menos 1 por encima de su media móvil. He probado diferentes tamaños de sobres. En casi todos los casos, encontré que el sobre de tamaño óptimo es 5. Cuando se utiliza el promedio móvil de 200 días para el Dow, por ejemplo, la frecuencia de transacción cayó de un promedio de seis por año (o una vez cada dos meses, en promedio ) A una sola vez al año, lo que dio lugar a una red neto de comisiones claramente superior. Conclusión 3: Las comisiones sin comisiones, las AM de más corto plazo superan a las EM de más largo plazo Si las comisiones no fueran un factor, los promedios móviles a corto plazo serían generalmente preferibles: Mis estudios demostraron que como regla general el rendimiento antes de la transacción disminuye a medida que aumenta La longitud de la media móvil. Sin embargo, después de incorporar un supuesto de comisión realista, los promedios móviles a largo plazo salieron adelante. Incluso cuando se usan sobres para reducir la frecuencia de las transacciones para los promedios móviles a corto plazo, las estrategias de media móvil a largo plazo suelen salir adelante. Tenga en cuenta, sin embargo, que no hay longitud óptima de media móvil que debe emplear. Norman Fosback, editor de Fosbacks Fund Forecaster, y ex director del Instituto de Investigación Econométrica, lo puso de esta manera en su libro de texto Stock Market Logic: No hay números mágicos en la tendencia siguiente. Algunas longitudes de media móvil pueden haber funcionado mejor en el pasado, pero, después de todo, algo tenía que funcionar mejor en el pasado y probando todo lo posible, cómo se podía ayudar a encontrarlo. Debe ser un requisito básico de cualquier sistema de tendencia media móvil siguiendo el sistema que prácticamente todas las longitudes medias móviles predicen con éxito en mayor o menor grado. Si sólo una o dos longitudes de trabajo, las probabilidades son mayores que los resultados exitosos se obtuvieron por casualidad. Hallazgo 4: No todos los índices se crean iguales cuando se trata de estrategias de media móvil Usted probablemente piensa que no importa mucho qué índice de mercado que utiliza cuando se calcula el promedio móvil. Pero usted estaría equivocado: Hay discrepancias marcadas en los retornos de las estrategias de media móvil, dependiendo de si utiliza el Dow, el SampP 500 o el Nasdaq para generar las señales de compra y venta. Considere el promedio móvil de 200 días junto con un sobre. Al basar esta estrategia en Dow Industrials, desde 1990 ha dado lugar a 100 transacciones separadas por un promedio de cuatro por año. Sin embargo, cuando se aplica a la SampP 500, esta estrategia por lo demás idéntica ha llevado a 68 transacciones para un promedio de menos de tres por año. Sobre una base de riesgo ajustado, esta estrategia ha batido un buy-and-hold en el caso de la SampP 500, pero no el Dow. Las grandes discrepancias como ésta surgieron a menudo en mi investigación. La nota cautelar de Fosbacks que he mencionado anteriormente es muy relevante aquí también. Nate Vernon es un estudiante de último año en la Universidad de Rochester con especialización en economía financiera. El verano pasado, fue pasante en el Hulbert Financial Digest. También es miembro del equipo de baloncesto de la Universidad de Rochester. Copyright copy2016 MarketWatch, Inc. Todos los derechos reservados. Intraday Datos proporcionados por SIX Financial Information y sujeta a condiciones de uso. Datos históricos y actuales al final del día proporcionados por SIX Financial Information. Datos intradía retrasados ​​por necesidades de intercambio. SampP / Dow Jones Indices (SM) de Dow Jones amp Company, Inc. Todas las cotizaciones son en tiempo de intercambio local. Datos de última venta en tiempo real proporcionados por NASDAQ. Más información sobre los símbolos negociados de NASDAQ y su estado financiero actual. Los datos intradía retrasaron 15 minutos para el Nasdaq, y 20 minutos para otros intercambios. SampP / Dow Jones Indices (SM) de Dow Jones amp Company, Inc. Los datos intradiarios de SEHK son proporcionados por SIX Financial Information y tienen un retraso de al menos 60 minutos. Todas las cotizaciones son en tiempo de intercambio local. La hipótesis del mercado eficiente (EMH) es una teoría de la inversión que afirma que es imposible superar el mercado porque la eficiencia del mercado de valores hace que los precios de las acciones existentes a los precios de las acciones Siempre incorporar y reflejar toda la información pertinente. Según la EMH, las acciones siempre se negocian a su valor razonable en las bolsas de valores, lo que hace imposible para los inversores a comprar acciones infravaloradas o vender acciones por precios inflados. Como tal, debe ser imposible superar el mercado general a través de la selección de expertos o la sincronización del mercado. Y la única manera en que un inversionista puede obtener mayores retornos es mediante la compra de inversiones más riesgosas. VIDEO Carga del reproductor. BREVES Hipótesis de Mercado Eficiente - EMH Aunque es una piedra angular de la teoría financiera moderna, la EMH es muy controversial ya menudo disputada. Los creyentes argumentan que no tiene sentido buscar acciones infravaloradas o intentar predecir tendencias en el mercado a través de análisis fundamentales o técnicos. Mientras que los académicos apuntan a un gran cuerpo de evidencia en apoyo de EMH, una cantidad igual de disensión también existe. Por ejemplo, inversores como Warren Buffett han golpeado constantemente al mercado durante largos períodos de tiempo, lo que por definición es imposible según la EMH. Los detractores de la EMH también apuntan a eventos como la caída del mercado bursátil de 1987. Cuando el Dow Jones Industrial Average (DJIA) cayó más de 20 en un solo día, como evidencia de que los precios de las acciones pueden desviarse seriamente de sus valores razonables. Lo que EMH significa para los inversores Los proponentes de la EMH concluyen que, debido a la aleatoriedad del mercado, los inversores podrían hacerlo mejor invirtiendo en una cartera pasiva de bajo costo. Los datos compilados por Morningstar Inc. a través de su junio de 2015 Active Barómetro / Barómetro pasivo apoya la conclusión. Morningstar comparó los retornos de los gerentes activos en todas las categorías frente a un compuesto compuesto por fondos de índices relacionados y fondos negociados en bolsa (ETFs). El estudio encontró que año tras año, sólo dos grupos de gerentes activos con éxito superó los fondos pasivos más de 50 del tiempo. Se trata de fondos estadounidenses de crecimiento reducido y fondos diversificados de mercados emergentes. En todas las demás categorías, incluyendo la gran mezcla estadounidense, el gran valor de EE. UU. y el gran crecimiento de Estados Unidos, entre otros, los inversionistas se habrían visto mejor por invertir en fondos de índice de bajo costo o ETFs. Mientras que un porcentaje de gerentes activos superan a los fondos pasivos en algún momento, el desafío para los inversionistas es poder identificar cuáles lo harán. Menos de 25 de los gerentes activos de alto rendimiento son capaces de superar de manera consistente a sus homólogos de gestión pasiva. Excel Para el Análisis de Datos Estadísticos Este es un sitio Web de complementos web de Estadísticas Empresariales Sitio de EE. UU. En espaol es: Sitio Espejo para Amrica Latina Sitio de los EEUU Excel es el paquete estadístico ampliamente utilizado, que sirve como una herramienta para entender los conceptos estadísticos y el cálculo para comprobar su cálculo manual para resolver sus problemas de tarea. El sitio ofrece una introducción para comprender los conceptos básicos y trabajar con Excel. Rehacer los ejemplos numéricos ilustrados en este sitio ayudará a mejorar su familiaridad y como resultado aumentar la eficacia y la eficiencia de su proceso en las estadísticas. Para buscar en el sitio. Pruebe E dit F ind en la página Ctrl f. Introduzca una palabra o frase en el cuadro de diálogo, p. Quot variancequot o quot meanquot Si la primera aparición de la palabra / frase no es lo que está buscando, pruebe F ind Next. Introducción Este sitio proporciona una experiencia ilustrativa en el uso de Excel para el resumen de datos, presentación y para otros análisis estadísticos básicos. Creo que el uso popular de Excel está en las áreas donde Excel realmente puede sobresalir. Esto incluye la organización de datos, es decir, gestión de datos básicos, tabulación y gráficos. Para el análisis estadístico real en debe aprender usando los paquetes estadísticos comerciales profesionales tales como SAS, y SPSS. Microsoft Excel 2000 (versión 9) proporciona un conjunto de herramientas de análisis de datos denominado Analysis ToolPak que puede utilizar para guardar pasos cuando desarrolla complejos análisis estadísticos. Proporciona los datos y parámetros para cada análisis, la herramienta utiliza las funciones de macro estadística apropiadas y, a continuación, muestra los resultados en una tabla de resultados. Algunas herramientas generan gráficos además de tablas de resultados. Si el comando Análisis de datos es seleccionable en el menú Herramientas, el Analysis ToolPak está instalado en su sistema. Sin embargo, si el comando Análisis de datos no está en el menú Herramientas, debe instalar el Analysis ToolPak haciendo lo siguiente: Paso 1: En el menú Herramientas, haga clic en Complementos. Si Analysis ToolPak no aparece en el cuadro de diálogo Complementos, haga clic en Examinar y busque la unidad, el nombre de la carpeta y el nombre del archivo para el Complemento de Analysis ToolPak Analys32.xll normalmente ubicado en la carpeta Archivos de programa de Microsoft OfficeOfficeLibraryAnalysis. Una vez que encuentre el archivo, selecciónelo y haga clic en Aceptar. Paso 2: Si no encuentra el archivo Analys32.xll, debe instalarlo. Inserte el disco 1 de Microsoft Office 2000 en la unidad de CD ROM. Seleccione Ejecutar en el menú Inicio de Windows. Examine y seleccione la unidad para su CD. Seleccione Setup. exe, haga clic en Abrir y haga clic en Aceptar. Haga clic en el botón Agregar o quitar funciones. Haga clic en el siguiente en Microsoft Excel para Windows. Haga clic en el siguiente para Complementos. Haga clic en la flecha hacia abajo junto a Analysis ToolPak. Seleccione Ejecutar desde Mi PC. Seleccione el botón Actualizar ahora. Excel actualizará ahora su sistema para incluir Analysis ToolPak. Inicie Excel. En el menú Herramientas, haga clic en Complementos. - y seleccione la casilla de verificación ToolPak de análisis. Paso 3: El complemento de Analysis ToolPak ya está instalado y Análisis de datos. Ahora se puede seleccionar en el menú Tools. Microsoft Excel es un potente paquete de hoja de cálculo disponible para Microsoft Windows y Apple Macintosh. El software de hoja de cálculo se utiliza para almacenar información en columnas y filas que pueden organizarse y / o procesarse. Las hojas de cálculo están diseñadas para funcionar bien con números, pero a menudo incluyen texto. Excel organiza su trabajo en libros que cada libro puede contener muchas hojas de trabajo se utilizan para enumerar y analizar datos. Excel está disponible en todas las PC de acceso público (es decir, aquellas, por ejemplo, en la biblioteca y PC Labs). Puede abrirse seleccionando Inicio - Programas - Microsoft Excel o haciendo clic en el Excel Short Cut que se encuentra en su escritorio, o en cualquier PC, o en la barra de herramientas de Office. Abrir un documento: Haga clic en Abrir archivo (CtrlO) para abrir / recuperar un libro existente Cambiar el área de directorio o unidad para buscar archivos en otras ubicaciones Para crear un nuevo libro, haga clic en Archivo nuevo documento en blanco. Guardar y cerrar un documento: Para guardar el documento con su nombre de archivo, ubicación y formato de archivo actual, haga clic en Archivo - Guardar. Si está guardando por primera vez, haga clic en Archivo-Guardar elija / escriba un nombre para su documento y luego haga clic en Aceptar. También utilice Archivo-Guardar si desea guardar en un nombre de archivo / ubicación diferente. Cuando haya terminado de trabajar en un documento, debe cerrarlo. Vaya al menú Archivo y haga clic en Cerrar. Si ha realizado cambios desde que se guardó por última vez el archivo, se le preguntará si desea guardarlos. La pantalla Excel Libros de trabajo y hojas de cálculo: Al iniciar Excel, se muestra una hoja de cálculo en blanco que consta de una cuadrícula múltiple de celdas con filas numeradas en la página y columnas con título alfabético en la página. Cada célula se hace referencia por sus coordenadas (por ejemplo, A3 se utiliza para referirse a la celda en la columna A y la fila 3 B10: se utiliza B20 para referirse al intervalo de células en la columna B y filas 10 a 20). Su trabajo se almacena en un archivo de Excel llamado libro de trabajo. Cada libro puede contener varias hojas de trabajo y / o gráficos: la hoja de trabajo actual se llama hoja activa. Para ver una hoja de cálculo diferente en un libro, haga clic en la ficha Hoja correspondiente. Puede acceder y ejecutar comandos directamente desde el menú principal o puede apuntar a uno de los botones de la barra de herramientas (el cuadro de visualización que aparece debajo del botón, cuando coloca el cursor sobre él, indica el nombre / acción del botón) y haga clic una vez. Desplazamiento por la hoja de trabajo: Es importante poder desplazarse por la hoja de trabajo con eficacia porque sólo puede introducir o cambiar datos en la posición del cursor. Puede mover el cursor utilizando las teclas de flecha o moviendo el ratón a la celda deseada y haciendo clic. Una vez seleccionada la célula se convierte en la célula activa y se identifica por un borde grueso sólo una célula puede estar activa a la vez. Para pasar de una hoja de cálculo a otra, haga clic en las pestañas de la hoja. (Si el libro contiene muchas hojas, haga clic con el botón derecho en los botones de desplazamiento de la pestaña y, a continuación, haga clic en la hoja que desee.) El nombre de la hoja activa se muestra en negrita. Movimiento entre celdas: Aquí hay un atajo de teclado para mover la celda activa: Inicio - se mueve a la primera columna de la fila actual CtrlHome - se mueve a la esquina superior izquierda del documento Finalizar luego Inicio - se mueve a la última celda del documento A Moverse entre las celdas de una hoja de cálculo, haga clic en cualquier celda o utilice las teclas de flecha. Para ver un área diferente de la hoja, use las barras de desplazamiento y haga clic en las flechas o el área arriba / debajo del cuadro de desplazamiento en las barras de desplazamiento verticales u horizontales. Tenga en cuenta que el tamaño de un cuadro de desplazamiento indica la cantidad proporcional del área utilizada de la hoja que es visible en la ventana. La posición de un cuadro de desplazamiento indica la ubicación relativa del área visible dentro de la hoja de cálculo. Introducción de datos Una nueva hoja de cálculo es una cuadrícula de filas y columnas. Las filas están etiquetadas con números y las columnas están etiquetadas con letras. Cada intersección de una fila y una columna es una celda. Cada celda tiene una dirección. Que es la letra de la columna y el número de la fila. La flecha en la hoja de cálculo hacia la derecha apunta a la celda A1, que actualmente está resaltada. Indicando que es una célula activa. Una celda debe estar activa para introducir información en ella. Para resaltar (seleccionar) una celda, haga clic en ella. Para seleccionar más de una celda: Haga clic en una celda (por ejemplo, A1) y, a continuación, mantenga pulsada la tecla Mayús mientras hace clic en otra (por ejemplo, D4) para seleccionar todas las celdas entre A1 e D4. Haga clic en una celda (por ejemplo, A1) y arrastre el ratón a través del rango deseado, desclasificando en otra celda (por ejemplo, D4) para seleccionar todas las celdas entre e incluyendo A1 y D4.Para seleccionar varias celdas que no están adyacentes, presione control y haga clic en Las celdas que desea seleccionar. Haga clic en un número o letra etiquetando una fila o columna para seleccionar esa fila o columna completa. Una hoja de trabajo puede tener hasta 256 columnas y 65.536 filas, por lo que será un tiempo antes de que se quede sin espacio. Cada celda puede contener una etiqueta. Valor. Valor lógico. O fórmula. Las etiquetas pueden contener cualquier combinación de letras, números o símbolos. Los valores son números. Sólo se pueden utilizar valores (números) en los cálculos. Un valor también puede ser una fecha o un valor timeLogical es true o false. Formulas automáticamente hacen cálculos sobre los valores en otras celdas especificadas y muestran el resultado en la celda en la que se introduce la fórmula (por ejemplo, puede especificar que la celda D3 Es contener la suma de los números en B3 y C3 el número mostrado en D3 será entonces una función de los números introducidos en B3 y C3). Para introducir información en una celda, seleccione la celda y comience a escribir. Tenga en cuenta que a medida que escribe información en la celda, la información que ingresa también se muestra en la barra de fórmulas. También puede introducir información en la barra de fórmulas y la información aparecerá en la celda seleccionada. Cuando haya terminado de introducir la etiqueta o el valor: Pulse Intro para desplazarse a la celda siguiente (en este caso, A2) Pulse Tabulador para desplazarse a la celda siguiente a la derecha (en este caso, B1) Haga clic en cualquier celda para seleccionar Introducción de etiquetas A menos que la información que ingrese esté formateada como un valor o una fórmula, Excel lo interpretará como una etiqueta y, por defecto, alineará el texto en el lado izquierdo de la celda. Si está creando una hoja de cálculo larga y va a repetir la misma información de etiqueta en muchas celdas diferentes, puede utilizar la función Autocompletar. Esta función buscará otras entradas en la misma columna e intentará hacer coincidir una entrada anterior con su entrada actual. Por ejemplo, si ya ha escrito Wesleyan en otra celda y escribe W en una celda nueva, Excel ingresará automáticamente Wesleyan. Si planea escribir Wesleyan en la celda, su tarea se realiza y puede pasar a la siguiente celda. Si pensaba escribir algo más, p. Williams, en la celda, simplemente sigue escribiendo para ingresar el término. Para activar la función de Autocompletar, haga clic en Herramientas en la barra de menús, luego seleccione Opciones, luego seleccione Editar y haga clic para poner una marca en el cuadro junto a Habilitar Autocompletar para valores de celda. Otra forma de introducir rápidamente etiquetas repetidas es utilizar la función Lista de selección. Haga clic con el botón derecho del ratón en una celda y, a continuación, seleccione Seleccionar de la lista. Esto le dará un menú de todas las demás entradas en las celdas en esa columna. Haga clic en un elemento del menú para introducirlo en la celda seleccionada. Un valor es un número, fecha o hora, más algunos símbolos si es necesario para definir más los números 91 tales como. - () / 93. Se supone que los números son positivos para ingresar un número negativo, utilice un signo menos - o encierre el número entre paréntesis (). Las fechas se almacenan como MM / DD / AAAA, pero no es necesario introducirlas con precisión en ese formato. Si ingresa el 9 de enero o el 9 de enero, Excel lo reconocerá el 9 de enero del año en curso y lo almacenará como 1/9/2002. Introduzca el año de cuatro dígitos para un año distinto al año actual (por ejemplo, el 9 de enero de 1999). Para introducir la fecha de los días actuales, pulse control y al mismo tiempo. Times por defecto a un reloj de 24 horas. Utilice a o p para indicar am o pm si utiliza un reloj de 12 horas (por ejemplo 8:30 p se interpreta como 8:30 PM). Para introducir la hora actual, pulse el control y: (punto y coma-punto de coma) al mismo tiempo. Una entrada interpretada como un valor (número, fecha o hora) se alinea al lado derecho de la celda, para volver a formatear un valor. Redondear números que cumplan los criterios especificados: Para aplicar colores a valores máximos y / o mínimos: Seleccione una celda en la región y presione CtrlShift (en Excel 2003, presione este botón o CtrlA) para seleccionar la región actual. En el menú Formato, seleccione Formato condicional. En Condición 1, seleccione Fórmula, y escriba MAX (F: F) F1. Haga clic en Formato, seleccione la ficha Fuente, seleccione un color y, a continuación, haga clic en Aceptar. En Condición 2, seleccione Fórmula y escriba MIN (F: F) F1. Repita el paso 4, seleccione un color diferente al que seleccionó para Condición 1 ya continuación, haga clic en Aceptar. Nota: Asegúrese de distinguir entre la referencia absoluta y la referencia relativa al ingresar las fórmulas. Números circundantes que cumplen con los criterios especificados Problema: Redondear todos los números en la columna A a cero decimales, excepto aquellos que tienen 5 en el primer decimal. Solución: Utilice las funciones IF, MOD y ROUND en la siguiente fórmula: IF (MOD (A2,1) 0,5, A2, ROUND (A2,0)) Para copiar y pegar todas las celdas de una hoja Seleccione las celdas de la hoja Presionando CtrlA (en Excel 2003, seleccione una celda en un área en blanco antes de presionar CtrlA, o de una celda seleccionada en un rango Current Region / List, presione CtrlAA). O Haga clic en Seleccionar todo en la intersección superior izquierda de las filas y las columnas. Presione CtrlC. Presione CtrlPage abajo para seleccionar otra hoja, luego seleccione la celda A1. Presione ENTRAR. Para copiar toda la hoja Copiar toda la hoja significa copiar las celdas, los parámetros de configuración de página y los nombres de rango definidos. Opción 1: Mueva el puntero del ratón a una ficha de hoja. Pulse Ctrl y mantenga pulsado el ratón para arrastrar la hoja a otra ubicación. Suelte el botón del ratón y la tecla Ctrl. Opción 2: Haga clic con el botón derecho del ratón en la ficha de hoja correspondiente. En el menú contextual, seleccione Mover o Copiar. El cuadro de diálogo Mover o Copiar permite copiar la hoja en una ubicación diferente en el libro actual o en un libro diferente. Asegúrese de marcar la casilla Crear una copia. Opción 3: En el menú Ventana, seleccione Organizar. Seleccione Mosaico para azulejar todos los libros abiertos en la ventana. Utilice la Opción 1 (arrastrando la hoja mientras presiona Ctrl) para copiar o mover una hoja. Clasificación por columnas La configuración predeterminada para clasificar en orden ascendente o descendente es por fila. Para ordenar por columnas: En el menú Datos, seleccione Ordenar y luego Opciones. Seleccione el botón de opción Clasificar de izquierda a derecha y haga clic en Aceptar. En la opción Ordenar por del cuadro de diálogo Ordenar, seleccione el número de fila por el que se ordenarán las columnas y haga clic en Aceptar. Estadísticas descriptivas El Toolkak de análisis de datos tiene una herramienta de estadística descriptiva que le proporciona una manera fácil de calcular estadísticas de resumen para un conjunto de datos de ejemplo. Las estadísticas de resumen incluyen media, error estándar, mediana, modo, desviación estándar, varianza, curtosis, asimetría, rango, mínimo, máximo, suma y cuenta. Esta herramienta elimina la necesidad de escribir funciones individuales para encontrar cada uno de estos resultados. Excel incluye barras de herramientas elaboradas y personalizables, por ejemplo, la barra de herramientas estándar que se muestra aquí: Algunos de los iconos son computación matemática útil: es el icono Autosum, que introduce la fórmula sum () para sumar un rango de celdas. Es el icono de FunctionWizard, que le da acceso a todas las funciones disponibles. Es el icono de GraphWizard, que da acceso a todos los tipos de gráficos disponibles, como se muestra en esta pantalla: Excel se puede utilizar para generar medidas de ubicación y variabilidad para una variable. Supongamos que deseamos encontrar estadísticas descriptivas para una muestra de datos: 2, 4, 6 y 8. Paso 1. Seleccione el menú desplegable Herramientas, si ve el análisis de datos, haga clic en esta opción, si no, haga clic en el complemento . Opción para instalar la herramienta de análisis pak. Paso 2. Haga clic en la opción de análisis de datos. Paso 3. Elija estadística descriptiva de la lista Herramientas de análisis. Paso 4. Cuando aparezca el cuadro de diálogo: Introduzca A1: A4 en el cuadro de rango de entrada, A1 es un valor en la columna A y la fila 1. En este caso este valor es 2. Usando la misma técnica, ingrese otros VALUES hasta llegar al último. Si un ejemplo consta de 20 números, puede seleccionar, por ejemplo, A1, A2, A3, etc. como rango de entrada. Paso 5. Seleccione un rango de salida. En este caso B1. Haga clic en estadísticas de resumen para ver los resultados. Cuando hace clic en Aceptar. Verá el resultado en el rango seleccionado. Como verá, la media de la muestra es 5, la mediana es 5, la desviación estándar es 2.581989, la varianza de la muestra es 6.666667, el rango es 6 y así sucesivamente. Cada uno de estos factores puede ser importante en el cálculo de diferentes procedimientos estadísticos. Distribución Normal Considere el problema de encontrar la probabilidad de obtener menos de un cierto valor bajo cualquier distribución de probabilidad normal. Como ejemplo ilustrativo, supongamos que los puntajes SAT a escala nacional se distribuyen normalmente con una desviación media y estándar de 500 y 100, respectivamente. Responda las siguientes preguntas en base a la información dada: A: Cuál es la probabilidad de que una puntuación de estudiante seleccionada al azar sea menor a 600 puntos? B: Cuál es la probabilidad de que una puntuación de estudiante seleccionada al azar supere los 600 puntos C: Cuál es la probabilidad Que una puntuación de estudiantes seleccionados al azar será entre 400 y 600 Sugerencia: Usando Excel se puede encontrar la probabilidad de obtener un valor aproximadamente menor o igual a un valor dado. En un problema, cuando se da la media y la desviación estándar de la población, hay que usar el sentido común para encontrar diferentes probabilidades basadas en la pregunta, ya que usted sabe que el área bajo una curva normal es 1. En la hoja de trabajo, Celda donde desea que aparezca la respuesta. Supongamos que eligió la celda número uno, A1. En los menús, seleccione quotinsert pull-downquot. Pasos 2-3 En los menús, seleccione Insertar y, a continuación, haga clic en la opción Función. Paso 4. Después de hacer clic en la opción Función, aparece el cuadro de diálogo Función de Pegado desde Categoría de Función. Seleccione Estadística luego NORMDIST en el cuadro Nombre de la función Haga clic en Aceptar Paso 5. Después de hacer clic en Aceptar, aparecerá el cuadro de distribución NORMDIST: i. Introduzca 600 en X (el cuadro de valor) ii. Introduzca 500 en la casilla Media iii. Introduzca 100 en el cuadro de desviación estándar iv. Escriba quottruequot en el cuadro acumulativo y, a continuación, haga clic en Aceptar. Como se ve el valor 0.84134474 aparece en A1, lo que indica la probabilidad de que una puntuación de estudiantes seleccionados al azar es inferior a 600 puntos. Utilizando el sentido común podemos responder a la parte quotbquot restando 0.84134474 de 1. Así que la parte quotbquot respuesta es 1- 0.8413474 o 0.158653. Esta es la probabilidad de que una puntuación de estudiantes seleccionados al azar sea superior a 600 puntos. Para responder a la parte quotcquot, utilice las mismas técnicas para encontrar las probabilidades o el área en los lados izquierdos de los valores 600 y 400. Dado que estas áreas o probabilidades se superponen entre sí para responder a la pregunta debe restar la menor probabilidad de la mayor probabilidad. La respuesta es 0.84134474 - 0.15865526 ​​es decir 0.68269. La captura de pantalla debe ser similar a la siguiente: Cálculo del valor de una variable aleatoria a menudo llamada el valor quotxquot Puede usar NORMINV desde el cuadro de función para calcular un valor para la variable aleatoria - si se da la probabilidad al lado izquierdo de esta variable. En realidad, debe utilizar esta función para calcular diferentes percentiles. En este problema uno podría preguntar cuál es la puntuación de un estudiante cuyo percentil es 90 Esto significa que aproximadamente 90 de las puntuaciones de los estudiantes son inferiores a este número. Por otro lado, si se nos pidiera hacer este problema a mano, habríamos tenido que calcular el valor x usando la fórmula de distribución normal x m zd. Ahora vamos a utilizar Excel para calcular P90. En la función Pegar, haga clic en diálogo estadístico, luego haga clic en NORMINV. La captura de pantalla se vería de la siguiente manera: Cuando vea NORMINV aparece el cuadro de diálogo. yo. Escriba 0.90 para la probabilidad (esto significa que aproximadamente 90 de los estudiantes puntuación es menor que el valor que estamos buscando) ii. Introduzca 500 para la media (esta es la media de la distribución normal en nuestro caso) iii. Introduzca 100 para la desviación estándar (ésta es la desviación estándar de la distribución normal en nuestro caso). Al final de esta pantalla verá el resultado de la fórmula que es aproximadamente 628 puntos. Esto significa que los 10 mejores estudiantes obtuvieron mejores resultados que 628. Intervalo de confianza para la media Supongamos que deseamos estimar un intervalo de confianza para la media de una población. Depending on the size of your sample size you may use one of the following cases: Large Sample Size (n is larger than, say 30): The general formula for developing a confidence interval for a population means is: In this formula is the mean of the sample Z is the interval coefficient, which can be found from the normal distribution table (for example the interval coefficient for a 95 confidence level is 1.96). S is the standard deviation of the sample and n is the sample size. Now we would like to show how Excel is used to develop a certain confidence interval of a population mean based on a sample information. As you see in order to evaluate this formula you need quotthe mean of the samplequot and the margin of error Excel will automatically calculate these quantities for you. The only things you have to do are: add the margin of error to the mean of the sample, Find the upper limit of the interval and subtract the margin of error from the mean to the lower limit of the interval. To demonstrate how Excel finds these quantities we will use the data set, which contains the hourly income of 36 work-study students here, at the University of Baltimore. These numbers appear in cells A1 to A36 on an Excel work sheet. After entering the data, we followed the descriptive statistic procedure to calculate the unknown quantities. The only additional step is to click on the confidence interval in the descriptive statistics dialog box and enter the given confidence level, in this case 95. Here is, the above procedures in step-by-step: Step 1. Enter data in cells A1 to A36 (on the spreadsheet) Step 2. From the menus select Tools Step 3. Click on Data Analysis then choose the Descriptive Statistics option then click OK . On the descriptive statistics dialog, click on Summary Statistic. After you have done that, click on the confidence interval level and type 95 - or in other problems whatever confidence interval you desire. In the Output Range box enter B1 or what ever location you desire. Now click on OK . The screen shot would look like the following: As you see, the spreadsheet shows that the mean of the sample is 6.902777778 and the absolute value of the margin of error 0.231678109. This mean is based on this sample information. A 95 confidence interval for the hourly income of the UB work-study students has an upper limit of 6.902777778 0.231678109 and a lower limit of 6.902777778 - 0.231678109. On the other hand, we can say that of all the intervals formed this way 95 contains the mean of the population. Or, for practical purposes, we can be 95 confident that the mean of the population is between 6.902777778 - 0.231678109 and 6.902777778 0.231678109. We can be at least 95 confident that interval 6.68 and 7.13 contains the average hourly income of a work-study student. Smal Sample Size (say less than 30) If the sample n is less than 30 or we must use the small sample procedure to develop a confidence interval for the mean of a population. The general formula for developing confidence intervals for the population mean based on small a sample is: In this formula is the mean of the sample. is the interval coefficient providing an area of in the upper tail of a t distribution with n-1 degrees of freedom which can be found from a t distribution table (for example the interval coefficient for a 90 confidence level is 1.833 if the sample is 10). S is the standard deviation of the sample and n is the sample size. Now you would like to see how Excel is used to develop a certain confidence interval of a population mean based on this small sample information. As you see, to evaluate this formula you need quotthe mean of the samplequot and the margin of error Excel will automatically calculate these quantities the way it did for large samples. Again, the only things you have to do are: add the margin of error to the mean of the sample, , find the upper limit of the interval and to subtract the margin of error from the mean to find the lower limit of the interval. To demonstrate how Excel finds these quantities we will use the data set, which contains the hourly incomes of 10 work-study students here, at the University of Baltimore. These numbers appear in cells A1 to A10 on an Excel work sheet. After entering the data we follow the descriptive statistic procedure to calculate the unknown quantities (exactly the way we found quantities for large sample). Here you are with the procedures in step-by-step form: Step 1. Enter data in cells A1 to A10 on the spreadsheet Step 2. From the menus select Tools Step 3. Click on Data Analysis then choose the Descriptive Statistics option. Click OK on the descriptive statistics dialog, click on Summary Statistic, click on the confidence interval level and type in 90 or in other problems whichever confidence interval you desire. In the Output Range box, enter B1 or whatever location you desire. Now click on OK . The screen shot will look like the following: Now, like the calculation of the confidence interval for the large sample, calculate the confidence interval of the population based on this small sample information. The confidence interval is: 6.8 0.414426102 or 6.39 7.21. We can be at least 90 confidant that the interval 6.39 and 7.21 contains the true mean of the population. Test of Hypothesis Concerning the Population Mean Again, we must distinguish two cases with respect to the size of your sample Large Sample Size (say, over 30): In this section you wish to know how Excel can be used to conduct a hypothesis test about a population mean. We will use the hourly incomes of different work-study students than those introduced earlier in the confidence interval section. Data are entered in cells A1 to A36. The objective is to test the following Null and Alternative hypothesis: The null hypothesis indicates that the average hourly income of a work-study student is equal to 7 per hour however, the alternative hypothesis indicates that the average hourly income is not equal to 7 per hour. I will repeat the steps taken in descriptive statistics and at the very end will show how to find the value of the test statistics in this case, z, using a cell formula. Step 1. Enter data in cells A1 to A36 (on the spreadsheet) Step 2. From the menus select Tools Step 3. Click on Data Analysis then choose the Descriptive Statistics option, click OK . On the descriptive statistics dialog, click on Summary Statistic. Select the Output Range box, enter B1 or whichever location you desire. Ahora haga clic en Aceptar. (To calculate the value of the test statistics search for the mean of the sample then the standard error. In this output, these values are in cells C3 and C4.) Step 4. Select cell D1 and enter the cell formula (C3 - 7)/C4. The screen shot should look like the following: The value in cell D1 is the value of the test statistics. Since this value falls in acceptance range of -1.96 to 1.96 (from the normal distribution table), we fail to reject the null hypothesis. Small Sample Size (say, less than 30): Using steps taken the large sample size case, Excel can be used to conduct a hypothesis for small-sample case. Lets use the hourly income of 10 work-study students at UB to conduct the following hypothesis. The null hypothesis indicates that average hourly income of a work-study student is equal to 7 per hour. The alternative hypothesis indicates that average hourly income is not equal to 7 per hour. I will repeat the steps taken in descriptive statistics and at the very end will show how to find the value of the test statistics in this case quottquot using a cell formula. Step 1. Enter data in cells A1 to A10 (on the spreadsheet) Step 2. From the menus select Tools Step 3. Click on Data Analysis then choose the Descriptive Statistics option. Haga clic en Aceptar . On the descriptive statistics dialog, click on Summary Statistic. Select the Output Range boxes, enter B1 or whatever location you chose. Again, click on OK . (To calculate the value of the test statistics search for the mean of the sample then the standard error, in this output these values are in cells C3 and C4.) Step 4. Select cell D1 and enter the cell formula (C3 - 7)/C4. The screen shot would look like the following: Since the value of test statistic t -0.66896 falls in acceptance range -2.262 to 2.262 (from t table, where 0.025 and the degrees of freedom is 9), we fail to reject the null hypothesis. Difference Between Mean of Two Populations In this section we will show how Excel is used to conduct a hypothesis test about the difference between two population means assuming that populations have equal variances. The data in this case are taken from various offices here at the University of Baltimore. I collected the hourly income data of 36 randomly selected work-study students and 36 student assistants. The hourly income range for work-study students was 6 - 8 while the hourly income range for student assistants was 6-9. The main objective in this hypothesis testing is to see whether there is a significant difference between the means of the two populations. The NULL and the ALTERNATIVE hypothesis is that the means are equal and the means are not equal, respectively. Referring to the spreadsheet, I chose A1 and A2 as label centers. The work-study students hourly income for a sample size 36 are shown in cells A2:A37 . and the student assistants hourly income for a sample size 36 is shown in cells B2:B37 Data for Work Study Student: 6, 6, 6, 6, 6, 6, 6, 6.5, 6.5, 6.5, 6.5, 6.5, 6.5, 7, 7, 7, 7, 7, 7, 7, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 8, 8, 8, 8, 8, 8, 8, 8, 8. Data for Student Assistant: 6, 6, 6, 6, 6, 6.5, 6.5, 6.5, 6.5, 6.5, 7, 7, 7, 7, 7, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 8, 8, 8, 8, 8, 8, 8, 8.5, 8.5, 8.5, 8.5, 8.5, 9, 9, 9, 9. Use the Descriptive Statistics procedure to calculate the variances of the two samples. The Excel procedure for testing the difference between the two population means will require information on the variances of the two populations. Since the variances of the two populations are unknowns they should be replaced with sample variances. The descriptive for both samples show that the variance of first sample is s 1 2 0.55546218 . while the variance of the second sample s 2 2 0.969748 . To conduct the desired test hypothesis with Excel the following steps can be taken: Step 1. From the menus select Tools then click on the Data Analysis option. Step 2. When the Data Analysis dialog box appears: Choose z-Test: Two Sample for means then click OK Step 3. When the z-Test: Two Sample for means dialog box appears: Enter A1:A36 in the variable 1 range box (work-study students hourly income) Enter B1:B36 in the variable 2 range box (student assistants hourly income) Enter 0 in the Hypothesis Mean Difference box (if you desire to test a mean difference other than 0, enter that value) Enter the variance of the first sample in the Variable 1 Variance box Enter the variance of the second sample in the Variable 2 Variance box and select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C19 . then click OK. The value of test statistic z-1.9845824 appears in our case in cell D24. The rejection rule for this test is z 1.96 from the normal distribution table. In the Excel output these values for a two-tail test are z 1.959961082. Since the value of the test statistic z-1.9845824 is less than -1.959961082 we reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two tail - test and the alpha value. Since p-value 0.047190813 is less than a0.05 we reject the null hypothesis. Overall we can say, based on the sample results, the two populations means are different. Small Samples: n 1 OR n 2 are less than 30 In this section we will show how Excel is used to conduct a hypothesis test about the difference between two population means. - Given that the populations have equal variances when two small independent samples are taken from both populations. Similar to the above case, the data in this case are taken from various offices here at the University of Baltimore. I collected hourly income data of 11 randomly selected work-study students and 11 randomly selected student assistants. The hourly income range for both groups was similar range, 6 - 8 and 6-9. The main objective in this hypothesis testing is similar too, to see whether there is a significant difference between the means of the two populations. The NULL and the ALTERNATIVE hypothesis are that the means are equal and they are not equal, respectively. Referring to the spreadsheet, we chose A1 and A2 as label centers. The work-study students hourly income for a sample size 11 are shown in cells A2:A12 . and the student assistants hourly income for a sample size 11 is shown in cells B2:B12 . Unlike previous case, you do not have to calculate the variances of the two samples, Excel will automatically calculate these quantities and use them in the calculation of the value of the test statistic. Similar to the previous case, but a bit different in step 2, to conduct the desired test hypothesis with Excel the following steps can be taken: Step 1. From the menus select Tools then click on the Data Analysis option. Step 2. When the Data Analysis dialog box appears: Choose t-Test: Two Sample Assuming Equal Variances then click OK Step 3 When the t-Test: Two Sample Assuming Equal Variances dialog box appears : Enter A1:A12 in the variable 1 range box (work-study student hourly income) Enter B1:B12 in the variable 2 range box (student assistant hourly income) Enter 0 in the Hypothesis Mean Difference box(if you desire to test a mean difference other than zero, enter that value) then select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C1, then click OK. The value of the test statistic t-1.362229828 appears, in our case, in cell D10. The rejection rule for this test is t 2.086 from the t distribution table where the t value is based on a t distribution with n 1 - n 2 -2 degrees of freedom and where the area of the upper one tail is 0.025 ( that is equal to alpha/2). In the Excel output the values for a two-tail test are t 2.085962478. Since the value of the test statistic t-1.362229828, is in an acceptance range of t 2.085962478, we fail to reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two-tail test and the alpha value. Since the p-value 0.188271278 is greater than a0.05 again . we fail to reject the null hypothesis. Overall we can say, based on sample results, the two populations means are equal. Enter data in an Excel work sheet starting with cell A2 and ending with cell C8. The following steps should be taken to find the proper output for interpretation. Step 1. From the menus select Tools and click on Data Analysis option. Step 2. When data analysis dialog appears, choose Anova single-factor option enter A2:C8 in the input range box. Select labels in first row. Paso 3. Select any cell as output(in here we selected A11). Haga clic en Aceptar. The general form of Anova table looks like following: Source of Variation Suppose the test is done at level of significance a 0.05, we reject the null hypothesis. This means there is a significant difference between means of hourly incomes of student assistants in these departments. The Two-way ANOVA Without Replication In this section, the study involves six students who were offered different hourly wages in three different department services here at the University of Baltimore. The objective is to see whether the hourly incomes are the same. Therefore, we can consider the following: Treatment: Hourly payments in the three departments Blocks: Each student is a block since each student has worked in the three different departments The general form of Anova table would look like: Source of Variation Degrees of freedom To find the Excel output for the above data the following steps can be taken: Step 1. From the menus select Tools and click on Data Analysis option. Step2. When data analysis box appears: select Anova two-factor without replication then Enter A2: D8 in the input range. Select labels in first row. Paso 3. Select an output range (in here we selected A11) then OK. Source of Variation NOTE: FMST/MSE 0.980556/0.497222 1.972067 F 3.33 from table (5 numerator DF and 10 denominator DF) Since 1.972067 Goodness-of-Fit Test for Discrete Random Variables The CHI-SQUARE distribution can be used in a hypothesis test involving a population variance. However, in this section we would like to test and see how close a sample results are to the expected results. Example: The Multinomial Random Variable In this example the objective is to see whether or not based on a randomly selected sample information the standards set for a population is met. There are so many practical examples that can be used in this situation. For example it is assumed the guidelines for hiring people with different ethnic background for the US government is set at 70(WHITE), 20(African American) and 10(others), respectively. A randomly selected sample of 1000 US employees shows the following results that is summarized in a table. EXPECTED NUMBER OF EMPLOYEES OBSERVED FROM SAMPLE As you see the observed sample numbers for groups two and three are lower than their expected values unlike group one which has a higher expected value. Is this a clear sign of discrimination with respect to ethnic background Well depends on how much lower the expected values are. The lower amount might not statistically be significant. To see whether these differences are significant we can use Excel and find the value of the CHI-SQUARE. If this value falls within the acceptance region we can assume that the guidelines are met otherwise they are not. Now lets enter these numbers into Excel spread - sheet. We used cells B7-B9 for the expected proportions, C7-C9 for the observed values and D7-D9 for the expected frequency. To calculate the expected frequency for a category, you can multiply the proportion of that category by the sample size (in here 1000). The formula for the first cell of the expected value column, D7 is 1000B7. To find other entries in the expected value column, use the copy and the paste menu as shown in the following picture. These are important values for the chi-square test. The observed range in this case is C7: C9 while the expected range is D7: D9. The null and the alternative hypothesis for this test are as follows: H A . The population proportions are not P W 0.70, P A 0.20 and P O 0.10 Now lets use Excel to calculate the p-value in a CHI-SQUARE test. Step 1. Select a cell in the work sheet, the location which you like the p value of the CHI-SQUARE to appear. We chose cell D12. Step 2. From the menus, select insert then click on the Function option, Paste Function dialog box appears. Step 3. Refer to function category box and choose statistical . from function name box select CHITEST and click on OK . Step 4. When the CHITEST dialog appears: Enter C7: C9 in the actual-range box then enter D7: D9 in the expected-range box, and finally click on OK . The p-value will appear in the selected cell, D12. As you see the p value is 0.002392 which is less than the value of the level of significance (in this case the level of significance, a 0.10). Hence the null hypothesis should be rejected. This means based on the sample information the guidelines are not met. Notice if you type CHITEST(C7:C9,D7:D9) in the formula bar the p-value will show up in the designated cell. NOTE: Excel can actually find the value of the CHI-SQUARE. To find this value first select an empty cell on the spread sheet then in the formula bar type CHIINV(D12,2). D12 designates the p-Value found previously and 2 is the degrees of freedom (number of rows minus one). The CHI-SQUARE value in this case is 12.07121. If we refer to the CHI-SQUARE table we will see that the cut off is 4.60517 since 12.071214.60517 we reject the null. The following screen shot shows you how to the CHI-SQUARE value. Test of Independence: Contingency Tables The CHI-SQUARE distribution is also used to test and see whether two variables are independent or not. For example based on sample data you might want to see whether smoking and gender are independent events for a certain population. The variables of interest in this case are smoking and the gender of an individual. Another example in this situation could involve the age range of an individual and his or her smoking habit. Similar to case one data may appear in a table but unlike the case one this table may contains several columns in addition to rows. The initial table contains the observed values. To find expected values for this table we set up another table similar to this one. To find the value of each cell in the new table we should multiply the sum of the cell column by the sum of the cell row and divide the results by the grand total. The grand total is the total number of observations in a study. Now based on the following table test whether or not the smoking habit and gender of the population that the following sample taken from are independent. On the other hand is that true that males in this population smoke more than females You could use formula bar to calculate the expected values for the expected range. For example to find the expected value for the cell C5 which is replaced in c11 you could click on the formula bar and enter C6D5/D6 then enter in cell C11. Step 1. Observed Range b4:c5 Smoking and gender So the observed range is b4:c5 and the expected range is b10:c11. Step 3. Click on fx (paste function) Step 4. When Paste Function dialog box appears, click on Statistical in function category and CHITEST in the function name then click OK. When the CHITEST box appears, enter b4:c5 for the actual range, then b10:c11 for the expected range. Step 5. Click on OK (the p-value appears). 0.477395 Conclusion: Since p-value is greater than the level of significance (0.05), fails to reject the null. This means smoking and gender are independent events. Based on sample information one can not assure females smoke more than males or the other way around. Step 6. To find the chi-square value, use CHINV function, when Chinv box appears enter 0.477395 for probability part, then 1 for the degrees of freedom. Degrees of freedom(number of columns-1)X(number of rows-1) Test Hypothesis Concerning the Variance of Two Populations In this section we would like to examine whether or not the variances of two populations are equal. Whenever independent simple random samples of equal or different sizes such as n 1 and n 2 are taken from two normal distributions with equal variances, the sampling distribution of s 1 2 /s 2 2 has F distribution with n 1 - 1 degrees of freedom for the numerator and n 2 - 1 degrees of freedom for the denominator. In the ratio s 1 2 /s 2 2 the numerator s 1 2 and the denominator s 2 2 are variances of the first and the second sample, respectively. The following figure shows the graph of an F distribution with 10 degrees of freedom for both the numerator and the denominator. Unlike the normal distribution as you see the F distribution is not symmetric. The shape of an F distribution is positively skewed and depends on the degrees of freedom for the numerator and the denominator. The value of F is always positive. Now let see whether or not the variances of hourly income of student-assistant and work-study students based on samples taken from populations previously are equal. Assume that the hypothesis test in this case is conducted at a 0.10. The null and the alternative are: Rejection Rule: Reject the null hypothesis if Flt F 0.095 or Fgt F 0.05 where F, the value of the test statistic is equal to s 1 2 /s 2 2. with 10 degrees of freedom for both the numerator and the denominator. We can find the value of F .05 from the F distribution table. If s 1 2 /s 2 2. we do not need to know the value of F 0.095 otherwise, F 0.95 1/ F 0.05 for equal sample sizes. A survey of eleven student-assistant and eleven work-study students shows the following descriptive statistics. Our objective is to find the value of s 1 2 /s 2 2. where s 1 2 is the value of the variance of student assistant sample and s 2 2 is the value of the variance of the work study students sample. As you see these values are in cells F8 and D8 of the descriptive statistic output. To calculate the value of s 1 2 /s 2 2. select a cell such as A16 and enter cell formula F8/D8 and enter. This is the value of F in our problem. Since this value, F1.984615385, falls in acceptance area we fail to reject the null hypothesis. Hence, the sample results do support the conclusion that student assistants hourly income variance is equal to the work study students hourly income variance. The following screen shoot shows how to find the F value. We can follow the same format for one tail test(s). Linear Correlation and Regression Analysis In this section the objective is to see whether there is a correlation between two variables and to find a model that predicts one variable in terms of the other variable. There are so many examples that we could mention but we will mention the popular ones in the world of business. Usually independent variable is presented by the letter x and the dependent variable is presented by the letter y. A business man would like to see whether there is a relationship between the number of cases of sold and the temperature in a hot summer day based on information taken from the past. He also would like to estimate the number cases of soda which will be sold in a particular hot summer day in a ball game. He clearly recorded temperatures and number of cases of soda sold on those particular days. The following table shows the recorded data from June 1 through June 13. The weatherman predicts a 94F degree temperature for June 14. The businessman would like to meet all demands for the cases of sodas ordered by customers on June 14. Now lets use Excel to find the linear correlation coefficient and the regression line equation. The linear correlation coefficient is a quantity between -1 and 1. This quantity is denoted by R . The closer R to 1 the stronger positive (direct) correlation and similarly the closer R to -1 the stronger negative (inverse) correlation exists between the two variables. The general form of the regression line is y mx b. In this formula, m is the slope of the line and b is the y-intercept. You can find these quantities from the Excel output. In this situation the variable y (the dependent variable) is the number of cases of soda and the x (independent variable) is the temperature. To find the Excel output the following steps can be taken: Step 1. From the menus choose Tools and click on Data Analysis. Step 2. When Data Analysis dialog box appears, click on correlation. Step 3. When correlation dialog box appears, enter B1:C14 in the input range box. Click on Labels in first row and enter a16 in the output range box. Click on OK. As you see the correlation between the number of cases of soda demanded and the temperature is a very strong positive correlation. This means as the temperature increases the demand for cases of soda is also increasing. The linear correlation coefficient is 0.966598577 which is very close to 1. Now lets follow same steps but a bit different to find the regression equation. Step 1. From the menus choose Tools and click on Data Analysis Step 2 . When Data Analysis dialog box appears, click on regression . Step 3. When Regression dialog box appears, enter b1:b14 in the y-range box and c1:c14 in the x-range box. Click on labels . Step 4. Enter a19 in the output range box . Note: The regression equation in general should look like Ym X b. In this equation m is the slope of the regression line and b is its y-intercept. Adjusted R Square The relationship between the number of cans of soda and the temperature is: Y 0.879202711 X 9.17800767 The number of cans of soda 0.879202711(Temperature) 9.17800767. Referring to this expression we can approximately predict the number of cases of soda needed on June 14. The weather forecast for this is 94 degrees, hence the number of cans of soda needed is equal to The number of cases of soda0.879202711(94) 9.17800767 91.82 or about 92 cases. Moving Average and Exponential Smoothing Moving Average Models: Use the Add Trendline option to analyze a moving average forecasting model in Excel. You must first create a graph of the time series you want to analyze. Select the range that contains your data and make a scatter plot of the data. Once the chart is created, follow these steps: Click on the chart to select it, and click on any point on the line to select the data series. When you click on the chart to select it, a new option, Chart, s added to the menu bar. From the Chart menu, select Add Trendline. The following is the moving average of order 4 for weekly sales: Exponential Smoothing Models: The simplest way to analyze a timer series using an Exponential Smoothing model in Excel is to use the data analysis tool. This tool works almost exactly like the one for Moving Average, except that you will need to input the value of a instead of the number of periods, k. Once you have entered the data range and the damping factor, 1- a. and indicated what output you want and a location, the analysis is the same as the one for the Moving Average model. Applications and Numerical Examples Descriptive Statistics: Suppose you have the following, n 10, data: 1.2, 1.5, 2.6, 3.8, 2.4, 1.9, 3.5, 2.5, 2.4, 3.0 Type your n data points into the cells A1 through An. Click on the Tools menu. (At the bottom of the Tools menu will be a submenu Data Analysis. , if the Analysis Tool Pack has been properly installed.) Clicking on Data Analysis. will lead to a menu from which Descriptive Statistics is to be selected. Select Descriptive Statistics by pointing at it and clicking twice, or by highlighting it and clicking on the Okay button. Within the Descriptive Statistics submenu, a. for the input range enter A1:Dn, assuming you typed the data into cells A1 to An. b. click on the output range button and enter the output range C1:C16. do. click on the Summary Statistics box d. finally, click on Okay. The Central Tendency: The data can be sorted in ascending order: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 The mean, median and mode are computed as follows: (1.2 1.5 2.6 3.8 2.4 1.9 3.5 2.5 2.4 3.0) / 10 2.48 The mode is 2.4, since it is the only value that occurs twice. The midrange is (1.2 3.8) / 2 2.5. Note that the mean, median and mode of this set of data are very close to each other. This suggests that the data is very symmetrically distributed. Variance: The variance of a set of data is the average of the cumulative measure of the squares of the difference of all the data values from the mean. The sample variance-based estimation for the population variance are computed differently. The sample variance is simply the arithmetic mean of the squares of the difference between each data value in the sample and the mean of the sample. On the other hand, the formula for an estimate for the variance in the population is similar to the formula for the sample variance, except that the denominator in the fraction is (n-1) instead of n. However, you should not worry about this difference if the sample size is large, say over 30. Compute an estimate for the variance of the population . given the following sorted data: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 mean 2.48 as computed earlier. An estimate for the population variance is: s 2 1 / (10-1) (1.2 - 2.48) 2 (1.5 - 2.48) 2 (1.9 - 2.48) 2 (2.4 -2.48) 2 (2.4 - 2.48) 2 (2.5 - 2.48) 2 (2.6 - 2.48) 2 (3.0 - 2.48) 2 (3.5 -2.48) 2 (3.8 - 2.48) 2 (1 / 9) (1.6384 0.9604 0.3364 0.0064 0.0064 0.0004 0.0144 0.2704 1.0404 1.7424) 0.6684 Therefore, the standard deviation is s ( 0.6684 ) 1/2 0.8176 Probability and Expected Values: Newsweek reported that average take for bank robberies was 3,244 but 85 percent of the robbers were caught. Assuming 60 percent of those caught lose their entire take and 40 percent lose half, graph the probability mass function using EXCEL. Calculate the expected take from a bank robbery. Does it pay to be a bank robber To construct the probability function for bank robberies, first define the random variable x, bank robbery take. If the robber is not caught, x 3,244. If the robber is caught and manages to keep half, x 1,622. If the robber is caught and loses it all, then x 0. The associated probabilities for these x values are 0.15 (1 - 0.85), 0.34 (0.85)(0.4), and 0.51 (0.85)(0.6). After entering the x values in cells A1, A2 and A3 and after entering the associated probabilities in B1, B2, and B3, the following steps lead to the probability mass function: Click on ChartWizard. The ChartWizard Step 1 of 4 screen will appear. Highlight Column at ChartWizard Step 1 of 4 and click Next. At ChartWizard Step 2 of 4 Chart Source Data, enter B1:B3 for Data range, and click column button for Series in. A graph will appear. Click on series toward the top of the screen to get a new page. At the bottom of the Series page, is a rectangle for Category (X) axis labels: Click on this rectangle and then highlight A1:A3. At Step 3 of 4 move on by clicking on Next, and at Step 4 of 4, click on Finish. The expected value of a robbery is 1,038.08. E(X) (0)(0.51)(1622)(0.34) (3244)(0.15) 0 551.48 486.60 1038.08 The expected return on a bank robbery is positive. On average, bank robbers get 1,038.08 per heist. If criminals make their decisions strictly on this expected value, then it pays to rob banks. A decision rule based only on an expected value, however, ignores the risks or variability in the returns. In addition, our expected value calculations do not include the cost of jail time, which could be viewed by criminals as substantial. Discrete Continuous Random Variables: Binomial Distribution Application: A multiple choice test has four unrelated questions. Each question has five possible choices but only one is correct. Thus, a person who guesses randomly has a probability of 0.2 of guessing correctly. Draw a tree diagram showing the different ways in which a test taker could get 0, 1, 2, 3 and 4 correct answers. Sketch the probability mass function for this test. What is the probability a person who guesses will get two or more correct Solution: Letting Y stand for a correct answer and N a wrong answer, where the probability of Y is 0.2 and the probability of N is 0.8 for each of the four questions, the probability tree diagram is shown in the textbook on page 182. This probability tree diagram shows the branches that must be followed to show the calculations captured in the binomial mass function for n 4 and 0.2. For example, the tree diagram shows the six different branch systems that yield two correct and two wrong answers (which corresponds to 4/(22) 6. The binomial mass function shows the probability of two correct answers as P(x 2 n 4, p 0.2) 6(.2)2(.8)2 6(0.0256) 0.1536 P(2) Which is obtained from excel by using the BINOMDIST Command, where the first entry is x, the second is n, and the third is mass (0) or cumulative (1) that is, entering BINOMDIST(2,4,0.2,0) IN ANY EXCEL CELL YIELDS 0.1536 AND BINOMDIST(3,4,0.2,0) YIELDS P(x3n4, p 0.2) 0.0256 BINOMDIST(4,4,0.2,0) YIELDS P(x4n4, p 0.2) 0.0016 1-BINOMDIST(1,4,0.2,1) YIELDS P(x 179 2 n 4, p 0.2) 0.1808 Normal Example: If the time required to complete an examination by those with a certain learning disability is believed to be distributed normally, with mean of 65 minutes and a standard deviation of 15 minutes, then when can the exam be terminated so that 99 percent of those with the disability can finish Solution: Because the average and standard deviation are known, what needs to be established is the amount of time, above the mean time, such that 99 percent of the distribution is lower. This is a distance that is measured in standard deviations as given by the Z value corresponding to the 0.99 probability found in the body of Appendix B, Table 5,as shown in the textbook OR the commands entered into any cell of Excel to find this Z value is NORMINV(0.99,0,1) for 2.326342. The closest cumulative probability that can be found is 0.9901, in the row labeled 2.3 and column headed by .03, Z 2.33, which is only an approximation for the more exact 2.326342 found in Excel. Using this more exact value the calculation with mean m and standard deviation s in the following formula would be Z ( X - m ) / s That is, Z ( x - 65)/15 Thus, x 65 15(2.32634) 99.9 minutes. Alternatively, instead of standardizing with the Z distribution using Excel we can simply work directly with the normal distribution with a mean of 65 and standard deviation of 15 and enter NORMINV(0.99,65,15). In general to obtain the x value for which alpha percent of a normal random variables values are lower, the following NORMINV command may be used, where the first entry is a. the second is m. and the third is s. Another Example: In the early 1980s, the Toro Company of Minneapolis, Minnesota, advertised that it would refund the purchase price of a snow blower if the following winters snowfall was less than 21 percent of the local average. If the average snowfall is 45.25 inches, with a standard deviation of 12.2 inches, what is the likelihood that Toro will have to make refunds Solution: Within limits, snowfall is a continuous random variable that can be expected to vary symmetrically around its mean, with values closer to the mean occurring most often. Thus, it seems reasonable to assume that snowfall (x) is approximately normally distributed with a mean of 45.25 inches and standard deviation of 12.2 inches. Nine and one half inches is 21 percent of the mean snowfall of 45.25 inches and, with a standard deviation of 12.2 inches, the number of standard deviations between 45.25 inches and 9.5 inches is Z: Z ( x - m ) / s (9.50 - 45.25)/12.2 -2.93 Using Appendix B, Table 5, the textbook demonstrates the determination of P(x 163 9.50) P(z 163 -2.93) 0.17, the probability of snowfall less than 9.5 inches. Using Excel, this normal probability is obtained with the NORMDIST command, where the first entry is x, the second is mean m. the third is standard deviation s, and the fourth is CUMULATIVE (1). Entering NORMDIST(9.5,45.25,12.2,1), Gives P( x 163 9.50) 0.001693. Sampling Distribution and the Central Limit Theorem : A bakery sells an average of 24 loaves of bread per day. Sales (x) are normally distributed with a standard deviation of 4. If a random sample of size n 1 (day) is selected, what is the probability this x value will exceed 28 If a random sample of size n 4 (days) is selected, what is theprobability that xbar 179 28 Why does the answer in part 1 differ from that in part 2 1. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 4. Thus, using Excel, 0.15866 1-NORMDIST(28,24,4,1). 2. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 2 using Excel, 0.02275 1-NORMDIST(28,24,2,1). Regression Analysis: The highway deaths per 100 million vehicle miles and highway speed limits for 10 countries, are given below: (Death, Speed) (3.0, 55), (3.3, 55), (3.4, 55), (3.5, 70), (4.1, 55), (4.3, 60), (4.7, 55), (4.9, 60), (5.1, 60), and (6.1, 75). From this we can see that five countries with the same speed limit have very different positions on the safety list. For example, Britain. with a speed limit of 70 is demonstrably safer than Japan, at 55. Can we argue that, speed has little to do with safety. Use regression analysis to answer this question. Solution: Enter the ten paired y and x data into cells A2 to A11 and B2 to B11, with the death rate label in A1 and speed limits label in B1, the following steps produce the regression output. Choose Regression from Data Analysis in the Tools menu. The Regression dialog box will will appear. Note: Use the mouse to move between the boxes and buttons. Click on the desired box or button. The large rectangular boxes require a range from the worksheet. A range may be typed in or selected by highlighting the cells with the mouse after clicking on the box. If the dialog box blocks the data, it can be moved on the screen by clicking on the title bar and dragging. For the Input Y Range, enter A1 to A11, and for the Input X Range enter B1 to B11. Because the Y and X ranges include the Death and Speed labels in A1 and B1, select the Labels box with a click. Click the Output Range button and type reference cell, which in this demonstration is A13. To get the predicted values of Y (Death rates) and residuals select the Residuals box with a click. Your screen display should show a Table, clicking OK will give the SUMMARY OUTPUT, ANOVA AND RESIDUAL OUTPUT The first section of the EXCEL printout gives SUMMARY OUTPUT. The Multiple R is the square root of the R Square the computation and interpretation of which we have already discussed. The Standard Error of estimate (which will be discussed in the next chapter) is s 0.86423, which is the square root of Residual SS 5.97511 divided by its degrees of freedom, df 8, as given in the ANOVA section. We will also discuss the adjusted R-square of 0.21325 in the following chapters. Under the ANOVA section are the estimated regression coefficients and related statistics that will be discussed in detail in the next chapter. For now it is sufficient to recognize that the calculated coefficient values for the slope and y intercept are provided (b 0.07556 and a -0.29333). Next to these coefficient estimates is information on the variability in the distribution of the least-squares estimators from which these specific estimates were drawn: the column titled Std. Error contains the standard deviations (standard errors) of the intercept and slope distributions the t-ratio and p columns give the calculated values of the t statistics and associated p-values. As shown in Chapter 13, the t statistic of 1.85458 and p-value of 0.10077, for example, indicates that the sample slope (0.07556) is sufficiently different from zero, at even the 0.10 two-tail Type I error level, to conclude that there is a significant relationship between deaths and speed limits in the population. This conclusion is contrary to assertion that speed has little to do with safety. SUMMARY OUTPUT: Multiple R 0.54833, R Square 0.30067, Adjusted R Square 0.21325, Standard Error 0.86423, Observations 10 ANOVA df SS MS F P-value Regression 1 2.56889 2.56889 3.43945 0.10077 Residual 8 5.97511 0.74689 Total 9 8.54400 Coeffs. Estimate Std. Error T Stat P-value Lower 95 Upper 95 Intercept -0.29333 2.45963 -0.11926 0.90801 -5.96526 5.37860 Speed 0.07556 0.04074 1.85458 0.10077 -0.01839 0.16950 Predicted Residuals 3.86222 -0.86222 3.86222 -0.56222 3.86222 -0.46222 4.99556 -1.49556 3.86222 0.23778 4.24000 0.06000 3.86222 0.83778 4.24000 0.66000 4.24000 0.86000 5.37333 0.72667 Microsoft Excel Add-Ins Forecasting with regression requires the Excel add-in called Analysis ToolPak , and linear programming requires the Excel add-in called Solver . How you check to see if these are activated on your computer, and how to activate them if they are not active, varies with Excel version. Here are instructions for the most common versions. If Excel will not let you activate Data Analysis and Solver, you must use a different computer. Excel 2002/2003: Start Excel, then click Tools and look for Data Analysis and for Solver. If both are there, press Esc (escape) and continue with the respective assignment. Otherwise click Tools, Add-Ins, and check the boxes for Analysis ToolPak and for Solver, then click OK. Click Tools again, and both tools should be there. Excel 2007: Start Excel 2007 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the 8220Office Button8221 at top left - click the Excel Options button near the bottom of the resulting window - click the Add-ins button on the left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Excel 2010: Start Excel 2010 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the File tab at top left - click the Options button near the bottom of the left side - click the Add-ins button near the bottom left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Solving Linear Programs by Excel Some of these examples can be modified for other types problems Computer-assisted Learning: E-Labs and Computational Tools My teaching style deprecates the plug the numbers into the software and let the magic box work it out approach. Personal computers, spreadsheets, e. g. Sobresalir. professional statistical packages (e. g. such as SPSS), and other information technologies are now ubiquitous in statistical data analysis. Without using these tools, one cannot perform any realistic statistical data analysis on large data sets. The appearance of other computer software, JavaScript Applets. Statistical Demonstrations Applets. and Online Computation are the most important events in the process of teaching and learning concepts in model-based statistical decision making courses. These tools allow you to construct numerical examples to understand the concepts, and to find their significance for yourself. Use any or online interactive tools available on the WWW to perform statistical experiments (with the same purpose, as you used to do experiments in physics labs to learn physics) to understand statistical concepts such as Central Limit Theorem are entertaining and educating. Computer-assisted learning is similar to the experiential model of learning. The adherents of experiential learning are fairly adamant about how we learn. Learning seldom takes place by rote. Learning occurs because we immerse ourselves in a situation in which we are forced to perform and think. You get feedback from the computer output and then adjust your thinking-process if needed. A SPSS-Example . SPSS-Examples . SPSS-More Examples . (Statistical Package for the Social Sciences) is a data management and analysis product. It can perform a variety of data analysis and presentation functions, including statistical analyses and graphical presentation of data. SAS (Statistical Analysis System) is a system of software packages some of its basic functions and uses are: database management inputting, cleaning and manipulating data, statistical analysis, calculating simple statistics such as means, variances, correlations running standard routines such as regressions. Available at: SPSS/SAS Packages on Citrix (Installing and Accessing ) Use your email ID and Password: Technical Difficulties OTS Call Center (401) 837-6262 Excel Examples. Excel More Examples It is Excellent for Descriptive Statistics, and getting acceptance is improving, as computational tool for Inferential Statistics. The Value of Performing Experiment: If the learning environment is focused on background information, knowledge of terms and new concepts, the learner is likely to learn that basic information successfully. However, this basic knowledge may not be sufficient to enable the learner to carry out successfully the on-the-job tasks that require more than basic knowledge. Thus, the probability of making real errors in the business environment is high. On the other hand, if the learning environment allows the learner to experience and learn from failures within a variety of situations similar to what they would experience in the real world of their job, the probability of having similar failures in their business environment is low. This is the realm of simulations-a safe place to fail. The appearance of statistical software is one of the most important events in the process of decision making under uncertainty. Statistical software systems are used to construct examples, to understand the existing concepts, and to find new statistical properties. On the other hand, new developments in the process of decision making under uncertainty often motivate developments of new approaches and revision of the existing software systems. Statistical software systems rely on a cooperation of statisticians, and software developers. Beside the professional statistical software Online statistical computation . and the use of a scientific calculator is required for the course. A Scientific Calculator is the one, which has capability to give you, say, the result of square root of 5. Any calculator that goes beyond the 4 operations is fine for this course. These calculators allow you to perform simple calculations you need in this course, for example, enabling you to take square root, to raise e to the power of say, 0.36. y así. These types of calculators are called general Scientific Calculators. There are also more specific and advanced calculators for mathematical computations in other areas such as Finance, Accounting, and even Statistics. The last one, for example, computes mean, variance, skewness, and kurtosis of a sample by simply entering all data one-by-one and then pressing any of the mean, variance, skewness, and kurtosis keys. Without a computer one cannot perform any realistic statistical data analysis. Students who are signing up for the course are expected to know the basics of Excel. As a starting point, you need visiting the Excel Web site created for this course. If you are challenged by or unfamiliar with Excel, you may seek tutorial help from the Academic Resource Center at 410-837-5385, E-mail. What and How to Hand-in My Computer Assignment For the computer assignment I do recommend in checking your hand computation homework, and checking some of the numerical examples from your textbook. As part of your homework assignment you don not have to hand in the printout of the computer assisted learning, however, you must include within your handing homework a paragraph entitled Computer Implementation describing your (positive or negative) experience. Interesting and Useful Sites The Copyright Statement: The fair use, according to the 1996 Fair Use Guidelines for Educational Multimedia. of materials presented on this Web site is permitted for non-commercial and classroom purposes only. This site may be mirrored intact (including these notices), on any server with public access. All files are available at home. ubalt. edu/ntsbarsh/Business-stat for mirroring. Kindly e-mail me your comments, suggestions, and concerns. Gracias. EOF: CopyRights 1994-2015.


No comments:

Post a Comment