Programación computacional y análisis de datos en educación estadística
Palavras-chave:
educación estadística, programación computacional, análisis exploratorio de datosResumo
Se presentan los resultados de un estudio cuyo propósito fue conocer y comparar la opinión de un grupo de estudiantes de Ingeniería respecto de las características más representativas de los lenguajes de programación R y Python a la luz de su uso en el análisis estadístico de un caso de estudio real. A los 61 estudiantes participantes, quienes cursaban asignaturas de probabilidad y estadística; se les presentó un caso de estudio real y contextual para su examen. El 98,3% realizó el análisis y documentó sus resultados de acuerdo con los lineamientos establecidos; en el caso de R, el 81,97% optó por usar paquetes externos al núcleo básico para elaborar el informe reproducible, el 52,45% indicó usar R Markdown en detrimento de otra tecnología. En el caso de Python, el 88,52% usó las librerías Scipy, Matplotlib, Numpy y Pandas para el análisis; el 67,21% utilizó Markdown-Python para la redacción del informe. De Python destacaron la facilidad para escribir código; de R distinguieron su potencia para organizar, visualizar y efectuar cálculo estadístico. Se recomienda efectuar un estudio experimental que permita probar métodos pedagógicos que integren prácticas distintas a las predominantes durante las últimas tres décadas en la educación estadística.Downloads
Referências
Ben-Zvi, D., y Garfield, J. (2004) Statistical Literacy, Reasoning, and Thinking: Goals, Definitions, and Challenges. En: Ben-Zvi D., Garfield J. (eds.) The Challenge of Developing Statistical Literacy, Reasoning and Thinking. Springer, Dordrecht.
Boxuan, C. (2018). Package DataExplorer (software). Tomado de https://CRAN.R-project.org/package=DataExplorer.
Chambers, J. (2008). Software for data analysis: programming with R. Springer Science & Business Media.
Gal, I. (2004). Statistical literacy. In The challenge of developing statistical literacy, reasoning and thinking (pp. 47-78). Springer, Dordrecht.
Ihaka, R. (1998). R: Past and future history. Computing Science and Statistics, 392396.
Ihaka, R. & Gentleman, R. (1996). R: a language for data analysis and graphics. Journal of computational and graphical statistics. 5(3), 299-314.
Johansson, R. (2015). Numerical Python. A Practical Techiques Approach for Industrial. Uruyasu, Japan: Apress.
Kabacoff, R. (2018). Data Visualization with R. EEUU: Wesleyan University.
Kassambara, A. (2017). R Graphics Essentials for Great data Visualization. México: IPP.
López, C. C., & Ramírez, M. M. O. (2018). La opinión de los estudiantes sobre el uso de las metas de aprendizaje de la estadística en cursos introductorios en la universidad veracruzana. Investigación Operacional, 39(2), 181-191.
McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. O’Reilly Media, Inc.
R Core Team, F. (2018). Writing R Extensions. Viena, Austria: R Foundation Project. Tomado de https://cran.r-project.org/doc/manuals/r-release/R-exts.html
Rüde, U., Willcox, K., McInnes, L., & Sterck, H. (2018). Research and Education in Computational Science and Engineering. SIAM Review, 60 (3), 707-754. Tomado de https://doi.org/10.1137/16M1096840
Solano, J. (2011). Introducción a la programación en Python. Costa Rica: Editorial Tecnológica del ITCR.
Toomey, D. (2018). Jupyter Cookbook. Birmingham, UK: Packt Publishing.
Tukey J. (1977). Exploratory Data Analysis. UK: Pearson
Van Dijke-Droogers, M., Drijvers, P., & Tolboom, J. (2017). Enhancing statistical literacy. In CERME 10
Watson, J. (2013). Statistical literacy at school: Growth and goals. Routledge.
Wickham, H. & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. O’ Reilly Media, Inc.
Zetterqvist, L. (2017). Applied problems and use of technology in an aligned way in basic courses in probability and statistics for engineering students-a way to enhance understanding and increase motivation. Teaching Mathematics and its Applications: An International Journal of the IMA. 36 (2), 108-122. Tomado de https://doi.org/10.1093/teamat/hrx004
Zimek, A., & Filzmoser, P. (2018). There and back again: Outlier detection between statistical reasoning and data mining algorithms. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(6), 1280.
Downloads
Como Citar
Edição
Secção
Licença
Esta revista oferece acesso livre e imediato ao seu conteúdo, sob o princípio de tornar a investigação livremente disponível ao público, o que promove um maior intercâmbio de conhecimento global.
Os autores que publicam na Areté, Revista Digital del Doctorado en Educación, aceitam as seguintes condições:
- Os autores mantêm os direitos de autor e concedem à revista o direito de ser a primeira publicação do trabalho, bem como de o licenciar ao abrigo de uma Licença de Atribuição Creative Commons que permite a outros partilhar o trabalho com um reconhecimento da autoria do trabalho e da publicação inicial nesta revista.
Os autores podem celebrar separadamente acordos adicionais para a distribuição não exclusiva da versão do trabalho publicada na revista (por exemplo, colocando-a num repositório institucional ou publicando-a num livro), com um reconhecimento da sua publicação inicial nesta revista e não utilizada para fins comerciais. - Os conteúdos e imagens incluídos nos artigos são da responsabilidade do(s) autor(es). Areté, Revista Digital del Doctorado en Educación, não é responsável pela informação incluída nos mesmos.
Os autores concordam com a licença de uso utilizada pela revista, com as condições de auto-arquivo e com a política de acesso aberto. - É permitido aos autores divulgar eletronicamente (por exemplo, em repositórios institucionais ou no seu próprio sítio Web) a versão publicada dos seus trabalhos, uma vez que tal favorece a sua circulação e divulgação mais precoce e, consequentemente, um possível aumento da sua citação e alcance entre a comunidade académica.
Em caso de reutilização de trabalhos publicados, deve ser mencionada a existência e as especificações da licença de utilização, bem como a autoria e a fonte original da publicação.