Statistics with Julia: The Free eBook
This article is a translation of the original that appears on KDnuggets: Statistics with Julia: The Free eBook
https://www.kdnuggets.com/2020/09/statistics-julia-free-ebook.html
Thank you very much for allowing its publication in Spanish.
Muchas gracias por permitir su publicación en español.
Estadísticas con Julia: libro electrónico gratuito
Etiquetas: Books, Data Science, Free ebook, Julia, Statistics
Este libro electrónico gratuito es
una copia en borrador del futuro Statistics with Julia: Fundamentals for Data
Science, Machine Learning and Artificial Intelligence. ¿Está interesado en
aprender Julia para su aplicación en la ciencia de datos? Esta podría ser la
mejor introducción que existe.
Autor: Matthew Mayo, KDnuggets.
La mayoría de los debates,
discusiones y guerras con respecto a qué lenguajes de programación son
adecuados para la ciencia de datos, tienden a centrarse en Python y R. Si bien estos
pueden ser los dos lenguajes más utilizados en este campo, eso no significa que
sean las únicas opciones disponibles,
ni tampoco que sean necesariamente las "mejores" opciones. Una opción
adicional entre muchas es Julia, un lenguaje de programación de propósito
general rápido, dinámico y de código abierto que se considera una habilidad deseable en la ciencia datos para tener en cuenta su adopción.
Una de las mejores introducciones
que he encontrado en lo que se refiere al uso del lenguaje en la ciencia de
datos es el libro Statistics with Julia: Fundamentals for Data Science, Machine Learning
and Artificial Intelligence, escrito por Yoni Nazarathy y
Hayden Klok, y actualmente en forma de borrador. El sitio web del libro se puede
encontrar aquí, y los ejemplos de código que lo acompañan están disponibles en
este repositorio de GitHub.
La primera pregunta que se le puede ocurrir en este momento es
"¿por qué Julia?", en el contexto de que existen otras opciones más
ampliamente aceptadas. Es mejor abordar esto antes de continuar, y lo hacemos
con este extracto del primer capítulo del libro.
Julia es ante todo un lenguaje de programación científico. Es
perfectamente adecuado para tratar estadísticas, el aprendizaje automático, la ciencia
de datos, así como para tareas ligeras y pesadas de computación numérica.
También se puede integrar en aplicaciones de nivel de usuario, sin embargo,
normalmente no se usaría para interfaces front-end o la creación de juegos. Es
un lenguaje y una plataforma de código abierto, y la comunidad de Julia reúne a
colaboradores de los mundos de la informática científica, la estadística y la
ciencia de datos. Esto coloca al lenguaje y al sistema de paquetes de Julia en
un buen lugar para combinar los métodos estadísticos convencionales con los
métodos y tendencias del mundo de la informática científica.
Visto esto, podemos pasar a explicar por qué este libro en particular
es una excelente manera de aprender a usar Julia para su aplicación en la
ciencia de datos. Nuevamente, del capítulo uno del libro:
Pregunta: ¿Necesito tener
conocimientos de estadística o de cálculo de probabilidades para leer este
libro?
Respuesta: El conocimiento
de estadística o de cálculo de probabilidades no se presupone de antemano. Por
lo tanto, este libro es una guía independiente de los principios básicos de
probabilidad, estadística, aprendizaje automático, ciencia de datos e
inteligencia artificial. Es ideal para ingenieros, científicos de datos o profesionales
de la ciencia que deseen ampliar sus conocimientos básicos de cálculo de probabilidades,
estadística y ciencia de datos mientras exploran el lenguaje Julia. Sin
embargo, se utiliza la notación matemática general y sus resultados, incluidos
los conceptos básicos del álgebra lineal, el cálculo y las matemáticas
discretas.
Pregunta: ¿Qué experiencia en programación es necesaria para utilizar este
libro?
Respuesta: Aunque este libro no es un libro de programación
introductorio, no se supone que el lector es un desarrollador de software
profesional. Cualquier lector que haya codificado en algún otro lenguaje a
nivel básico, podrá seguir los ejemplos de código y sus descripciones.
Esto responde a las dos preguntas
habituales que podrías tener antes de empezar un libro sobre programación de
estadística: ¿es el conocimiento de la programación un prerrequisito; es el
conocimiento de estadística un prerrequisito? La respuesta para ambas termina
siendo no, haciendo de este un recurso muy apropiado para un principiante.
El índice del
libro, incluyendo los apéndices:
1. Introducing Julia
2. Basic Probability
3. Probability
Distributions
4. Processing and
Summarizing Data
5. Statistical
Inference Concepts
6. Confidence
Intervals
7. Hypothesis
Testing
8. Linear Regression
and Extensions
9. Machine Learning
Basics
10. Simulation of
Dynamic Models
a. How-to in Julia
b. Additional
Language Features
c. Additional
Packages
La sección 1.3 del libro, Crash Course by Example, es un gran
lugar para comenzar su viaje a Julia si no tiene experiencia con el lenguaje.
Después de una rápida revisión de los fundamentos lingüísticos de la sección
anterior, se pasa directamente a la codificación con algunos ejemplos no
triviales, incluyendo la ordenación de burbuja, la manipulación de cadenas, el
análisis sintáctico JSON y los estados estables de la cadena de Markov.
A medida que se avanza en el capítulo, se tratan las gráficas, la
generación de números aleatorios y las simulaciones de Monte Carlo, seguidas de
la integración de Julia con otros lenguajes. En el siguiente capítulo, el libro
se adentra en los conceptos estadísticos, y a partir de ese momento los conceptos
se construyen unos sobre otros, conduciendo a temas más avanzados como la
inferencia estadística, los intervalos de confianza, la prueba de hipótesis, la
regresión lineal y el aprendizaje automático entre otros.
Este es el recurso que he estado esperando para aprender Julia y
aplicarlo en la ciencia de datos de la forma en la que quiero aprenderlo.
Espero que esté tan ilusionado como yo de ponerse en marcha en su viaje.
Enlaces relacionados:
·
Complex logic at
breakneck speed: Try Julia for data science
·
Foundations of
Data Science: The Free eBook
·
Understanding
Machine Learning: The Free eBook