WOT

Monday, September 28, 2020

Statistics with Julia: The Free eBook - Estadísticas con Julia: libro electrónico gratuito

 

Statistics with Julia: The Free eBook

 

  

This article is a translation of the original that appears on KDnuggets: Statistics with Julia: The Free eBook


 

 

 

https://www.kdnuggets.com/2020/09/statistics-julia-free-ebook.html

 

 

Thank you very much for allowing its publication in Spanish.

 

 

Muchas gracias por permitir su publicación en español. 

   

 Estadísticas con Julia: libro electrónico gratuito


  
Etiquetas: BooksData ScienceFree ebookJuliaStatistics



Este libro electrónico gratuito es una copia en borrador del futuro Statistics with Julia: Fundamentals for Data Science, Machine Learning and Artificial Intelligence. ¿Está interesado en aprender Julia para su aplicación en la ciencia de datos? Esta podría ser la mejor introducción que existe.

https://www.kdnuggets.com/aps/e-sas-20m06.gif?ms547


 

Autor: Matthew Mayo, KDnuggets.


 


La mayoría de los debates, discusiones y guerras con respecto a qué lenguajes de programación son adecuados para la ciencia de datos, tienden a centrarse en Python y R. Si bien estos pueden ser los dos lenguajes más utilizados en este campo, eso no significa que sean las únicas opciones disponibles, ni tampoco que sean necesariamente las "mejores" opciones. Una opción adicional entre muchas es Julia, un lenguaje de programación de propósito general rápido, dinámico y de código abierto que se considera una habilidad deseable en la ciencia datos  para tener en cuenta su adopción.

Una de las mejores introducciones que he encontrado en lo que se refiere al uso del lenguaje en la ciencia de datos es el libro Statistics with Julia: Fundamentals for Data Science, Machine Learning and Artificial Intelligence, escrito por Yoni Nazarathy y Hayden Klok, y actualmente en forma de borrador. El sitio web del libro se puede encontrar aquí, y los ejemplos de código que lo acompañan están disponibles en este repositorio de GitHub.


 


La primera pregunta que se le puede ocurrir en este momento es "¿por qué Julia?", en el contexto de que existen otras opciones más ampliamente aceptadas. Es mejor abordar esto antes de continuar, y lo hacemos con este extracto del primer capítulo del libro.

Julia es ante todo un lenguaje de programación científico. Es perfectamente adecuado para tratar estadísticas, el aprendizaje automático, la ciencia de datos, así como para tareas ligeras y pesadas de computación numérica. También se puede integrar en aplicaciones de nivel de usuario, sin embargo, normalmente no se usaría para interfaces front-end o la creación de juegos. Es un lenguaje y una plataforma de código abierto, y la comunidad de Julia reúne a colaboradores de los mundos de la informática científica, la estadística y la ciencia de datos. Esto coloca al lenguaje y al sistema de paquetes de Julia en un buen lugar para combinar los métodos estadísticos convencionales con los métodos y tendencias del mundo de la informática científica.

Visto esto, podemos pasar a explicar por qué este libro en particular es una excelente manera de aprender a usar Julia para su aplicación en la ciencia de datos. Nuevamente, del capítulo uno del libro:

Pregunta: ¿Necesito tener conocimientos de estadística o de cálculo de probabilidades para leer este libro?

Respuesta: El conocimiento de estadística o de cálculo de probabilidades no se presupone de antemano. Por lo tanto, este libro es una guía independiente de los principios básicos de probabilidad, estadística, aprendizaje automático, ciencia de datos e inteligencia artificial. Es ideal para ingenieros, científicos de datos o profesionales de la ciencia que deseen ampliar sus conocimientos básicos de cálculo de probabilidades, estadística y ciencia de datos mientras exploran el lenguaje Julia. Sin embargo, se utiliza la notación matemática general y sus resultados, incluidos los conceptos básicos del álgebra lineal, el cálculo y las matemáticas discretas.

Pregunta: ¿Qué experiencia en programación es necesaria para utilizar este libro?
Respuesta: Aunque este libro no es un libro de programación introductorio, no se supone que el lector es un desarrollador de software profesional. Cualquier lector que haya codificado en algún otro lenguaje a nivel básico, podrá seguir los ejemplos de código y sus descripciones.

Esto responde a las dos preguntas habituales que podrías tener antes de empezar un libro sobre programación de estadística: ¿es el conocimiento de la programación un prerrequisito; es el conocimiento de estadística un prerrequisito? La respuesta para ambas termina siendo no, haciendo de este un recurso muy apropiado para un principiante.

 

El índice del libro, incluyendo los apéndices:

1.    Introducing Julia

2.    Basic Probability

3.    Probability Distributions

4.    Processing and Summarizing Data

5.    Statistical Inference Concepts

6.    Confidence Intervals

7.    Hypothesis Testing

8.    Linear Regression and Extensions

9.    Machine Learning Basics

10. Simulation of Dynamic Models

a.    How-to in Julia

b.    Additional Language Features

c.    Additional Packages


 


La sección 1.3 del libro, Crash Course by Example, es un gran lugar para comenzar su viaje a Julia si no tiene experiencia con el lenguaje. Después de una rápida revisión de los fundamentos lingüísticos de la sección anterior, se pasa directamente a la codificación con algunos ejemplos no triviales, incluyendo la ordenación de burbuja, la manipulación de cadenas, el análisis sintáctico JSON y los estados estables de la cadena de Markov.

 

A medida que se avanza en el capítulo, se tratan las gráficas, la generación de números aleatorios y las simulaciones de Monte Carlo, seguidas de la integración de Julia con otros lenguajes. En el siguiente capítulo, el libro se adentra en los conceptos estadísticos, y a partir de ese momento los conceptos se construyen unos sobre otros, conduciendo a temas más avanzados como la inferencia estadística, los intervalos de confianza, la prueba de hipótesis, la regresión lineal y el aprendizaje automático entre otros.

Este es el recurso que he estado esperando para aprender Julia y aplicarlo en la ciencia de datos de la forma en la que quiero aprenderlo. Espero que esté tan ilusionado como yo de ponerse en marcha en su viaje.

 
Enlaces relacionados:

·         Complex logic at breakneck speed: Try Julia for data science

·         Foundations of Data Science: The Free eBook

·         Understanding Machine Learning: The Free eBook

 

Friday, September 11, 2020

 

 



Ray ha experimentado un rápido crecimiento. Cientos de empresas utilizan actualmente Ray para crear aplicaciones y bibliotecas distribuidas, infraestructuras de backend, plataformas ML  entre otras.

 

 "Ray es la única plataforma flexible que proporciona una ejecución distribuida y sencilla de Python, lo que permite a nuestra IA orquestar muchas instancias de gráficos paralelos y escalar desde computadoras portátiles a centros de datos". -Arimo


La próxima conferencia de Ray será la mejor manera de conectarse con la comunidad de Ray y ver cómo lo están usando en producción para escalar las aplicaciones de Python y ML. Estos son solo algunos aspectos destacados de la lista de oradores y de lo que se tratará:

 



 

• Aprenda de líderes en ML y AI como son Michael Jordan, Oriol Vinyals, Ion Stoica, Manuela Veloso y David Patterson

• Vea como empresas como Microsoft, AWS, JP Morgan y Ant Financial utilizan Ray para infraestructura de ML, MLOps, aprendizaje profundo y aplicaciones financieras.

 • Obtenga una mayor información sobre las bibliotecas ML que aprovechan Ray, incluidas RLlib, Tune, Serve, RaySGD, Horovod, spaCy, Hugging Face y Seldon

• Aprenda lo último en informática sin servidor y nube nativa de la mano de Adrian Cockroft (AWS VP Cloud Architecture) y Jonas Bonér (Lightbend CTO)

No se lo pierda: compruebe usted mismo por qué Ray está preparado para ser el marco dominante en la informática distribuida.
 

 

 

Aprendizaje automático escalable y Python para todos