BrainsToBytes - page 2

Hola Lector, Ha Pasado un Rato

Ha pasado un tiempo desde la última vez que publiqué en este blog (¡casi 4 años!), ya que la vida ha estado demandando mucha atención. Puede que sea capaz de empezar a escribir con un poco más de frecuencia, o al menos eso es lo que espero. Entonces, ¿en qué he estado? Bueno, en muchas cosas. ¡Empecé un negocio de consultoría! Finalmente deci...

Leer más

Está bien, nadie puede recordar todo

Hace un par de días tuve una conversación con un amigo que está aprendiendo a programar. Estábamos hablando sobre la dificultad de recordar qué significa cada concepto y qué hace cada palabra clave en un lenguaje de programación. La conversación eventualmente llevó a esta pregunta: Ok, ¿pero cuándo dejaré de necesitar la documentación? Yo (pr...

Leer más

Sobre Abstracción y Acoplamiento

Este artículo es sobre el segundo grupo de conceptos de los que quería hablar después de releer Clean Architecture. Quiero intentar algo diferente esta vez: En lugar de elaborar cada idea en prosa larga y continua, las enumeraré como fragmentos separados. Así que, aquí va: Ya sabemos que el acoplamiento estrecho es algo malo. Une el softwa...

Leer más

Sobre Forma y Comportamiento

Recientemente comencé a releer Clean Architecture de Bob Martin y encontré dos ideas más que quería compartir. Una de ellas (el tema de este artículo) es la naturaleza dual de la forma en que los desarrolladores de software proporcionan valor y beneficios a través del código. Cuando implementas (o modificas) una característica en tu sistema est...

Leer más

Diseño Orientado al Dominio

Este artículo es un resumen de lo que considero los conceptos más importantes del libro Domain-Driven Design, de Eric Evans. Traté de condensar las ideas más importantes en un solo artículo para cualquier persona interesada en el tema. Intenté incluir toda la información posible, pero no fue una tarea fácil: El libro es una obra muy condensada c...

Leer más

Pandas práctico (11): La función apply

Ya hemos cubierto la mayoría de los fundamentos de trabajar con datos usando la biblioteca Pandas. Hay un tema más que me gustaría discutir antes de concluir la serie: La función Apply. En el artículo anterior, aprendimos cómo crear subgrupos de datos usando la función groupby. Esto es bastante útil cuando quieres obtener una mejor comprensión ...

Leer más

Pandas práctico (9): Fusionando Dataframes

Las operaciones de fusión/unión en Pandas te permiten recopilar información de muchas tablas en un solo dataframe para procesamiento o análisis posterior. Esta es otra habilidad importante que probablemente usarás mucho cuando trabajes con datos. Si tienes algo de experiencia con bases de datos relacionales puedes reconocer el comportamiento an...

Leer más

Pandas Práctico(8): Limpieza de Datos

En un mundo ideal, todos los datos que necesitas estarían disponibles en el formato correcto y con contenido completo. En el mundo real, probablemente necesitarás obtener datos de muchas fuentes diferentes e incompletas. Por eso es importante aprender a limpiar tus datos antes de analizarlos o pasarlos a un algoritmo de ML. La limpieza de dato...

Leer más

Pandas práctico(7): Cargando datos desde archivos

El análisis de datos usualmente comienza cargando datos en las estructuras de tu biblioteca/herramientas de elección. Casi siempre estos datos vendrán ya sea de una base de datos, la web, o una colección de archivos. Los archivos que contienen tus datos pueden venir en muchos formatos diferentes: Valores separados por comas en un archivo de tex...

Leer más

Pandas práctico(6): Estadísticas Descriptivas

Pandas proporciona muchas opciones para calcular estadísticas descriptivas y otras operaciones de reducción con solo una simple llamada a función. Podrías querer calcular estos valores como parte de un pipeline de ML/Análisis de Datos, o simplemente porque quieres obtener una mejor comprensión de los datos con los que estás lidiando. La mayoría...

Leer más

Pandas práctico(5): Mapping, apply y applymap

En este artículo, aprenderemos sobre mapeo y las funciones apply y applymap. Esta técnica te ayudará a manipular tus datos de formas muy convenientes, y es otra adición importante a tu caja de herramientas. Como siempre, exploraremos el tema con ejemplos que te ayudarán a entender qué está pasando. ¡Perfecto, comencemos! Mapeo Mapeo signifi...

Leer más

Pandas práctico(3): Reindexación y Eliminación

Hoy lidiaremos con dos técnicas que necesitamos cubrir antes de pasar a temas más avanzados de Pandas: Reindexación y eliminación de elementos. Será un poco más corto que los primeros dos artículos de la serie, pero eso no significa que no sea importante. Ambas técnicas son muy útiles, y probablemente las usarás en tu trabajo del día a día si t...

Leer más

Pandas práctico(2): Selección, Filtrado, loc e iloc

En el último artículo, aprendimos sobre las dos estructuras de datos básicas de pandas: Series y DataFrames. También construimos un par por nuestra cuenta y aprendimos los conceptos básicos de indexación y selección. Hoy aprenderemos un poco más sobre seleccionar y filtrar elementos de las estructuras de datos de Pandas. Esto puede parecer un t...

Leer más

Pandas práctico(1): Series y DataFrames

En una serie anterior cubrimos los fundamentos de NumPy, ahora es momento de lidiar con otra herramienta importante frecuentemente usada en análisis de datos: Pandas. Pandas es una biblioteca para manipulación y análisis de datos que te permite manipular datos heterogéneos en forma tabular (en contraste con NumPy, diseñado para trabajar con dat...

Leer más

NumPy práctico (VI): Álgebra Lineal

El álgebra lineal tiene muchas aplicaciones útiles en ciencia e ingeniería. Si estás haciendo computación científica, es muy probable que tarde o temprano necesites usar álgebra lineal para resolver problemas. Si tu álgebra lineal está un poco oxidada, puedes echar un vistazo al curso de álgebra lineal de Khan Academy, es gratis y hace un gran ...

Leer más

NumPy práctico (V): Reducciones/Agregaciones

Las reducciones (o agregaciones) son una familia de funciones de NumPy que operan sobre un array devolviendo un resultado con menos dimensiones. Muchas de estas funciones realizan operaciones estadísticas típicas en arrays, mientras que otras realizan reducciones de dimensionalidad. En este artículo, aprenderemos sobre algunas de las agregacio...

Leer más