Hola Lector, Ha Pasado un Rato
Ha pasado un tiempo desde la última vez que publiqué en este blog (¡casi 4 años!), ya que la vida ha estado demandando mucha atención. Puede que sea capaz de empezar a escribir con un poco más de frecuencia, o al menos eso es lo que espero.
Entonces, ¿en qué he estado? Bueno, en muchas cosas.
¡Empecé un negocio de consultoría!
Finalmente deci...
Está bien, nadie puede recordar todo
Hace un par de días tuve una conversación con un amigo que está aprendiendo a programar.
Estábamos hablando sobre la dificultad de recordar qué significa cada concepto y qué hace cada palabra clave en un lenguaje de programación. La conversación eventualmente llevó a esta pregunta:
Ok, ¿pero cuándo dejaré de necesitar la documentación?
Yo (pr...
Sobre Abstracción y Acoplamiento
Este artículo es sobre el segundo grupo de conceptos de los que quería hablar después de releer Clean Architecture.
Quiero intentar algo diferente esta vez: En lugar de elaborar cada idea en prosa larga y continua, las enumeraré como fragmentos separados.
Así que, aquí va:
Ya sabemos que el acoplamiento estrecho es algo malo. Une el softwa...
Sobre Forma y Comportamiento
Recientemente comencé a releer Clean Architecture de Bob Martin y encontré dos ideas más que quería compartir. Una de ellas (el tema de este artículo) es la naturaleza dual de la forma en que los desarrolladores de software proporcionan valor y beneficios a través del código.
Cuando implementas (o modificas) una característica en tu sistema est...
Diseño Orientado al Dominio
Este artículo es un resumen de lo que considero los conceptos más importantes del libro Domain-Driven Design, de Eric Evans. Traté de condensar las ideas más importantes en un solo artículo para cualquier persona interesada en el tema. Intenté incluir toda la información posible, pero no fue una tarea fácil: El libro es una obra muy condensada c...
Pandas práctico (11): La función apply
Ya hemos cubierto la mayoría de los fundamentos de trabajar con datos usando la biblioteca Pandas. Hay un tema más que me gustaría discutir antes de concluir la serie: La función Apply.
En el artículo anterior, aprendimos cómo crear subgrupos de datos usando la función groupby. Esto es bastante útil cuando quieres obtener una mejor comprensión ...
Pandas práctico (10): Operaciones de grupo usando groupby
A veces necesitas realizar operaciones en subconjuntos de datos. Tus filas pueden tener atributos en común o de alguna manera formar grupos lógicos basados en otras propiedades. Operaciones comunes como encontrar el promedio, máximo, conteo o desviación estándar de valores de grupos de datos es una tarea realmente común, y Pandas hace que esto s...
Pandas práctico (9): Fusionando Dataframes
Las operaciones de fusión/unión en Pandas te permiten recopilar información de muchas tablas en un solo dataframe para procesamiento o análisis posterior. Esta es otra habilidad importante que probablemente usarás mucho cuando trabajes con datos.
Si tienes algo de experiencia con bases de datos relacionales puedes reconocer el comportamiento an...
Pandas Práctico(8): Limpieza de Datos
En un mundo ideal, todos los datos que necesitas estarían disponibles en el formato correcto y con contenido completo.
En el mundo real, probablemente necesitarás obtener datos de muchas fuentes diferentes e incompletas. Por eso es importante aprender a limpiar tus datos antes de analizarlos o pasarlos a un algoritmo de ML.
La limpieza de dato...
Pandas práctico(7): Cargando datos desde archivos
El análisis de datos usualmente comienza cargando datos en las estructuras de tu biblioteca/herramientas de elección. Casi siempre estos datos vendrán ya sea de una base de datos, la web, o una colección de archivos.
Los archivos que contienen tus datos pueden venir en muchos formatos diferentes: Valores separados por comas en un archivo de tex...
Pandas práctico(6): Estadísticas Descriptivas
Pandas proporciona muchas opciones para calcular estadísticas descriptivas y otras operaciones de reducción con solo una simple llamada a función. Podrías querer calcular estos valores como parte de un pipeline de ML/Análisis de Datos, o simplemente porque quieres obtener una mejor comprensión de los datos con los que estás lidiando.
La mayoría...
Pandas práctico(5): Mapping, apply y applymap
En este artículo, aprenderemos sobre mapeo y las funciones apply y applymap.
Esta técnica te ayudará a manipular tus datos de formas muy convenientes, y es otra adición importante a tu caja de herramientas.
Como siempre, exploraremos el tema con ejemplos que te ayudarán a entender qué está pasando.
¡Perfecto, comencemos!
Mapeo
Mapeo signifi...
Pandas práctico(4): Aritmética con DataFrames y Series
Las operaciones aritméticas son algunas de las cosas más fundamentales (e importantes) que puedes hacer con series y dataframes. En este artículo, aprenderemos cómo realizar operaciones básicas usando tanto series como dataframes.
Estamos interesados en los siguientes escenarios:
Operaciones entre series con el mismo índice.
Operaciones e...
Pandas práctico(3): Reindexación y Eliminación
Hoy lidiaremos con dos técnicas que necesitamos cubrir antes de pasar a temas más avanzados de Pandas: Reindexación y eliminación de elementos.
Será un poco más corto que los primeros dos artículos de la serie, pero eso no significa que no sea importante. Ambas técnicas son muy útiles, y probablemente las usarás en tu trabajo del día a día si t...
Pandas práctico(2): Selección, Filtrado, loc e iloc
En el último artículo, aprendimos sobre las dos estructuras de datos básicas de pandas: Series y DataFrames. También construimos un par por nuestra cuenta y aprendimos los conceptos básicos de indexación y selección.
Hoy aprenderemos un poco más sobre seleccionar y filtrar elementos de las estructuras de datos de Pandas. Esto puede parecer un t...
Pandas práctico(1): Series y DataFrames
En una serie anterior cubrimos los fundamentos de NumPy, ahora es momento de lidiar con otra herramienta importante frecuentemente usada en análisis de datos: Pandas.
Pandas es una biblioteca para manipulación y análisis de datos que te permite manipular datos heterogéneos en forma tabular (en contraste con NumPy, diseñado para trabajar con dat...
NumPy práctico (VI): Álgebra Lineal
El álgebra lineal tiene muchas aplicaciones útiles en ciencia e ingeniería. Si estás haciendo computación científica, es muy probable que tarde o temprano necesites usar álgebra lineal para resolver problemas.
Si tu álgebra lineal está un poco oxidada, puedes echar un vistazo al curso de álgebra lineal de Khan Academy, es gratis y hace un gran ...
NumPy práctico (V): Reducciones/Agregaciones
Las reducciones (o agregaciones) son una familia de funciones de NumPy que operan sobre un array devolviendo un resultado con menos dimensiones.
Muchas de estas funciones realizan operaciones estadísticas típicas en arrays, mientras que otras realizan reducciones de dimensionalidad.
En este artículo, aprenderemos sobre algunas de las agregacio...
103 artículos, 6 páginas.