Me gusta deepnote, pero me consume más recursos por lo visto. Noto la pc algo lenta. Voy a seguir el curso desde mi siempre confiable Jupyter :smile:
No lo creo, yo también uso Deepnote y va normal, creo que es el navegador, no gestiona bien la RAM
Deepnote se mantiene en constante actualización. Su interfaz ha estado algo lenta en las últimas semanas, pero parece que ya se recuperó.
Otras opciones:
Un navegador que consuma menos RAM.
Una conexión de internet estable.
Crear tu entorno de desarrollo local.
En cualquier caso, éxito en tu camino de aprendzaje. 😋
Me quedaré con Google Colab :)
Definitivamente!
📌Hola, si deciden trabajar directamente dede VS Code, les reocimiendo que antes de instalas las librerias que nos proporciona el profe, crear un ambiente especial para trabajar en este proyecto, asi si vuelven a tener un proyecto similar donde utilizaran exacatamente las vesiones que manejan en este curso basta con inicialziarla. Para eso les sugiero que tomen el : "Curso de Entorno de Trabajo para Ciencia de Datos con Jupyter Notebooks y Anaconda" Que tambien lo imparte este profe (Increible curso) pero si ya lo tomaron o ya antes habian trabajado con Anaconda pero no recuerdan del todo el proceso de crear nuevos ambientes
Desde la termianal imagina que a este ambinete de traabjo le pondras "Proyectos" entonces simplemente pones el comando:
conda create -n proyectos
Luego de eso verás que se creo el ambiente de trabajo, apra inicialziarlo:
conda activate proyectos
Y Ahora asi es buen momento para insatalar las librerias que nos recoiendan:
++Empezadno por:++
Por ultimo si tu nuevo entorno de trabajo "Proyectos" no cuenta con Python simplemente ejecuta:
conda install python=3.9
Super Cool 🎉 Todo tu entorno de trabajo segmentado en un solo lugar. Si simplemente quieres salir de este entorno de trabajo y volver al panorama general donde quizá tengas alguna otra verison de Python como la 3.5, simplemente ejecuta en la terminal:
conda deactivate
Listo, espero y les funcione esta info ⚡
Excelente consejo
Si están desde wsl puede generar distintos problemas y no lo detecta, es normal, no les digo como lo solucioné porque me medio chatgepeteé lo que hice pero ya me funcionó
Personalmente uso Azure Databricks desde hace más de 8 meses (por mi trabajo como data scientist) , es un entorno cloud de Azure en los cuales puedes usar Databricks, la integracion de fuentes de datos de Azure Datalake (entre otros), asi como Azure Devops ("el git empresarial"), Todo esto es un entorno super super avanzado para ciencia de datos, data engineering e incluso machine learning.
Tienes soporte para Python, SQL, SCALA y R. y su caracteristica de los clusters (todo esto es de pago :c) deja hacer trabajos super super rapidos para BigData
Desde que empece con Platzi he utilizado
Colab
Spyder
Jupyter
Deepnote
RStudio
Si me preguntan cual es mejor diria que solamente es cuestion de cual te hace sentir mas comodo.
yo utilizo VS Code con la extensión de Jupyter notebooks y ligados a un repositorio que controlo desde la misma terminal de VS Code, después de intentar muchas herramientas es lo que me ha funcionado mejor a mi tanto para estudiar cómo para mi entorno profesional, en el entorno profesional si necesito más recursos me conecto a un servidor de Jupyter Hub
A la pregunta sobre otras herramientas de análisis exploratorio de datos, en mi maestría utilicé Jamovi y Jasp. Ambos son interfaces gratuitas point and click que utilizan el lenguaje R y su librería ggplot2 para sacar gráficas. Medidas de tendencia central, ANOVA, correlaciones, AFE, regresiones se pueden hacer fácilmente, siendo técnicas que son muy antiguas pero muy usadas en ciencias sociales. Igual se pueden utilizar para un vistazo rápido de los datos, siempre que estos estén en formato CSV utf-8.
Permite también hacer un rudimentario análisis de clústers y de árbol de decisión.
Jamovi es una herramienta muy cool. Entre las cosas que lo hacen cool es su comunidad que se encuentra desarrollando nuevos análisis al alcance de tu mano. 😋💚
En cuanto a Jasp no lo tenía en mente. Buen aporte. ✨
Yo soy Team Deepnote aunque me gusta mucho usar Google Colab. Las dos me gustan mucho y me son muy sencillas de usar.
En colab:
!pip install empiricaldist
!pip install janitor
!pip install pyjanitor
!pip install palmerpenguins
!pip install session-info
import empiricaldist
import janitor as jn
import matplotlib.pyplot as plt
import numpy as np
import palmerpenguins
import pandas as pd
import scipy.stats
import seaborn as sns
import sklearn.metrics
import statsmodels.api as sm
import statsmodels.formula.api as smf
import statsmodels.stats as ss
import session_info
Muchas gracias
Muchas gracias mi rey!
Sería bueno actualizar el contenido del curso, ya que la pantalla de deepnote ahora a junio 2025, es diferente a la de la clase.
Yo particularmente uso miniconda. Pude instalarlo en la notebook del trabajo sin precisar permiso de administrador. Todos los archivos de datos los tengo locales, creo mis ambientes (que reconoce vscode) y corro un jupyter notebook en el explorador (me lo abre en la carpeta actual). Creo todos aportan algo y no encuentro alguna caracteristica especial que haga inclinar la balance en favor de alguno, pero miniconda siempre lo puedo usar. Incluso con dataframes muy grandes vs me pide cambiar la configuracion para visualizar datos grandes y con minoconda no. Otro tema para mi importante es tener los datos locales. En un reto de platzi el analisis inicial, investigacion y pruebas lo hice local con miniconda y despues subi el notebook a deepnote donde termine el proyecto con las visualizaciones.
¡Miniconda es una herramienta increíble, la utilizó todo el tiempo! 💚
Lo mejor es que puedes tener lo mejor de ambos mundos. Puedes utilizar miniconda con Deepnote y Google Colab sin ningún problema. 😋
Excelente, lo tendré en cuenta.
Hay muchas herramientas de software disponibles para el análisis exploratorio de datos, aquí hay algunas de las más populares:
R:
Es un lenguaje de programación y un entorno de desarrollo para estadísticas y análisis de datos.
R tiene una gran comunidad de usuarios y una amplia gama de paquetes para el análisis de datos, incluyendo ggplot2 para la visualización de datos.
Python:
Es un lenguaje de programación versátil y popular que también se utiliza para el análisis de datos.
Python tiene paquetes como Pandas, Numpy y Matplotlib para el análisis y visualización de datos.
Otras herramientas para el análisis exploratorio de datos
SAS:
Es un software de análisis de datos comercial que ofrece una amplia gama de funciones de análisis y visualización de datos.
SAS es ampliamente utilizado en empresas y organizaciones gubernamentales.
SPSS:
Es un software de análisis de datos que se utiliza principalmente en investigación social y psicológica.
SPSS ofrece una amplia gama de funciones estadísticas y de visualización de datos.
Tableau:
Es un software de visualización de datos que permite crear visualizaciones interactivas y explicativas a partir de grandes conjuntos de datos.
Tableau es ampliamente utilizado en el sector empresarial para la exploración y visualización de datos.
Estas son solo algunas de las herramientas disponibles, y la mejor herramienta para un análisis exploratorio de datos depende de la naturaleza de los datos y los objetivos del análisis. Muchas herramientas también se integran con otras para brindar una experiencia de análisis completa.
Hola buenas, tengo un error al ejecutar las librerias
Tengo el mismo error y no se como solucionarlo, lleve el proyecto a google colab y me sigue apareciendo el problema.
Hola! Tenía el mismo problema y creo que es por las versiones de las librerías. Lo solucioné instalando las siguientes versiones:
DeepNote es hermoso, amigable e intuitivo, sin embargo para practicar lo único bueno que tiene es su interfaz, porque sino pagas es bien lento si analizas un data set pesado.
Para mi es mejor usar vscode, ya que me da muchísima libertad a realizar muchas cosas.
Dónde encuentro el notebook del profe que tiene los campos en blanco? porque la notebook que duplique ya tiene todo y me gusta ir haciendo lo que hace el profe para interiorizar mejor las cosas y no solo mirar la clase
Cordial saludo, considero importante explicar la configuración de la plantilla. Es decir, haber hecho la demostración en tiempo real para aprender cómo se configura la plantilla inicial.
Otra herramienta buena para el análisis exploratorio de datos es el software SPSS de IBM
stata me sorprende que nadie lo haya mencionado junto a spss y R son los que se enseñan en las universidades para materias de ciencias sociales.
Les dejo mi repositorio con mis notas, donde enriquecí cada tema, saludos.