Guía de Jupyter

Clase 11 de 30Curso de Big Data y Ciencia de Datos 2016

¿Qué es Jupyter?

Es un entorno de desarrollo interactivo agnóstico del lenguaje para ciencias de la computación y ciencia de datos.

Jupyter notebook tiene tres componentes,

  • Aplicación web, para correr código de forma interactiva desde un navegador web.
  • Kernels, el proceso que corre el código en el lenguaje especifico y regresa la salida del proceso a la aplicación web, jupyter soporta múltiples lenguajes como Python, Julia, R, etc.
  • Documentos, código, anotaciones, imágenes, vídeo que compone el notebook, son almacenados en formato JSON.

Primeros pasos

Gestor de paquetes

Para poder instalar Jupyter y todas las dependencias que necesitamos en nuestro proyecto necesitamos tener instalado PIP, el gestor de paquetes de Python.

Si tienes instalado Python 2.7 o 3.0> muy probablemente ya se encuentre instalado en tu sistema, para comprobarlo ejecuta el comando pip --version en la terminal, si arroja un error puedes seguir el proceso de instalación.

Para instalar un paquete (en este caso Jypyter) lo unico que debes hacer es ejecutar el comando

pip3 install jupyter

Si tienes instalado python 2.x

pip install jupyter

Nota: Para realizar la instalación global requiere ejecutarse con sudo o iniciar la terminal con permisos de administrador.

Primer Notebook

Ya que sabemos como instalar las dependencias que necesitemos, vamos a crear nuestro primer proyecto.

Entorno virtual

Para poder tener organizados los proyectos que creemos y sus dependencias vamos a usar entornos virtuales.

Primero instalamos virtualenv de manera global.

sudo pip install virtualenv

Nota: en Windows debes ejecutar el comando sin sudo, pero iniciando la terminal con modo administrador.

Ahora creamos nuestro entorno virtual

virtualenv primer_proyecto

Ahora cada vez que desees trabajar en el proyecto debes entrar a la carpeta y iniciar el entorno virtual.

source /bin/activate

En windows

\Scripts\activate

Nota: Recuerda estar dentro de la carpeta del proyecto para ejecutar este comando.

Una vez iniciado nuestro entorno virtual podemos instalar las dependencias que necesitemos localmente sin necesidad de instalarlas en el sistema operativo.

Jupyter

Una vez iniciado nuestro entorno virtual debemos instalar Jupyter.

pip install jupyter

Una vez finalice la instalación iniciamos nuestro notebook

jupyter notebook

Se abrirá una ventana en nuestro navegador con nuestro notebook

Jupyter Dashboard

Jupyter trae una interfaz bastante sencilla, en ella encontramos tres pestañas
  • Files: archivos del proyecto
  • Running: procesos que se encuentran corriendo
  • Cluster: administrador de los procesos en paralelo

También encontramos dos botones:

  • Upload: cargar archivos del computador
  • New: crear nuevo archivo de texto, folder, terminal o notebook, en este ultimo nos lista los lenguajes con los cuales podemos crearlo.

Interfaz

Primero debemos crear nuestro primer notebook, para esto en el botón new, selecciona un notebook con python.

  • Header: Consiste de un menú donde encuentras la opciones de edición y ejecución, este siempre estará fijo
  • Body: Este es nuestro lugar de trabajo, este se compone de celdas las cuales pueden ser de tres tipos.

Markdown: Para crear textos con formato que sirvan como guía en el notebook

Código: Definimos el código que va a ejecutar.

Celdas sin formato: cuando necesitamos incluir texto sin formato.

Nota: en en celdas tipo código para ejecutar podemos usar ctrl + espacio, y si queremos ejecutar y crear una nueva celda shift + espacio.

Usando Jupyter

Crea tu primer función en Jupyter y comparte tu resultado.

Tips

  • Desde Jupyter podemos ejecutar comandos de consola usando el !
  • Usando la tecla tab podemos usar la función de auto completar

![](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAABJwAAAGrCAMAAACyt31cAAAC8VBMVEXu7u7////4+Pj29vbt7e3r6+vPz8/p6end3d3s7Ozo6Ojj4+Pl5eXg4ODn5+fx8fFmu2odkM3MzMyrq6vm5ubi4uIAAAA6OjzX19czMzPq6urBwcHT09Pk5OTb29v8+/ve3t7Dw8Ozs7MaGhq9vb24uLjR0dF3d3fKyspPT0/9/PwvLy+/v78HBwdra2tnZ2d/f3+Hh4ff39+np6eYmJhDQ0T+/v4LCwtiYmKVlZabm5sXFxe1tbUmJib19fXLy8tbW1sAgAAPDw+7u7tvb2/GxsYeHh5XV1fIyMgwP58TExOdnZ4EBASjo6M/Pz88PD2Tk5M2NjZ7e3tfX19HR0dBQULZ2dkpKSkhISGvr6+EhIWKiopsbGzz9PPOzs63t7egoKCBgYHY2NhRUVHV1dWtra1LS0srKyuIiIiPj49ycnLzdiZTU1Pw8PDW1taDg4NJSUn6+vrFxcWhoaH09PQ6d6elpaVlZWWxsbE+fK3/2kuRkZH/4F7S0tL/5Gf/53J4eHj/3lX/1j+MjIx8fHxzfb42caCXns9CgLJfa7WysrJVVVU6nDowmdExa5p0dHTQ0NFTU1Tv8fhAodRps2nj7vXAwMAJhAn09/nb3+6CwIOGj8eZmZpkZGTv9O6Zy+ZYrdlGhbY9S6XR5vH/76R6eno1RKH/6IN5eXnH4O6IxONksttWVlYZjBny9Pnp6vXY2+25vt+qsNh0uHXa6vMjk876vZbq8Pbk5vNYkLxJibu83O222ezN0eijzuf4pnH+9vHG2OZ8vuCco9GSkpJUVFRKptbD38N5v3yu1ep0ut+Yts5jmMK42bj/77SKwor3mV1Io0i1ytusvNlHpNWErs9CUKf/65NerV72jUouly7l7uX/9N784dP/9MV+h8Ov1K/5sIH//OzBxePf7N9PqNdwnsL71r1pdLn6zrFsuW/0gTdNWq1KV6vQ59D83cqMlMpbZ7Oby5v37OzX6NdWYrH5qan6kpL/AADY6NjI6MpSg+wRAAAww0lEQVR42uzc3U+TVwDHcX7FCQiMZOBzRJkdFgRaa3lrKUJZU0oxfaGUFlqkMpiBTl42HAynTIbDGDOTobswWTKXmJngEi4XFrwYmOjFMrMQDTEmc4m7cDFe7F/YOc8LtLysZWk2487nxlKe5zw9F35znsMDKeA4jnsJ8ThxHPdS4nHiOO6lxOPEcdxLaes4lVbtQhL1TRnBcdz/0w8/rtxfuHF74f7P3yNRW8dpwP41kogQAo7j/pe+Xbh9+8aNS5fOnPnozAMkJCZO5w6BejK/uLg4/yfQZW9EXDxOHMfFtXL7u++kNlFfIhExcZppTsfzx4OSx8+1OYiHx4njuATcvw8sSG26ePEOEhETp+7cpcXBNctLiNLhcu0DleNyuZTjXa5uUHniv1e6wuGBngwwfS7XFcg8Llc2O5TGyUVJxdM29ipHM2xslcceBsdxr6KFGysrtE1nWJsuPkBiUrBmaZk16en8/PzT5Rd08RRdp3pCjoHKW1sBuWhu5LeONcwQUaAY1DQhBkgKCDE20EMVeaD2WInIWAwRHSDDypdWHPeqWmD3dPLC6Yt/EqfFweU/1JCo/6BfJRynXgMhp48ZvPSbjQCy6b+ZEE2I5+VevUrfukqlsWAZCZnJzZ2ibxXKcSqfITxOHPeq+u4O85C26Z/F6Y/HTxDtyePnicapnVg7WJT8hAQyAIQJOQJRGSFX1u05NZQRbxGoIi/pV0nfGyHGqsw8cBz3ivl25T61wNwQ2/TFg5uzszd/RRwxcZpfQiztfKJxImUZYDL6CakG0EiXSWCuEDKHdXHyEOIB5Nu/Yrlg3m5srkQohKhcOIT1CoWTkARqsJFVSAXHcf+hn26vPkQgrZtonB59Sv2OOKLjpMV62oTj1AlJp1Ql1Qgh3fJdnWd9nOaIUbW6IVUO6iohvdhunBw9wFv2a0CPg8eJ415OP2xsE4vT5OTkI8STgjgSi1OaMhx9zYZslQ+nd3BpsXFih09B0kCIVY5T4XbjlCn0QGLmceK4l9SPSpvOyG2i7szSNn0yaUIcSYoTFGWEFEhb4kaVeFc3g3VxOkqiXZXjlJlYnGrM+0hN3VweKgSqid3W6emLgBSnNIPGXWdNZ9k77NTr+nicOO6/tbLWpo/kNl38hrXpk/O/I45kx8kg38+FCSkW7+qK1sepftM45SUWJ5vOV/RmlTuAtLtC784GFqeDQc3OdDFOwyFn6z6Xw0nHahbCRZ5gZC1OtnewUdUOiHaW2fSWY2oYBrCRv+3v36zFqt3tTlAnQ7b8a/GHqcW2FOkasC0lZqyhU0vQAZ8KHJckzza26cGjyU9om87/hjiSHSfamfchbYnbgTIyotokTlPdqwq2GSd3OoCAW40DQo+8IZ4v39bRI1gJDwoD2C2UAcjSx4mTZT+Yt2sGKlWFEf824jR8HLIsDRTvWtpYnPoc+021tlNbnRFzYuJyNAX4V+IEwww4LknoA07Sb9Q9+1nycNfNSZam82d/QRxJjpPKy/ac5C3xtG5CJrA+TqU0TlizzThFQF0XdmwWp3xnKhOKoEqoBuXdEKf97Q5N2ISmfEvIrh4SQlWg2q3itzwwHD5RF7oGuCIW0g3sy6/LP8ritCNYu19/tz0Y1iK732IxjLE3zTOXieVag8Ntecs+BGb3rkIWpzcKgRQhE5TZfiLiayqLGBvYGaHWQD7JQnM50BkRT8w6YQneUssfB0xXyEGvCVcoWNLeo1yN6W0G6g4B9sPylZE2Egr175KnVOzUAq0ETT6Lbpz2Vhfqv24GJc1Cnpoy/m59jzFoNaFUFyob8EM1YLFcfk0Z8E3b6+C45FiQNsPv7/3tpoQum6Q2nb2JOKLitIT1ljbGSbv2fGVvVJyyIflQulGTtsQ7JwhJ3xCnHLYd9Y/jZARlEF7bLE51gsSGCaETVPOGOAVm8FpdH4gLqf6damE/qFPuYkgMmndR4sU+2370aVQptkaMatT+tlTSi0rhPRynLfNOQdXSxlJjcOzFe140aoArTZDQOImOt/lMoAyWHFO+rsEUGWdnWPrVCFyQ4ySe2G43jflq5Y8DqsmWh14dMt2l+FrvUa7GBDuVOClXvmWFqWJUnpK2rhEg1SnOPqTbChA8iUqnGZQ8C2lqyviv09nkOItMwS4ctJnRS44jPKcMiPZqcFxyPBPbdOmb2U9F4m7TJyxNZz/bzsrp6dL6Nj3dGCfMKc8N5LVHxakLIq2BkFaIsgmxzxEzFF5CciCyE9KTeJx6hY8BqUg748VJ0yQ6qsRpaEOcUlXAyHuY62/SAnKcdgjnlDiZgWIHwtcBOA7lWgDtXpP/1gk7aJzeBAyGvUIWMKoT43SaHcwaQ8XGySBE9kgvDgPWAeBelxinceCWPypOGWxQV4v8cRjTMHBUj/EIfVnjUa5GDQt7lTgpV661HBhbm5LdQNdDKewzw1qeJaQBVjMoeRbS1JTxX2cDE1eWkAH0mxHxAOlutTwgLvjBccmxIj5E8PPNqDadl9r02a+IIypOT1481yLK8xd/bhKnCkJG0gCkWWmTjkhxoqpAaScIMWZAEibtrGMKeng9RN2EeJX3G+LGaVwoh0inz4kTJ1+NdvWkWlD5G+JUb/T5bBXIadPZBlRynLTuA1EbM7QZ92wOh8NZ1UrA+G0100AlG6qkuUA4RQepo6mRD940Tkgdd2aDMpQA/nKguUKME71OmzUqTgUCvZBGJ38cUDlhny+ix90WgCZDuRrV4TYpcVKujOqWmhOZypTedmqn76FVT0esO3xOUAMDZmkFGzU1eXwap+MAOXJOMAFhM5x19CxbpjwgWgPguOR4KG6G35mNXTaxNp3d1qME84OP55Wa/Tr/ePApNolTh5eQwLSrop3Yo7ahvMSQW+/x01efQ9ZIxN/5VVTQryZcLvmOj1hd9fWdE9byuHEac9rEhEwLVsTG6YgSJ83qhriHhcFcjHShH8AeYX2cMtwfA4EKUNm6WjlOGCkDtdt8Sv4fbA+DyQ0BpoJT/ssFtrdpnLIB8+HXhEygR/e3cWo8CiDo2TJObNKjYpxShAxQ8scBNdByHE16abVk8yhXU+KkKQLMq3GicqyX