¿Cómo crear funciones reutilizables en Google Colab?
A medida que te adentras en el mundo de la programación y procesamiento de textos, emplear librerías como NLTK, Matplotlib y otras es fundamental para obtener distintas perspectivas a la hora de analizar textos. Sin embargo, al trabajar en Google Colab, escribir código celda por celda puede parecer desordenado. Así que, ¡es tiempo de ordenar el caos! Aprende a definir funciones que podrás reutilizar en distintos proyectos, ¡haciendo tu código más limpio y eficiente!
¿Por qué compartimentar el código?
Trabajar en un entorno como Google Colab a menudo lleva a perder la noción de mantener un código organizado. Esto es normal, pero no debe convertirse en un hábito. Utilizar funciones para compartimentar el código es clave para:
- Facilitar la reutilización del código en diferentes proyectos.
- Ahorrar espacio y mantener tu notebook más ordenado.
- Potenciar buenas prácticas de programación.
¿Cómo crear y utilizar funciones en Python?
La simplicidad es clave cuando defines tus propias funciones. Vamos a ilustrar esto con un ejemplo práctico:
Implementar la función get_text
Esta función realizará un procesamiento de texto a partir de un archivo almacenado en Google Drive usando expresiones regulares.
import re
def get_text(file):
with open(file, 'r') as f:
text = f.read()
text = re.sub(r'pattern1', '', text)
text = re.sub(r'pattern2', '', text)
return text
Con esta función, puedes leer un archivo, procesar su contenido y obtener un texto más limpio, todo en unas pocas líneas de código.
¿Cómo trasladar funciones a archivos externos?
¿Tienes varias funciones y no quieres llenar todo tu notebook? ¡Llévalas a un archivo Python externo! Utiliza las "magias" de Python para crear un archivo directamente en Google Colab:
!touch /ruta/a/tu/directorio/mifuncion.py
Luego, copia y pega tu función en ese nuevo archivo. Esto te permitirá importar y usar tu función como si fuera una librería:
import sys
sys.path.append('/ruta/a/tu/directorio')
import mifuncion
mifuncion.get_text('/ruta/al/archivo.txt')
¿Cómo crear la función freckWords
?
Apliquemos estas habilidades en un ejercicio práctico creando una función que retorne las palabras más comunes de un texto almacenado en una URL:
from nltk import FreqDist
from bs4 import BeautifulSoup
import requests
def freckWords(url, n):
response = requests.get(url)
raw = response.text
soup = BeautifulSoup(raw, 'html.parser')
text = soup.get_text()
tokens = text.split()
fd = FreqDist(tokens)
return fd.most_common(n)
Implementa esta función en un archivo externo, y luego impórtalo en tu notebook para disfrutar de un código organizado y eficiente.
Conclusión
Crear funciones reutilizables y organizadas es una parte esencial en el desarrollo de un código limpio y eficiente. No solo ayuda a mantener estructura, sino que también maximiza tu productividad al simplificar el manejo del código. Con práctica, estas habilidades transformarán tu forma de programar en un entorno colaborativo como Google Colab. ¡Continúa explorando y mejorando, tus proyectos te lo agradecerán!
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?