Funciones de activación

Clase 8 de 29 • Curso de Fundamentos de Redes Neuronales con Python y Keras

Resumen

¿Qué son las funciones de activación y por qué son importantes?

Las funciones de activación son esenciales en la arquitectura de redes neuronales, un componente fundamental del aprendizaje profundo (deep learning). Su función principal es introducir no linealidad en el modelo, permitiendo así que la red aprenda de datos complejos. Al emplear funciones de activación, evitamos simplemente apilar sumas consecutivas que podrían resultar en una simple línea, lo cual no es útil para detectar patrones complejos en los datos.

Los tipos de funciones de activación se dividen principalmente en dos categorías:

Funciones de activación discretas: Trabajan con valores definidos como 0 o 1, o números enteros como 0, 1, 2, 3, etc. No manejan decimales o valores intermedios. Un ejemplo clásico es la función escalonada que se utiliza en puertas lógicas.
Funciones de activación continuas: Pueden tomar un espectro amplio de valores, incluyendo decimales, lo que les permite modelar relaciones más complejas. Ejemplos comunes incluyen funciones como la sigmoide y la tangente hiperbólica.

¿Cuáles son algunas de las funciones de activación más conocidas?

Función Escalonada

La función escalonada (o función de umbral) es una de las más simples y clásicas en las redes neuronales. Retorna un valor de 1 si la entrada es mayor o igual a cero, y 0 en caso contrario. Es bastante útil para problemas binarios donde solo hay dos posibles salidas.

Implementación en Python:

def funcion_escalonada(x):
    return np.where(x >= 0, 1, 0)

Función Signo

La función signo es similar a la escalonada, pero permite un rango de -1 a 1, lo cual es útil para manejar datos negativos. Se ajusta la salida para reflejar tanto el lado positivo como el negativo del eje de entrada.

Función Sigmoidal

La función sigmoidal es continua, transformando cualquier valor de entrada en un rango entre 0 y 1, lo que la hace ideal para problemas de probabilidad. Aunque presenta limitaciones como la saturación en valores extremos, su capacidad para ser derivada la hace valiosa en algoritmos de retropropagación.

Implementación en Python:

def funcion_sigmoidal(x):
    return 1 / (1 + np.exp(-x))

Función Tangente Hiperbólica

Similar a la sigmoide, pero mapea la entrada al rango de -1 a 1, lo que resulta en una claridad mejorada para los valores negativos. Es fuerte en el manejo de problemas donde la salida negativa es relevante.

ReLU (Rectified Linear Unit)

ReLU es una función no lineal que retorna 0 para cualquier entrada negativa, pero la misma entrada para valores positivos. Debido a su simplicidad y eficacia al gestionar valores no lineales, es la más utilizada en capas ocultas dentro de redes neuronales profundas.

Implementación en Python:

def relu(x):
    return np.maximum(0, x)

¿Cómo pasar una función de activación a Python?

El proceso para transladar una función de activación a Python generalmente involucra:

Definición Matemática: Comprender la fórmula subyacente de la función.
Uso de Librerías: Utilizar bibliotecas como NumPy para manejar operaciones matemáticas complejas y Matplotlib para visualizar estas funciones.
Implementación: Codificar la función usando Python.

Por ejemplo, al trasladar una función sigmoidal a Python, primero entenderemos su fórmula matemática, luego utilizaremos np.exp() para calcular el exponente del término y finalmente usaremos plt.plot() para visualizar los resultados.

Experimenta implementando estas funciones en Python utilizando plataformas como Wolfram Alpha para obtener fórmulas exactas, y comparte tus resultados en la comunidad para fomentar el aprendizaje colaborativo. Aprende más, explora y sigue desarrollando tus habilidades en machine learning. ¡Tu esfuerzo y dedicación son los pasos hacia el éxito!

Miguel Angel Toledo Santiago

student•

Estas son mis respuestas :D

# relu
def relu(x):
  return np.piecewise(x, [x < 0, x > 0], [0, lambda x: x])

# para tanh use la funcion tanh que trae numpy :')
np.tanh(x)

Elvis Daniel Raymondi Taipe

student•

muy buen aporte :D

Team Jacidi

student•

¿por que se usa la funcion lambda? ya que estuve probando y fue la unica forma de que funcione

Cesar Augusto Morales Godoy

student•

ReLu function

def relu(a):
  return np.maximum(0, x)

plt.plot(x, relu(x))

Tanh function* tanh(x)

def tanh(a):
  return np.tanh(a)

plt.plot(x, tanh(x))

Softmax function

def softmax(a):
  expo = np.exp(x)
  expo_sum = np.sum(np.exp(x))
  return expo/expo_sum

plt.plot(x, softmax(x))

Edher Iván Díaz Salazar

student•

Me sorprendió esa manera de representar la ReLu no se me habría ocurrido

Angel Vega

student•

Curioso que numpy lea la a argumentada sin que este implementada en el bloque de código

Alfonso Morán

student•

Existen diferentes funciones de activación que pueden ser discretas o continuas:

Escalón
Signo
Sigmoid
Tanh
ReLU
Softmax

Josue Farley Lopez Carvajal

student•

Cordial saludo. Solución a las funciones de activación:

Catalina Urdaneta Bernal

student•

la funcion de softmax tiene un error de definicion en el return

FELIX DAVID CORDOVA GARCIA

student•

En la formula de la función tangente hiperbólica /tan h hay un error, están poniendo la misma fórmula de la función sigmoidal ,la correcta fórmula y su derivada es la siguiente:

Camilo Andrés Hurtado Erasso

student•

Pensaba que nadie lo había notado.

Los videos tienen algunas imprecisiones técnicas que, a un nivel superficial no son graves, pero que si alguien quiere entender con fino detalle todos los conceptos, pueden confundirle.

John Robert Gomez Pachon

student•

Si lo noté, lo triste es que no es el primero curso en que veo mal las formulas.

Uriel Torres

student•

Hola comparto mis funciones:

<code> 
# definicion de la funcion sigmoide
sigmoid = lambda x: 1 / (1+np.exp(-x))

step = lambda x: np.piecewise(x, [x<0.0, x>0.0], [0,1])

relu = lambda x: np.piecewise(x, [x<0, x>0], [0, lambda x:x])

tanh = lambda x: ( np.exp(x) - np.exp(-x) ) / (np.exp(-x) + np.exp(x))

softmax = lambda x: np.exp(x) / np.sum(np.exp(x))

Joaquin Rohland

student•

Hola a todos, dejo mi respuestas :3

def relu(x):  
    return np.piecewise(x,[x<0.0,x>=0.0],[0,lambda x: x])

def tanh(x):
    #solo aplique la igualdad de tanh  
    n=np.exp(x)-np.exp(-x)
    d=np.exp(x)+np.exp(-x)
    return n/d

Joaquin Rohland

student•

pd: aca esta la igualdad https://es.wikipedia.org/wiki/Tangente_hiperb%C3%B3lica

Juan José Londoño David

student•

Maria Virginia Gómez Sandoval

student•

Nelson Aranda

student•

Mis respuestas al desafio

def relu(x):
    return np.maximum(0,x)
def tanh(x):
    return np.tanh(x)

Camilo Andrés Hurtado Erasso

student•

La función ReLU en 4:12 tiene un pequeño error en el signo de comparación: es z >= 0, no <=

Oscar Real

student•

Les dejo mi función relu resuelto un poco diferente pero sencillo:

def relu(x):
  return [0 if k<0 else k for k in x]

Gabriel Ichcanziho Pérez Landa

student•

NO es conveniente utilizar FOR para básicamente NADA en deep learning en cambio utilizar numpy es mucho mejor porque te aprovechas de la vectorización el cuál de forma muy "simple de explicar" permite hacer los calculos en forma paralela.

Imagina que tuvieras un vector X de 1 Millon de casos, para tu código tendrías que repetir 1 Millon de veces tu lógica en cambio si usas numpy, vectorizas el problema:

def relu(x): return np.maximum(0, x)

Y en lugar de ejecutar 1 Millon de veces tu solución lo haces 1 vez :D

Team Jacidi

student•

Mi funcion tangente

def tanh(x):
  return (np.exp(x)- np.exp(-x))/(np.exp(-x)+np.exp(x))

Santiago Ahumada Lozano

student•

Hola ¿Existe una manera sencilla de visualizar softmax?

Alarcon7a

student•

Puedes pensar en softmax como una distribución probabilística

Santiago Ahumada Lozano

student•

Discreta ¿Verdad? Hay alguna distribución que se asemeje? Como la Gaussiana o la Geométrica por ejemplos? Gracias:)

Jhonntan Andres Castaño Rojas

student•


def relu(x):    return np.piecewise(x, \[x < 0.0, x >= 0.0], \[0, lambda x: x])



plt.plot(x,relu(x))

Juan Robayo

student•

aca un aporte de como entrega las funciones con chatGPT

def sigmoid(x):
  return 1 / (1+np.exp(-x))

def step(x):
    return np.heaviside(x, 1)

def relu(x):
    return np.maximum(0,x)

def tanh(x):
    return np.tanh(x)

fig, axs = plt.subplots(2, 2, figsize=(8, 8))
axs[0, 0].plot(x, sigmoid(x))
axs[0, 0].set_title('Sigmoid')
axs[0, 1].plot(x, tanh(x))
axs[0, 1].set_title('Tanh')
axs[1, 0].plot(x, step(x))
axs[1, 0].set_title('Step')
axs[1, 1].plot(x, relu(x))
axs[1, 1].set_title('ReLU')
plt.show()

Francisco González Ortiz

student•

Aline Danae Campos Galleguillos

student•

Dos grupos Discretas y continuas

Escalonada 0...1 Signum-1...1

Sigmoidal...derivadas Tangente hiperbolica

Relu Softmax....probabilidades

Pepe Sosa

student•

Hola, hay una forma de poner en el Colab las fórmulas usando LaTeX, por ejemplo la sigmoide, coloca en el cuadro de texto la siguiente línea:

$\frac{1}{1 + exp(-x)}$

Lo que te dará como resultado (lo que está abajo de la función python):

Espero le sirva a alguien

Angel Reyes

student•

Aquí dejo mis aportes de código de todas las funciones vistas en clase, espero os sirva :)

import numpy as np
import matplotlib.pyplot as plt

threshold = lambda z: np.piecewise(z, [z < 0, z >= 0], [0, 1])

signum = lambda z: np.piecewise(z, [z < 0, z >= 0], [-1, 1])

sigmoid = lambda z: 1 / (1 + np.exp(-z))

tanh = lambda z: (np.exp(z) - np.exp(-z)) / (np.exp(z) + np.exp(-z))

relu = lambda z: np.maximum(0,z)

softmax = lambda z: np.exp(z) / np.sum(np.exp(z))

xx = np.linspace(-20,20,201)

plt.plot(xx,threshold(xx))

plt.plot(xx,signum(xx))

plt.plot(xx,sigmoid(xx))

plt.plot(xx,tanh(xx))

plt.plot(xx,relu(xx))

plt.plot(xx,softmax(xx))