Extracción de datos específicos con Beautiful Soup en Python

Cursos Empresas Blog Live Conf Precios

Contenido del curso

Fundamentos y Primer Scraper Estático

Web Estático Avanzado

Scraping Dinámico con Selenium

Scraping Dinámico con Playwright

Tomar examen

Extracción de datos específicos con Beautiful Soup en Python

Resumen

¿Alguna vez has querido extraer fácilmente datos específicos de un sitio web? Aprenderás cómo hacerlo usando Beautiful Soup en Python. Podrás obtener información esencial como títulos, precios e imágenes desde páginas web estructuradas rápidamente y guardarlas en formato CSV.

¿Cómo identificar elementos específicos en una página web?

Antes de extraer información con Python, necesitas identificar la estructura HTML donde se encuentra la información clave. Utilizando herramientas de desarrollo del navegador, puedes explorar las etiquetas HTML y clases de los elementos para encontrar exactamente las partes importantes del contenido.

Por ejemplo, en este proyecto se identifica que cada libro del sitio web está encerrado en un elemento llamado artículo: etiqueta article con clase product-pot. Dentro de cada artículo hay detalles como título, imagen, precio y otros.

¿Cómo extraer nombres, precios e imágenes con Beautiful Soup?

Primero obtendrás todos los artículos de productos usando Beautiful Soup con la función select:

products = soup.select('.product-pot')

Luego recorres cada artículo para extraer información concreta:

Para el título: localizarás la etiqueta h3 dentro del artículo, luego la etiqueta a contenida en ella.

nombre = producto.find('h3').find('a')['title']

Para el precio: buscas la etiqueta p que tenga la clase price_color y obtienes el texto de dicha etiqueta.

precio = producto.find('p', class_='price_color').get_text()

Para la imagen: necesitas primero localizar el div con clase image_container, encontrar la etiqueta img y extraer su atributo src.

imagen = producto.find('div', class_='image_container').find('img')['src']

Sin embargo, este atributo es una URL relativa, así que debes añadir la base del URL para obtener la dirección completa:

imagen_url = 'http://BooksToScrape.com/' + imagen

¿Cómo guardar los datos obtenidos en un archivo CSV?

Para guardar los datos recolectados de forma sistemática en CSV, defines una ruta y creas columnas específicas para cada información extraída:

with open("resultados/productos.csv", "w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(['nombre', 'precio', 'imagen_url'])
    writer.writerows(productos)

Esto generará un archivo CSV dentro de la carpeta resultados, estructurado por columnas que contienen cada aspecto esencial del producto que seleccionaste previamente.

¡Te invito a participar en el desafío propuesto: intenta obtener también el número de estrellas de cada libro y si está en stock! Deja tu solución en los comentarios.

Comentarios

Irmin Corona 🐯

Estudiante

# List to store the information
product_list = []

for product in products:
    # Book name
    nombre = product.find("h3").find("a")["title"]
    
    # Price
    precio = product.find("p", class_="price_color").get_text()
    
    # Image
    imagen = product.find("div", class_="image_container").find("img")["src"]
    imagen_url = "http://books.toscrape.com/" + imagen

    # Estrellas
    estrellas =  product.find("p", class_="star-rating")["class"][1]

    # Stock
    stock = product.find("p", class_="instock availability").get_text(strip=True)


    product_list.append({
        "name": nombre,
        "price": precio,
        "image_url": imagen_url,
        "stars": estrellas,
        "stock": stock
    })

# Display first 3 products as preview
print("First 5 products:")
for i, product in enumerate(product_list[:3], 1):
    print(f"\n{i}. {product['name']}")
    print(f"   Price: {product['price']}")
    print(f"   Image: {product['image_url']}")
    print(f"   Stars: {product['stars']}")
    print(f"   Stock: {product['stock']}")

Neicer Vásquez

Estudiante

Aquí dejo mi solución de scraping incluyendo la parte de extraer las estrellas del libro, su disponibilidad en stock y el guardado de los datos en un archivo de csv.

Fabian Mauricio López Guasca

Estudiante

Waooo que código tan limpio... soy novato en esto de programar, así que espero llegar a este nivel!

Neicer Vásquez

Estudiante

Gracias por lo del código limpio @Fabian Mauricio Lópes Guasca.

Yo también soy novato aun, solo he aprendido poco a poco las bases del buen código. Sé que lograras aprender mucho más. Nunca pares de aprender.

Juan Diego

Estudiante

En el contexto de Beautiful Soup, el uso de class_="product_pod" es una forma de referirse a los atributos de un elemento HTML. Sin embargo, al utilizar el método select(), se emplea la notación de CSS, donde el punto . indica una clase. Por eso, select(".product_pod") significa "selecciona todos los elementos con la clase product_pod". La primera forma es más directa al buscar atributos, mientras que la segunda es más flexible y potente al utilizar selectores CSS.

Jhonntan Andres Castaño Rojas

Estudiante

que curso tan bueno que docente tan bueno

Felipe Moreno

Estudiante

Al usar .text en BeautifulSoup, este obtiene todo el contenido dentro de la etiqueta, incluidos los espacios, saltos de línea y otros caracteres de formato.

Para eliminar esos espacios y saltos de línea innecesarios, puedes utilizar .strip(), que elimina los espacios en blanco y saltos de línea al principio y al final del texto extraído.

Juan Salazar Saenz

Estudiante

Se salto un pedazo al momento de guardar en el excel.. como es la creacion del pandas creo .. para luego ser guardado en el excel

Andres Felipe Ramos Torres

Estudiante

product_list = []

for product in products:
    #nombre del libro
    name = product.find("h3").find("a")["title"]
    print(name)
    #precio
    precio = product.find("p", class_="price_color").get_text()
    print(precio)
    #imagen
    imagen = product.find("div", class_="image_container").find("img")["src"]
    imagen_url = url + imagen
    print(imagen_url)
    #estrellas
    estrellas = product.find("p", class_="star-rating").get("class")[1]
    print(estrellas)
    #stock
    stock = product.find("p", class_="instock availability").get_text(strip = True) 
    print(stock)
    pass

    product_list.append({"Nombre": name, "Precio": precio, "Imagen_url": imagen_url, "Estrellas": estrellas, "Stock": stock})

Juan Felipe Avellaneda Tamayo

Estudiante

Por aquí mi solución al scraping incluyendo el rating y disponibilidad del artículo:

# List of products to store the extracted information
homework_products_list = []

# Loop through the products and extract the title, price, and picture URL
for product in products:
    
    # Title is found in the "h3" tag, and the actual title text is in the "title" attribute of the "a" tag inside the "h3" tag
    title = product.find("h3").find("a")["title"]
    
    # Price is found in the "p" tag with the class "price_color", and we use the get_text() method to extract the text content, stripping any extra whitespace
    price = product.find("p", class_="price_color").get_text(strip=True)
    
    # Picture URL is found in the "div" tag with the class "image_container", and the actual URL is in the "src" attribute of the "img" tag inside that "div" tag
    # Picture URLs on the website are relative, so we need to concatenate the base URL with the relative URL to get the full URL of the picture
    picture = product.find("div", class_="image_container").find("img")["src"]
    picture_url = url + picture
    
    # Calification is found in the "p" tag with the class "star-rating", and the actual calification is in the second class of that "p" tag 
    # the first class is "star-rating" and the second class is the calification (e.g., "One", "Two", "Three", "Four", "Five")
    calification = product.find("p", class_="star-rating")["class"][1]
    
    # Stock is found in the "p" tag with the class "instock availability", and we use the get_text() method to extract the text content
    # stripping any extra whitespace
    stock = product.find("p", class_="instock availability").get_text(strip=True)

    # Append the extracted information as a dictionary to the products_list
    homework_products_list.append({
        "title": title,
        "price": price,
        "picture_url": picture_url,
        "calification": calification,
        "stock": stock
    })

homework_path_csv = "results/homework_book_store_products.csv"

with open(homework_path_csv, "w", newline="", encoding="utf-8") as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=["title", "price", "picture_url", "calification", "stock"])
    writer.writeheader() # Write the header row to the CSV file
    writer.writerows(homework_products_list) # Write the rows of product information to the CSV file

print(f"Data has been successfully written to {homework_path_csv}\nTotal products extracted: {len(homework_products_list)}")

Jaime Gareca

Estudiante

Aqui dejo mi código con el agregado del rating de estrellas y el stock

from bs4 import BeautifulSoup
import requests
import csv

url = "https://books.toscrape.com"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

products = soup.select("article.product_pod")

product_list = []

for product in products:
    book_title = product.find("h3").find("a")["title"]
    #print(book_title)
    price = product.find("p", class_="price_color").get_text()
    #print(price)
    image = product.find("div", class_="image_container").find("img")["src"]
    image_url = "https://books.toscrape.com/" + image
    #print(image_url)
    rating = product.find("p", class_="star-rating")["class"][1]
    #print(rating)
    stock = product.find("p", class_="instock").get_text(strip=True)
    #print(stock)
    product_list.append({"name":book_title, "price":price, "image_url":image_url, "rating":rating, "stock":stock})
    
    pass

path_csv = "results/products.csv"

with open(path_csv, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["name","price","rating","stock","image_url"])
    writer.writeheader()
    writer.writerows(product_list)

print(f"Complete Extraction: {len(product_list)} products saved in .csv")

Oswaldo Yagual

Estudiante

Sebastian Echeverry Gomez

Estudiante

Hola, aqui dejo la solución para adicionar número de estrellas y el stock:

Wilfer Echavarria

Estudiante

# Lista para almacenar la información

product_list = []

for product in products:

# Nombre del libro

nombre = product.find("h3").find("a")["title"]

#print(nombre)

# Precio

precio = product.find("p", class_="price_color").get_text()

#print(precio)

# Imagen

imagen = product.find("div", class_="image_container").find("img")["src"]

imagen_url = "http://books.toscrape.com/" + imagen

#estrellas

estrellas = product.find("p",class_="star-rating")["class"][1]

#print(estrellas)

#Stock

stock = product.find("p",class_="instock availability").get_text(strip=True)

#print(stock)

product_list.append(

{

"nombre": nombre,

"precio": precio,

"imagen_url": imagen_url,

"estrellas": estrellas,

"stock": stock

}

)

Danny Alejandro fernandez gallego

Estudiante

Aquí no dejo una solución al reto, más bien dejo un scrap que acabo de realizar a una empresa que vende de todo aquí en Colombia, buscando precios para el Celular S24:

productos = soup.select('div.grid-pod')

diccionario = {
    'emprea':['Fallabela'] * len(productos),
    'foto': [],
    'titulo': [],
    'marca':[],
    'distribuidor': [],
    'descuento': [],
    'precio_descuento': [],
    'precio_anterior':[]
}

for producto_all in productos:
    
    # versión limpia
    foto_tag = producto_all.find('img')
    price_tag = producto_all.find('span')
    
    
    foto = foto_tag['src'] if foto_tag and foto_tag.has_attr('src') else ''
    titulo = producto_all.find('div', class_='pod-details-4_GRID').find('b', class_="subTitle-rebrand").text
    marca = producto_all.find('div', class_='pod-details-4_GRID').find('b').text
    distribuidor = producto_all.find('div', class_='pod-details-4_GRID').find('span').find('b').text
    descuento = price_tag['data-discount-percentage'] if price_tag and price_tag.has_attr('data-discount-percentage') else '0%'
    
    # Verificar si hay descuento
    precio_descuento = producto_all.find('div',class_='pod-summary-4_GRID').find('ol').find('li').find('span').text
    precio_anterior = price_tag['crossed line-height-17'] if price_tag and price_tag.has_attr('crossed line-height-17') else None
    
    #Guardar los datos en el diccionario
    diccionario['foto'].append(foto if foto else 'none')
    diccionario['titulo'].append(titulo)
    diccionario['marca'].append(marca.strip() if marca else 'none')
    diccionario['distribuidor'].append(distribuidor.strip() if distribuidor else 'none')
    diccionario['descuento'].append(descuento.strip() if precio_descuento else 'none')
    diccionario['precio_descuento'].append(precio_descuento.strip() if precio_descuento else 'none')
    diccionario['precio_anterior'].append(precio_anterior.strip() if precio_anterior else 'none')


print(diccionario)

# Guardar los datos en un archivo CSV
pd.DataFrame.from_dict(diccionario).to_csv('resultados/celulares_s24_fallabela.csv', index=False)

# Contar el numero de productos extraidos
print(f'Se extrajron {len(diccionario)} productos.')

Juan Diego

Estudiante

    #estrellas
    estrellas = product.find('p', class_='star-rating Five')
    if estrellas == None:
        estrellas = product.find('p', class_='star-rating Four')
        if estrellas == None:
            estrellas = product.find('p', class_='star-rating Three')
            if estrellas == None:
                estrellas = product.find('p', class_='star-rating Two')
                if estrellas == None:
                    estrellas = '1'
                else:
                    estrellas ='2'
            else:
                estrellas = '2'
        else:
            estrellas = '3'
    else:
        estrellas = '5'
    estrellas = estrellas + ' estrellas'


    #EN stock
    stock = product.find('p', class_='instock availability').get_text(strip=True)
    
    product_list.append(
        {
            "nombre": nombre,
            "precio": precio,
            "imagen_url": imagen_url,
            "Estrellas": estrellas,
            "Disponibilidad": stock
            }
    )
```    #estrellas    estrellas = product.find('p', class\_='star-rating Five')    if estrellas == None:        estrellas = product.find('p', class\_='star-rating Four')        if estrellas == None:            estrellas = product.find('p', class\_='star-rating Three')            if estrellas == None:                estrellas = product.find('p', class\_='star-rating Two')                if estrellas == None:                    estrellas = '1'                else:                    estrellas ='2'            else:                estrellas = '2'        else:            estrellas = '3'    else:        estrellas = '5'    estrellas = estrellas + ' estrellas'

    #EN stock    stock = product.find('p', class\_='instock availability').get\_text(strip=True)        product\_list.append(        {            "nombre": nombre,            "precio": precio,            "imagen\_url": imagen\_url,            "Estrellas": estrellas,            "Disponibilidad": stock            }    )

Luis Orna

Estudiante

Mi solucion

David Rosas

Estudiante

Para Google Colab...

Hay que Montar primero el Drive:

Una celda antes incluimos esto...


drive.mount('/content/drive')

from google.colab import drive

En la parte de las carpetas a la izquierda hay que entrar a esa direccion y agregamos la carpeta de resultados dentro de MyDrive... y nuestro path quedaria asi:


path\_csv = "/content/drive/MyDrive/resultados/productos.csv"

Asi, tendremos nuestro archivo productos.csv en nuestra propia carpeta de Google Drive

Isaac Bryan Ascanoa Roncall

Estudiante

Aqui esta mi reto del profesor:

Martin Freire

Estudiante

import requests

from bs4 import BeautifulSoup

import csv

url="https://books.toscrape.com/"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

products = soup.select("article.product_pod")

#lista de productos

product_list = []

for product in products:

item = []

#guardo nombre del libro:

nombre = product.find('h3').find('a')["title"] #puedo acceder a clases dentro de la etiqueta como si fueran elementos de una lista

item.append(nombre)

#precio

precio = product.find("div", class_="product_price").find("p",class_="price_color").get_text()

item.append(precio[1:])

#Estrellas

text = 'star-rating ' #asi se llaman las classes de los divs de las estrellas

stars = ['None','One','Two','Three','Four','Five']

for star in stars:

if(product.find("p", class_=text+star)!=None):

item.append(stars.index(star))

else:

#availability

if(product.find("i", class_='icon-ok')!=None):

item.append('In Stock')

else:

item.append('Out of Stock')

print(item)

Martin Freire

Estudiante

import requests

from bs4 import BeautifulSoup

import csv

url="https://books.toscrape.com/"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

products = soup.select("article.product_pod")

#lista de productos

product_list = []

for product in products:

item = []

#guardo nombre del libro:

nombre = product.find('h3').find('a')["title"] #puedo acceder a clases dentro de la etiqueta como si fueran elementos de una lista

item.append(nombre)

#precio

precio = product.find("div", class_="product_price").find("p",class_="price_color").get_text()

item.append(precio[1:])

#Estrellas

text = 'star-rating ' #asi se llaman las classes de los divs de las estrellas

stars = ['None','One','Two','Three','Four','Five']

for star in stars:

if(product.find("p", class_=text+star)!=None):

item.append(stars.index(star))

else:

next

#availability

if(product.find("i", class_='icon-ok')!=None):

item.append('In Stock')

else:

item.append('Out of Stock')

print(item)

Os Lorenzana

Estudiante

No alcance a leer si ya estaba, pero yo obtuve el rating asi,

star_rating = products.find("p", class_="star-rating")["class"][1]

# List to store the information
product_list = []

for product in products:
    # Book name
    nombre = product.find("h3").find("a")["title"]
    
    # Price
    precio = product.find("p", class_="price_color").get_text()
    
    # Image
    imagen = product.find("div", class_="image_container").find("img")["src"]
    imagen_url = "http://books.toscrape.com/" + imagen

    # Estrellas
    estrellas =  product.find("p", class_="star-rating")["class"][1]

    # Stock
    stock = product.find("p", class_="instock availability").get_text(strip=True)


    product_list.append({
        "name": nombre,
        "price": precio,
        "image_url": imagen_url,
        "stars": estrellas,
        "stock": stock
    })

# Display first 3 products as preview
print("First 5 products:")
for i, product in enumerate(product_list[:3], 1):
    print(f"\n{i}. {product['name']}")
    print(f"   Price: {product['price']}")
    print(f"   Image: {product['image_url']}")
    print(f"   Stars: {product['stars']}")
    print(f"   Stock: {product['stock']}")

product_list = []

for product in products:
    #nombre del libro
    name = product.find("h3").find("a")["title"]
    print(name)
    #precio
    precio = product.find("p", class_="price_color").get_text()
    print(precio)
    #imagen
    imagen = product.find("div", class_="image_container").find("img")["src"]
    imagen_url = url + imagen
    print(imagen_url)
    #estrellas
    estrellas = product.find("p", class_="star-rating").get("class")[1]
    print(estrellas)
    #stock
    stock = product.find("p", class_="instock availability").get_text(strip = True) 
    print(stock)
    pass

    product_list.append({"Nombre": name, "Precio": precio, "Imagen_url": imagen_url, "Estrellas": estrellas, "Stock": stock})

# List of products to store the extracted information
homework_products_list = []

# Loop through the products and extract the title, price, and picture URL
for product in products:
    
    # Title is found in the "h3" tag, and the actual title text is in the "title" attribute of the "a" tag inside the "h3" tag
    title = product.find("h3").find("a")["title"]
    
    # Price is found in the "p" tag with the class "price_color", and we use the get_text() method to extract the text content, stripping any extra whitespace
    price = product.find("p", class_="price_color").get_text(strip=True)
    
    # Picture URL is found in the "div" tag with the class "image_container", and the actual URL is in the "src" attribute of the "img" tag inside that "div" tag
    # Picture URLs on the website are relative, so we need to concatenate the base URL with the relative URL to get the full URL of the picture
    picture = product.find("div", class_="image_container").find("img")["src"]
    picture_url = url + picture
    
    # Calification is found in the "p" tag with the class "star-rating", and the actual calification is in the second class of that "p" tag 
    # the first class is "star-rating" and the second class is the calification (e.g., "One", "Two", "Three", "Four", "Five")
    calification = product.find("p", class_="star-rating")["class"][1]
    
    # Stock is found in the "p" tag with the class "instock availability", and we use the get_text() method to extract the text content
    # stripping any extra whitespace
    stock = product.find("p", class_="instock availability").get_text(strip=True)

    # Append the extracted information as a dictionary to the products_list
    homework_products_list.append({
        "title": title,
        "price": price,
        "picture_url": picture_url,
        "calification": calification,
        "stock": stock
    })

homework_path_csv = "results/homework_book_store_products.csv"

with open(homework_path_csv, "w", newline="", encoding="utf-8") as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=["title", "price", "picture_url", "calification", "stock"])
    writer.writeheader() # Write the header row to the CSV file
    writer.writerows(homework_products_list) # Write the rows of product information to the CSV file

print(f"Data has been successfully written to {homework_path_csv}\nTotal products extracted: {len(homework_products_list)}")

from bs4 import BeautifulSoup
import requests
import csv

url = "https://books.toscrape.com"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

products = soup.select("article.product_pod")

product_list = []

for product in products:
    book_title = product.find("h3").find("a")["title"]
    #print(book_title)
    price = product.find("p", class_="price_color").get_text()
    #print(price)
    image = product.find("div", class_="image_container").find("img")["src"]
    image_url = "https://books.toscrape.com/" + image
    #print(image_url)
    rating = product.find("p", class_="star-rating")["class"][1]
    #print(rating)
    stock = product.find("p", class_="instock").get_text(strip=True)
    #print(stock)
    product_list.append({"name":book_title, "price":price, "image_url":image_url, "rating":rating, "stock":stock})
    
    pass

path_csv = "results/products.csv"

with open(path_csv, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["name","price","rating","stock","image_url"])
    writer.writeheader()
    writer.writerows(product_list)

print(f"Complete Extraction: {len(product_list)} products saved in .csv")

productos = soup.select('div.grid-pod')

diccionario = {
    'emprea':['Fallabela'] * len(productos),
    'foto': [],
    'titulo': [],
    'marca':[],
    'distribuidor': [],
    'descuento': [],
    'precio_descuento': [],
    'precio_anterior':[]
}

for producto_all in productos:
    
    # versión limpia
    foto_tag = producto_all.find('img')
    price_tag = producto_all.find('span')
    
    
    foto = foto_tag['src'] if foto_tag and foto_tag.has_attr('src') else ''
    titulo = producto_all.find('div', class_='pod-details-4_GRID').find('b', class_="subTitle-rebrand").text
    marca = producto_all.find('div', class_='pod-details-4_GRID').find('b').text
    distribuidor = producto_all.find('div', class_='pod-details-4_GRID').find('span').find('b').text
    descuento = price_tag['data-discount-percentage'] if price_tag and price_tag.has_attr('data-discount-percentage') else '0%'
    
    # Verificar si hay descuento
    precio_descuento = producto_all.find('div',class_='pod-summary-4_GRID').find('ol').find('li').find('span').text
    precio_anterior = price_tag['crossed line-height-17'] if price_tag and price_tag.has_attr('crossed line-height-17') else None
    
    #Guardar los datos en el diccionario
    diccionario['foto'].append(foto if foto else 'none')
    diccionario['titulo'].append(titulo)
    diccionario['marca'].append(marca.strip() if marca else 'none')
    diccionario['distribuidor'].append(distribuidor.strip() if distribuidor else 'none')
    diccionario['descuento'].append(descuento.strip() if precio_descuento else 'none')
    diccionario['precio_descuento'].append(precio_descuento.strip() if precio_descuento else 'none')
    diccionario['precio_anterior'].append(precio_anterior.strip() if precio_anterior else 'none')


print(diccionario)

# Guardar los datos en un archivo CSV
pd.DataFrame.from_dict(diccionario).to_csv('resultados/celulares_s24_fallabela.csv', index=False)

# Contar el numero de productos extraidos
print(f'Se extrajron {len(diccionario)} productos.')

    #estrellas
    estrellas = product.find('p', class_='star-rating Five')
    if estrellas == None:
        estrellas = product.find('p', class_='star-rating Four')
        if estrellas == None:
            estrellas = product.find('p', class_='star-rating Three')
            if estrellas == None:
                estrellas = product.find('p', class_='star-rating Two')
                if estrellas == None:
                    estrellas = '1'
                else:
                    estrellas ='2'
            else:
                estrellas = '2'
        else:
            estrellas = '3'
    else:
        estrellas = '5'
    estrellas = estrellas + ' estrellas'


    #EN stock
    stock = product.find('p', class_='instock availability').get_text(strip=True)
    
    product_list.append(
        {
            "nombre": nombre,
            "precio": precio,
            "imagen_url": imagen_url,
            "Estrellas": estrellas,
            "Disponibilidad": stock
            }
    )
```    #estrellas    estrellas = product.find('p', class\_='star-rating Five')    if estrellas == None:        estrellas = product.find('p', class\_='star-rating Four')        if estrellas == None:            estrellas = product.find('p', class\_='star-rating Three')            if estrellas == None:                estrellas = product.find('p', class\_='star-rating Two')                if estrellas == None:                    estrellas = '1'                else:                    estrellas ='2'            else:                estrellas = '2'        else:            estrellas = '3'    else:        estrellas = '5'    estrellas = estrellas + ' estrellas'

    #EN stock    stock = product.find('p', class\_='instock availability').get\_text(strip=True)        product\_list.append(        {            "nombre": nombre,            "precio": precio,            "imagen\_url": imagen\_url,            "Estrellas": estrellas,            "Disponibilidad": stock            }    )

Fundamentos y Primer Scraper Estático

Web scraping con Python: extracción de datos de sitios web

Códigos de estado HTTP más comunes en la navegación web

Peticiones HTTP GET con Python y la librería Requests

Cómo extraer datos específicos de páginas web con Beautiful Soup