Instalación y configuración de Selenium

11/30

Lectura

Para poder utilizar Selenium con Python hay que seguir una serie de pasos que están detallados a continuación.

De todas formas, siempre es recomendable leer la documentación oficial de las herramientas.

  1. Instalar los bindings de Selenium para Python. Éstos nos permitirán controlar un navegador desde el código.

Ejecutar:

pip install selenium

O si estás utilizando Anaconda, puedes instalarlo con:

conda install -c conda-forge selenium

  1. Selenium necesita un driver para poder generar una interfaz con el navegador. Dependiendo el navegador que uses, deberás descargar un driver distinto. Acá te dejo un listado de los links de descarga para los distintos navegadores. Asegurate de descargar el que corresponda con la versión de tu navegador:
  1. Es importante que el archivo descargado esté en una carpeta accesible desde la Jupyter Notebook, ya que necesitaremos referenciarlo desde el código para poder utilizarlo.

Aportes 21

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Si a alguien utiliza el navegador Brave, debe descargar el driver de Chrome de acuerdo a la versión de Chromium que le salga en about://version
Luego en Jupiter Notebook cuando desee ejecutarlo debe tener el siguiente código para abrir un navegador:

options = webdriver.ChromeOptions()
options.binary_location = "/opt/brave.com/brave/brave"
driver = webdriver.Chrome(executable_path='./chromedriver', options=options)

Estoy en Ubuntu 16.04 y no tengo Chrome, solo Brave. el driver lo puse directamente en mi carpeta de trabajo.

Si usas WSL y quieres usar Selenium, te daré una pequeña guía. En la web no hay muchos tutoriales o guías que te expliquen como se usa Selenium en un Windows Subsystem for Linux (WSL). Para empezar para mí fue necesario tener instalado o Anaconda o miniconda, que es la versión más simple de Anaconda en la cual tú instalas los packages que necesitas y no los que traen por defecto Anaconda, es mucho más liviana y cumple la misma función. Si quieres una guia más detallada te dejo esta: https://towardsdatascience.com/setting-up-a-data-science-environment-using-windows-subsystem-for-linux-wsl-c4b390803dd?gi=287a9058209d.

  1. Estando ya en conda te saldrá algo como esto:
(base) curso_web_scraping: 

Lo importante de lo anterior es fijarse que si tienes un base en tu terminal, quiere decir que ya tienes conda.

  1. Aquí puedes crear un environment nuevo y puedes llamarlo como quieras, si quieres saber como te dejo este cheatsheet: https://docs.conda.io/projects/conda/en/4.6.0/_downloads/52a95608c49671267e40c689e0bc00ca/conda-cheatsheet.pdf

  2. Selenium para su funcionamiento usa el driver del navegador que tú uses, ya sea Chrome, Firefox, etc. En mi caso uso Firefox que he visto que tiene muy pocos tutoriales para Selenium, pero esta guía te servirá para los demás navegadores. Lo descargas como te señala la guía de arriba, es importante que descargues la versión para Windows ya sea de 32 o 64 bits dependiendo de tu computador. Este te descargará un comprimido con el Driver.

  3. Si usas VSCode como yo es importante que instales la extensión de Python que está en la marketplace. Aquí es importante elegir como tu interpreter path donde tengas instalado tu conda: Por defecto en WSL se instala en el home denotado por ~, aquí eliges ~/miniconda3/bin/python. No te preocupes esta ruta la puedes modificar las veces que quieras y usar la que quieras, siempre y cuando sea una que este Python.

  4. Vas a ir al directorio en que vas a trabajar y usar Selenium, en ese directorio vas a descomprimir la carpeta zip del driver y te dejara un .exe, en mi caso geckodriver.exe. Es importante que lo tengas en la misma carpeta en que vas a crear tu .py.

  5. Ahora vas a probar que selenium funcione: crea un archivo test_selenium.py (o como quieras llamarlo) y vas a ingresar las siguientes líneas de código.

from selenium import webdriver

driver = webdriver.Firefox(executable_path='./geckodriver.exe')
driver.get('https://www.google.com')
driver.close()

Si tu navegador es Chrome solo cambia el Firefox por Chrome y adentro de los paréntesis le dirás que hay una ruta ejecutable, aquí tendrás que recordar las rutas relativas y absolutas en Linux. Recuerda que ./ significa que el ejecutable está en el directorio que estás trabajando, el current directory.

  1. Luego ejecutaras el código:
python3 test_selenium.py  

De esta manera se te abrirá el navegador, ingresara https://www.google.com y luego lo cerrara automáticamente. Aquí empieza la magia.

Espero te haya ayudado la guía.

Encontre este video por si a alguien le sirve https://www.youtube.com/watch?v=qYqGGrAA_IA&ab_channel=NicolasAlvarez

https://sites.google.com/chromium.org/driver/downloads este es el link de descarga actualizado para Chrome

muy mala explicacion, deberian tener un estandar en platzi de la calidad de este tipo de lecturas de instalacion. Hay cursos donde son super especificos y tienen varias lecturas dependiendo el tipo de sistema o navegador que utilices y estan estas lecturas pesimas que no explican nada literal.

Existe alguno para el navegador Opera?

No me funciona selenium desde jupyter notebook. Tengo instalado selenium. No se como solucionar el problema

Yo uso el navegador Brave ¿De dónde lo tendría que descargar?

Lastima que no esta más explicado pero no importa seguimos pa’lante

interesante lo que viene

genial!

excelente

Pues, bien raro el de firefox, porque no me funciona. Voy a terminar instalando Anaconda

Done

Para saber la version del navegador about://version

Listo, descargado.

RubenSH instale selenium no en un ambiente sino en el sistema general. lo que vi es que debe estar instalado en el mismo directorio de python

Tendré problema si uso Google Colab?

¿Debería crear un ambiente virtual?

listo

Interesante