TLD -> Top Level domains, dominio de nivel superior. Es la terminación de una página, puede ser .com, .org, .mx, etc.
Búsqueda:
https?:\/\/[\w\-\.]+\.\w{2,5}
(esta última parte selecciona a los TLD).
Búsqueda la url completa ->
https?:\/\/[\w\-\.]+\.\w{2,5}\/?\S*
No tiene en cuenta a los espacios en blanco.
Búsqueda “para simplificarte la vida” ->
https?\S*
Es completamente inútil si existen urls no válidas, por ejemplo http-123423312, esta página es básura, ruido, pero con esta búsqueda quedará seleccionada, en un mundo ideal dónde se guardan las urls de la misma forma y sin errores sería idónea, pero dónde existe el error humano puede volverse inútil.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?