Portal    Foro    Buscar    FAQ    Registrarse    Conectarse


Publicar nuevo tema  Responder al tema 
Página 1 de 1
 
 
Html Obtener Valor Href En Bash , Awk Grep Sed
Autor Mensaje
Responder citando   Descargar mensaje  
Mensaje Html Obtener Valor Href En Bash , Awk Grep Sed 
 
hace tiempo que no pregunto en el foro
pero hace varias semanas
y aun no encuentro la solución
la idea es obtener la  url de los archivos  desde el código html
lo primero es obtener e href y luego concatenar con la url del html

pero e probado y buscado y no puedo solucionarlo
la manera de obtener el valor de href desde la consola
usando programas awk, grep y sed

wget http://security.debian.org/dists/stable/updates/main/binary-i386


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html>
 <head>
  <title>Index of /dists/stable/updates/main/binary-i386</title>
 </head>
 <body>
<h1>Index of /dists/stable/updates/main/binary-i386</h1>
<table><tr><th><img src="/icons/blank.gif" alt="[ICO]"></th><th><a href="?C=N;O=D">Name</a></th><th><a href="?C=M;O=A">Last modified</a></th><th><a href="?C=S;O=A">Size</a></th></tr><tr><th colspan="4"><hr></th></tr>
<tr><td valign="top"><img src="/icons/back.gif" alt="[DIR]"></td><td><a href="/dists/stable/updates/main/">Parent Directory</a></td><td>&nbsp;</td><td align="right">  - </td></tr>
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[   ]"></td><td><a href="Packages.bz2">Packages.bz2</a></td><td align="right">16-Jul-2011 09:14  </td><td align="right">133K</td></tr>
<tr><td valign="top"><img src="/icons/compressed.gif" alt="[   ]"></td><td><a href="Packages.gz">Packages.gz</a></td><td align="right">16-Jul-2011 09:14  </td><td align="right">169K</td></tr>
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[   ]"></td><td><a href="Release">Release</a></td><td align="right">17-Jul-2011 12:12  </td><td align="right">110 </td></tr>
<tr><th colspan="4"><hr></th></tr>
</table>
<address>Apache Server at security.debian.org Port 80</address>
</body></html>
 

 



 
codificador - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Html Obtener Valor Href En Bash , Awk Grep Sed 
 
cat file.html | grep -o -E 'href="([^"#]+)"' | cut -d'"' -f2 | sort | uniq


Esto produce la siguiente salida:

?C=M;O=A
?C=N;O=D
?C=S;O=A
/dists/stable/updates/main/
Packages.bz2
Packages.gz
Release


Si buscas en Google encontrarás muchas más formas de hacerlo:

Google - awk grep sed

Saludos
 




===================
Jesús Guardón

Por favor, usemos el corrector ortográfico antes de pulsar el botón "Enviar".

"uo ǝs ʇɐu pıɟıɔıן ɐdɹǝupǝɹ ɐ dɹoƃɹɐɯɐɹ, soןo ɥɐʎ bnǝ dɹodouǝɹsǝןo"
 
jguardon - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Html Obtener Valor Href En Bash , Awk Grep Sed 
 
o gracias
le  e agregado un grep con la extencion de archivo
y a funcionado
a la primera  


es que busque por google y no resulto
 



 
codificador - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Mostrar mensajes anteriores:    
 
OcultarTemas parecidos
Tema Autor Foro Respuestas último mensaje
No hay nuevos mensajes Quiero Guardar Los Dato Del Gridview Pero ... reyes Bases de Datos 4 Martes, 05 Abril 2016, 23:40 Ver último mensaje
jguardon
No hay nuevos mensajes Windows 10 Y Bash jsbsan Mundo Linux 5 Viernes, 12 Agosto 2016, 06:52 Ver último mensaje
jsbsan
No hay nuevos mensajes Ls, Grep, Egrep [Solucionado] Shell Mundo Linux 5 Martes, 22 Noviembre 2016, 09:56 Ver último mensaje
Shell
No hay nuevos mensajes Grep Mostrando Líneas Anteriores Y Poster... Shell Mundo Linux 0 Miercoles, 10 Junio 2020, 13:00 Ver último mensaje
Shell
 

Publicar nuevo tema  Responder al tema  Página 1 de 1
 

Usuarios navegando en este tema: 0 registrados, 0 ocultos y 1 invitado
Usuarios registrados conectados: Ninguno


 
Lista de permisos
No puede crear mensajes
No puede responder temas
No puede editar sus mensajes
No puede borrar sus mensajes
No puede votar en encuestas
No puede adjuntar archivos
Puede descargar archivos
No puede publicar eventos en el calendario



  

 

cron