Html Obtener Valor Href En Bash , Awk Grep Sed


Objetivo: Html Obtener Valor Href En Bash , Awk Grep Sed
hace tiempo que no pregunto en el foro
pero hace varias semanas
y aun no encuentro la solución
la idea es obtener la url de los archivos desde el código html
lo primero es obtener e href y luego concatenar con la url del html

pero e probado y buscado y no puedo solucionarlo
la manera de obtener el valor de href desde la consola
usando programas awk, grep y sed

wget http://security.debian.org/dists/stable/updates/main/binary-i386


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html>
<head>
<title>Index of /dists/stable/updates/main/binary-i386</title>
</head>
<body>
<h1>Index of /dists/stable/updates/main/binary-i386</h1>
<table><tr><th><img src="/icons/blank.gif" alt="[ICO]"></th><th><a href="?C=N;O=D">Name</a></th><th><a href="?C=M;O=A">Last modified</a></th><th><a href="?C=S;O=A">Size</a></th></tr><tr><th colspan="4"><hr></th></tr>
<tr><td valign="top"><img src="/icons/back.gif" alt="[DIR]"></td><td><a href="/dists/stable/updates/main/">Parent Directory</a></td><td>&nbsp;</td><td align="right"> - </td></tr>
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[ ]"></td><td><a href="Packages.bz2">Packages.bz2</a></td><td align="right">16-Jul-2011 09:14 </td><td align="right">133K</td></tr>
<tr><td valign="top"><img src="/icons/compressed.gif" alt="[ ]"></td><td><a href="Packages.gz">Packages.gz</a></td><td align="right">16-Jul-2011 09:14 </td><td align="right">169K</td></tr>
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[ ]"></td><td><a href="Release">Release</a></td><td align="right">17-Jul-2011 12:12 </td><td align="right">110 </td></tr>
<tr><th colspan="4"><hr></th></tr>
</table>
<address>Apache Server at security.debian.org Port 80</address>
</body></html>

Perfil MP  
Objetivo: Re: Html Obtener Valor Href En Bash , Awk Grep Sed
cat file.html | grep -o -E 'href="([^"#]+)"' | cut -d'"' -f2 | sort | uniq


Esto produce la siguiente salida:

?C=M;O=A
?C=N;O=D
?C=S;O=A
/dists/stable/updates/main/
Packages.bz2
Packages.gz
Release


Si buscas en Google encontrarás muchas más formas de hacerlo:

Google - awk grep sed

Saludos

Perfil MP  
Objetivo: Re: Html Obtener Valor Href En Bash , Awk Grep Sed
o gracias
le e agregado un grep con la extencion de archivo
y a funcionado
a la primera


es que busque por google y no resulto

Perfil MP  

Página 1 de 1


  
No puede crear mensajes
No puede responder temas
No puede editar sus mensajes
No puede borrar sus mensajes
No puede votar en encuestas
No puede adjuntar archivos
Puede descargar archivos
No puede publicar eventos en el calendario

   

Está utilizando la versión (Lo-Fi). Para ver la versión completa del foro, haga clic aquí.

Powered by Icy Phoenix based on phpBB
Design by DiDiDaDo

Página generada en:: 0.3814s (PHP: -66% SQL: 166%)
Consultas SQL: 45 - Debug off - GZIP Activado