Portal    Foro    Buscar    FAQ    Registrarse    Conectarse


Publicar nuevo tema  Responder al tema 
Página 1 de 2
Ir a la página 1, 2  Siguiente
 
Copiar Página Web En Buffer
Autor Mensaje
Responder citando   Descargar mensaje  
Mensaje Copiar Página Web En Buffer 
 
Buenas tardes, me gustaría poder obtener una página web en concreto con sus resultados para poder hacer scraping.
En gambas hay algún objeto ideal para esto??

Gracias.
 



 
calcena - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
No entiendo muy bien lo que quieres decir, pero creo que no. Si no quieres ver la página, sino sólo "las tripas", lo mejor es que te la pilles vía wget en un fichero temporal y luego la cargues en memoria para procesarla. Algo así como el ejemplo que te adjunto.

leeweb-0.0.1.tar.gz
Descripción:  
Descargar
Nombre del archivo: leeweb-0.0.1.tar.gz
Tamaño: 11.58 KB
Descargado: 42 veces
leeweb-0.0.1.tar.gz
Descripción:  
Descargar
Nombre del archivo: leeweb-0.0.1.tar.gz
Tamaño: 11.58 KB
Descargado: 42 veces
leeweb-0.0.1.tar.gz
Descripción:  
Descargar
Nombre del archivo: leeweb-0.0.1.tar.gz
Tamaño: 11.58 KB
Descargado: 42 veces

 




===================
No podemos regresar
 
shordi - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
gambas tiene todo lo que necesitas para lo que pides:

http://gambaswiki.org/wiki/comp/gb.net.curl/httpclient


Una vez cargado el contenido de la web en una variable, ya puedes hacer lo que quieras...

gambas no tiene ninguna clase dedicada al scrapping, pero supongo que con el componente gb.xml.html no será muy difícil analizar y extraer datos.

Tampoco podemos olvidarnos de los componentes gb.pcre de expresiones regulares o sencillamente las funciones de cadena.


Saludos
 




===================
Jesús Guardón

Por favor, usemos el corrector ortográfico antes de pulsar el botón "Enviar".

"uo ǝs ʇɐu pıɟıɔıן ɐdɹǝupǝɹ ɐ dɹoƃɹɐɯɐɹ, soןo ɥɐʎ bnǝ dɹodouǝɹsǝןo"
 
jguardon - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
Razón llevas, Jesús... había olvidado el net.curl, que nunca lo he usado "as is".

El viejo vicio de recurrir al shell....
 




===================
No podemos regresar
 
shordi - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
Creo que lo que necesito es lo que comenta jguardon, la idea es para entrar en filmaffinity y que dada una película descargue mediante scripting los datos que necesito, reparto, caratula, director, duración ...sinopsis y entonces pasarlo a los campos de mi DB.
Todo esto es para poder hacer un programa que llevo tiempo desarrollando en varios lenguajes pero ninguno me acaba de hacer el peso, finalmente probaré con Gambas.
El más avanzado y en fase casi de ver la luz para mi, desarrollado en Java.
Vamos a darle caña al tema a ver que sale de todo esto.

Gracias.
 



 
calcena - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
calcena escribió: [Ver mensaje]
me gustaría poder obtener una página web

Es decir el codigo HTML de la pagina ?
 



 
vuott - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
vuott escribió: [Ver mensaje]
calcena escribió: [Ver mensaje]
me gustaría poder obtener una página web

Es decir el codigo HTML de la pagina ?


Correcto, el código HTML para recorrer los Tag's contenedores de la información que necesito.
No se si la clase gb.xml me proveerá de esta necesidad que tengo.

Saludos.
 



 
calcena - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
calcena escribió: [Ver mensaje]
vuott escribió: [Ver mensaje]
calcena escribió: [Ver mensaje]
me gustaría poder obtener una página web

Es decir el codigo HTML de la pagina ?


Correcto, el código HTML para recorrer los Tag's contenedores de la información que necesito.
No se si la clase gb.xml me proveerá de esta necesidad que tengo.

Saludos.


Por cierto, alguien vi que comentó en su día como pillar información de Filmaffinity no se si tenéis algo ya desarrollado.

Saludos.
 



 
calcena - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
calcena escribió: [Ver mensaje]

Correcto, el código HTML

Bueno, propongo:

http://www.gambas-it.org/wiki/index..._una_pagina_web
 



 
vuott - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Copiar Página Web En Buffer 
 
calcena escribió: [Ver mensaje]
Creo que lo que necesito es lo que comenta jguardon, la idea es para entrar en filmaffinity y que dada una película descargue mediante scripting los datos que necesito, reparto, caratula, director, duración ...sinopsis y entonces pasarlo a los campos de mi DB.
Todo esto es para poder hacer un programa que llevo tiempo desarrollando en varios lenguajes pero ninguno me acaba de hacer el peso, finalmente probaré con Gambas.
El más avanzado y en fase casi de ver la luz para mi, desarrollado en Java.
Vamos a darle caña al tema a ver que sale de todo esto.

Gracias.



oiga compañero excelente la idea... estoy parado justo antes de tu idea y aun no lo había visionado... estoy haciendo una app para música donde muestro las imágenes del grupo y ya había visto que lastfm las tiene....

haber si puedes compartir lo que hagas.
 




===================
------
Telegram : @sepulvedamarcos
 
chaskux - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Mostrar mensajes anteriores:    
 
OcultarTemas parecidos
Tema Autor Foro Respuestas último mensaje
No hay nuevos mensajes SerialPort: Problema Con ¿longitud Del Bu... ariel Controles/Librerías/Componentes 10 Martes, 06 Octobre 2009, 20:28 Ver último mensaje
ariel
No hay nuevos mensajes ¿como Vaciar El Buffer De Eventos? jsbsan General 4 Jueves, 03 Octobre 2013, 06:38 Ver último mensaje
jsbsan
No hay nuevos mensajes La Página Del Basic Shell General 0 Miercoles, 22 May 2019, 13:42 Ver último mensaje
Shell
No hay nuevos mensajes Diseñar Una Página Web Shell HTML y CSS 4 Sabado, 25 Abril 2020, 10:28 Ver último mensaje
Shell
 

Publicar nuevo tema  Responder al tema  Página 1 de 2
Ir a la página 1, 2  Siguiente

Usuarios navegando en este tema: 0 registrados, 0 ocultos y 1 invitado
Usuarios registrados conectados: Ninguno


 
Lista de permisos
No puede crear mensajes
No puede responder temas
No puede editar sus mensajes
No puede borrar sus mensajes
No puede votar en encuestas
No puede adjuntar archivos
Puede descargar archivos
No puede publicar eventos en el calendario



  

 

cron