Codificación De Carácteres


Objetivo: Codificación De Carácteres
Hola!.

Estuve probando el ejemplo de cliente HTTP asíncrono que tenemos en el manual de Gambas.
Parece que ha cambiado mucho con respecto al ejemplo que trae Gambas3 hoy y el de la wiki.

Lo que hago es bajar una página web, almacenándola en una cadena y muestro esta cadena en la consola o bien en un TextArea.
La primera impresión, es que los caracteres con tilde no ven bien. Tanto si muestro la cadena totalmente o carácter a caracter,
con la clase String. ( No me valió para nada usar la clase String)

Por defecto gambas usa UTF-8, pero lo que veo es que el código de la pagina (por ejemplo www.google.es) está en ISO-8859-1 ( ISO Latín 1).
Fue de casualidad, darme cuenta de esto.

Así que usé sin mucha idea de estas cosas: ( Gracias a un post de Shordi y Soplo, que me motivó a seguir buscando más información)

....
sCad2 = Conv$(sCad, "ISO-8859-1", "UTF-8")
....


Y arreglé el problema. Todo esto es por que estoy empezando a ver brevemente el tema de redes con los dos lenguajes.

Comprendo que hay cosas distintas entre las dos versiones de Python y es que tampoco a veces se puede hacer la cosas igual.
Intento hacerlo igual que el manual, que es para Python2 y ese es el problema que me encuentro. Lo hago al pie de la letra
y me gustaría encontrar las soluciones de una manera más fácil. Si ya estoy verde en redes, peor me las veo.
En otros temas, no he tenido problema, pero ya el de redes es otra cuestión distinta. Errores Unicode, una historia.

Se supone que estoy aprendiendo Python 3. Si a la vez que estas aprendiendo algo, ya no funciona (Python2) , te rompe los esquemas y tienes que estar buscando
por Internet. Ya no es aprender y seguir un camino recto, tienes que ir tomando bifurcaciones y volver donde lo dejaste si es que puedes.
Esto ocurre con cualquier lenguaje, pero te desvía y pierdes más tiempo. ( Demasiado)

Lo más típico es encontrar soluciones que difieren de lo que intenta hacer el ejemplo del manual ( que no es que sea perfecto).
Es que han cambiado mucho las cosas de una versión a otra.

El aprendizaje no es un lecho de rosas.

Saludos

Objetivo: Re: Codificación De Carácteres
Una forma fácil de saber la codificación del archivo:

Usando el comando file.

file index.html


Salida:

Citar:

index.html: HTML document, ISO-8859 text, with very long lines


Y tan largas, que es la página indice de Google, no es que sean lineas, es que son párrafos y bien grandes.
Todo apelotonado. No parece ni que tenga final de linea.

¿ Es normal que sean así las páginas Html ?. ( No voy a poneros el código de la pagina inicial de Google aquí )
Vamos, digo yo que para estudiarlas no se verán así, que lio!.

Y luego quieren el código clarito, si eso no lo entiende ni el que lo ha hecho. Que guarrada.

Saludos

última edición por Shell el Jueves, 18 Diciembre 2014, 20:00; editado 1 vez

Página 1 de 1


  
No puede crear mensajes
No puede responder temas
No puede editar sus mensajes
No puede borrar sus mensajes
No puede votar en encuestas
No puede adjuntar archivos
Puede descargar archivos
No puede publicar eventos en el calendario

   

Está utilizando la versión (Lo-Fi). Para ver la versión completa del foro, haga clic aquí.

Powered by Icy Phoenix based on phpBB
Design by DiDiDaDo

Página generada en:: 0.1027s (PHP: -43% SQL: 143%)
Consultas SQL: 24 - Debug off - GZIP Activado