Hola, Shordi:
¡AVISO!, ¡TOCHO!, ¡ALARMA!, ¡TOCHO!, ¡A CUBIERTO!, ¡TOCHO!
Pues efectivamente son medidas poco intuitivas, pero son las necesarias para quien escribe actualmente, sea o no ficción, sean libros o blogs. Los «tipos» —término más correcto que «matrices» que en realidad es el molde para hacer tipos, pero que está mucho más extendido— son los «plomos» que los antiguos impresores tenían que emplear para componer un texto —por eso no incluye saltos de línea, entre otros; tampoco espacios ni tabulaciones, no sé por qué— y ha quedado como unidad universal de medida, tanto en concursos como para pago de servicios de traducción, corrección, etc., p.e., 25€/1.000 matrices. Lo mismo ocurre con «palabras», con el detalle de que se deben detectar correctamente las palabras incluso con faltas de ortografía leves; esto es porque en un concurso pasarte de palabras es eliminación inmediata y no poner espacio tras una coma sólo baja la puntuación. Lo mismo ocurre con presupuestos de corrección: habrá faltas leves a corregir, pero no puedes equivocarte por no contar el 10% de las palabras porque será un 10% menos que ganas. Por supuesto, tanto tipos como palabras son unidades que se utilizan también para medir entradas de blog, artículos en publicaciones digitales y demás parafernalia profesional internetiana. Al fin, son los «quilos» de la escritura.
«Letras», «sílabas» y «frases» se emplean para la estimación de «legibilidad». No de la intelegibilidad, es decir, no de lo fácilmente que se pueda entender un texto, sino de lo rápido que se pueda leer. Este tal Szigriszt, en su tesis de 1993, establece fórmulas para el español, francés e inglés, y el valor, junto con una escala algo distinta de la original, es la que emplean amázon y gúguel, por ejemplo, para calificar las entradas, o las revistas para aceptar artículos. Szigriszt, con buen criterio, en lugar de legibilidad lo llama «perspicuidad» —vale que el término es feo, pero es el adecuado—.
Con letras se refiere a caracteres legibles, es decir, los del alfabeto, incluyendo acentos, diéresis, virguillas, cedillas, etc. pero no signos de puntuación. La contabilidad de sílabas es complicada y, salvo el caso de la poesía, se puede hacer una aproximación bastante buena por el método propuesto sin llegar a la silabación —que es la leche... pero algún día, algún día...—. Para la contabilidad de frases, empleo el criterio que Szigriszt propone en su tesis, aunque también es aproximado; yo incluiría puntos y comas, pero...
En fin, esta es la explicación - rollo de por qué mido esas cosas y no otras y por qué empleo o quiero emplear RegExp y no algoritmos particulares —inmediatez en respuesta, esto es, obtener todos los parámetros mientras se va escribiendo—.
Espero que este rollo sirva de ayuda.
¡AVISO!, ¡TOCHO!, ¡ALARMA!, ¡TOCHO!, ¡A CUBIERTO!, ¡TOCHO!
Pues efectivamente son medidas poco intuitivas, pero son las necesarias para quien escribe actualmente, sea o no ficción, sean libros o blogs. Los «tipos» —término más correcto que «matrices» que en realidad es el molde para hacer tipos, pero que está mucho más extendido— son los «plomos» que los antiguos impresores tenían que emplear para componer un texto —por eso no incluye saltos de línea, entre otros; tampoco espacios ni tabulaciones, no sé por qué— y ha quedado como unidad universal de medida, tanto en concursos como para pago de servicios de traducción, corrección, etc., p.e., 25€/1.000 matrices. Lo mismo ocurre con «palabras», con el detalle de que se deben detectar correctamente las palabras incluso con faltas de ortografía leves; esto es porque en un concurso pasarte de palabras es eliminación inmediata y no poner espacio tras una coma sólo baja la puntuación. Lo mismo ocurre con presupuestos de corrección: habrá faltas leves a corregir, pero no puedes equivocarte por no contar el 10% de las palabras porque será un 10% menos que ganas. Por supuesto, tanto tipos como palabras son unidades que se utilizan también para medir entradas de blog, artículos en publicaciones digitales y demás parafernalia profesional internetiana. Al fin, son los «quilos» de la escritura.
«Letras», «sílabas» y «frases» se emplean para la estimación de «legibilidad». No de la intelegibilidad, es decir, no de lo fácilmente que se pueda entender un texto, sino de lo rápido que se pueda leer. Este tal Szigriszt, en su tesis de 1993, establece fórmulas para el español, francés e inglés, y el valor, junto con una escala algo distinta de la original, es la que emplean amázon y gúguel, por ejemplo, para calificar las entradas, o las revistas para aceptar artículos. Szigriszt, con buen criterio, en lugar de legibilidad lo llama «perspicuidad» —vale que el término es feo, pero es el adecuado—.
Con letras se refiere a caracteres legibles, es decir, los del alfabeto, incluyendo acentos, diéresis, virguillas, cedillas, etc. pero no signos de puntuación. La contabilidad de sílabas es complicada y, salvo el caso de la poesía, se puede hacer una aproximación bastante buena por el método propuesto sin llegar a la silabación —que es la leche... pero algún día, algún día...—. Para la contabilidad de frases, empleo el criterio que Szigriszt propone en su tesis, aunque también es aproximado; yo incluiría puntos y comas, pero...
En fin, esta es la explicación - rollo de por qué mido esas cosas y no otras y por qué empleo o quiero emplear RegExp y no algoritmos particulares —inmediatez en respuesta, esto es, obtener todos los parámetros mientras se va escribiendo—.
Espero que este rollo sirva de ayuda.
Palabras : 460
Matrices : 2793
Caracteres : 2346
Letras : 2202
Párrafos : 7
Sílabas —prov.— : 916
Frases —prov.— : 28
LEGIBILIDAD
Fdez-Huerta 1959: 71
Gtz-Polini 1972 : 43
Szigriszt 1993 : 66