Traducir el blog

Juegos de Caracteres

Posted on marzo 17, 2011 by Excel Pedro Wave

English translation of this post here

El carácter

El carácter de una persona o personalidad puede no ser entendido por otras personas. Hay personas con mucho carácter y otras con poco, con carácter fácil o difícil o de trato complicado, de carácter débil o fuerte, pero éste no es un blog de psicología sino de tecnología.

Los caracteres

Lo mismo pasa con los caracteres de un ordenador o de una aplicación informática que al leerlos en otra no los interpreta bien o no están las fuentes de esos caracteres o son difíciles de ver o no dicen nada o expresan mucho, como en una imagen.

Tengo que decir que no estoy conforme con el dicho popular "una imagen vale más que mil palabras" porque una palabra con caracteres gráficos puede contener mil imágenes y sino que se le pregunten a los chinos y japoneses.

Desde los primeros PCs, se ha intentado que eso no pase, creando juegos de caracteres e intentando que sean universales, cosa que aún no se ha conseguido hoy en día.

Como ingeniero me inclino a usar los 94 caracteres con símbolos de unidades de medida, desde &H3380 hasta &H33DD en el rango F52C129:F52C222 y, por mi carrera en compañías telefónicas, los teléfonos en las celdas F39C15 y F39C16.
☎ ☏

Por ejemplo, los hercios o ciclos por segundo para medir la velocidad de las CPUs:
㎐ ㎑ ㎒ ㎓ ㎔


Los caracteres Unicode

La última tentativa es la versión Unicode 6.0 que añade 2.088 caracteres, incluyendo más de 1.000 símbolos adicionales del tipo emoji o emoticono, que son especialmente importantes para los teléfonos móviles japoneses

El carácter japonés

Esos japoneses habitualmente tan lejanos en sus islas pero tan cercanos exportando su altísima tecnología y que tanto están sufriendo estos días con los terremotos, los tsunamis (¿por qué inventarían esta palabra precisamente los japoneses?) y la amenaza nuclear.


Me quedo con sus muestras de valor y de civismo, comportándose con entereza ante la desolación, sin saqueos, incidentes ni protestas.  Muy diferente al carácter occidental.

津波 = Tsunami, esta palabra está compuesta de dos caracteres:
津 = Tsu, puerto de una ciudad japonesa con una barrera que da tiempo a evacuarla.
波 = nami - ola.

La casualidad debe haber puesto, dentro de Unicode, a continuación del carácter que representa la Ola del Tsunami, éste otro:
泣 = Llorar.

Cuando me puse mi seudónimo Wave fue para referirme al poder de las olas para viajar en ondas y extender su mensaje a todos los rincones, pero no como una ola negra sino como una ola de ayuda - a wave of help.

Desde aquí, animo al pueblo japonés para que pueda recuperarse pronto de tanta zozobra.
ここから、私は、このような不安から迅速に回復することができます日本の人々に私の励ましを与える。
(Traducido con el Traductor de Google)


Codificación de caracteres

Para intentar entender un poco el carácter japonés, o la codificación de caracteres informáticos, lo mejor es poder generarlos. Me refiero a los caracteres del idioma japonés y una manera fácil de generarlos en Windows es con esta hoja de cálculo en Excel que he preparado para la ocasión y que genera 65.536 caracteres Unicode en 256 filas y 256 columnas.

UnicodeFontsPW1.xls

Es un subconjunto de Unicode conocido como BMP que no se refiere a un fichero del tipo Windows Bitmap, con la extensión .bmp, sino a un Basic Multilingual Plane o BMP

El primer plano (plano 0), de los 17 de que consta Unicode, es el BMP y contiene caracteres de casi todas las lenguas modernas, y un gran número de caracteres especiales. Su objetivo es apoyar la unificación de juegos de carácter para escribir. La mayoría de los códigos asignados en el BMP se utilizan para codificar los lenguajes chino, japonés y coreano CJK según el código CJK Unified Ideographs (&H4E00 a &H9FFF) en las líneas 79 a 160 de la tabla generada en Excel, o sea, la friolera de 20.940 caracteres para 3 idiomas. (Toda una vida para aprenderlos).

El japonés escrito se llama Kanji y está compuesto de caracteres chinos y de caracteres hiragana (ひらがな, 平仮名) y katakana (カタカナ, 片仮名).

La lista completa de los caracteres CJK y su correspondencia con cada uno de los tres países está en este fichero de 974 páginas: CJK Range: 4E00-9FCF.pdf

Enlaces de Wikipedia para saber más sobre caracteres Unicode:
Unicode
ISO 10646
Mapping of Unicode characters
Unicode compatibility characters
Unicode planes

Enlace de Microsoft:
Juego de caracteres Unicode


Caracteres generados con Alt + número

Pulsando a la vez la tecla Alt y un número se pueden escribir caracteres extendidos de la vieja tabla ASCII pero, al usar sistemas y teclados diferentes, cada uno es un mundo.

Cosas que hay que saber:
- La introducción de caracteres desde el teclado depende de la configuración del teclado y del idioma.
- La tabla ASCII original es la del IBM PC y del MS-DOS: Code page 437
- La correspondencia en Europa Occidental puede ser: Code page 850
- En inglés suele ser: Windows-1252

Una lista bastante completa de códigos ASCII y Unicode:
Microsoft code page numbers for various other character encodings

Adjunto un método para generar con macros todas las combinaciones de teclas Alt + número

Metodo de Teclado Alt+PW1.xls

Se pueden comprobar los caracteres y compararlos:
- En la fila 24 la tabla ASCII compatible DOS.
- En la fila 25 se generan con la función keybd_event las teclas Alt + número
- En la fila 26 se generan con Alt + 0 + número

Para estudiar las diferencias entre estos códigos generados con la tecla Alt ver esta página : Alt code


Fuentes de caracteres

Para listar las fuentes de caracteres en MS Windows instaladas en tu ordenador se puede hacer con esta hoja Excel.

Fonts PW1.xls

Tarda un minuto en generarla y, si se selecciona un celda, la copia automáticamente en el portapapeles para pegarla en Word, por ejemplo, manteniendo el tipo de fuente - font.


Mi carácter

¿De dónde me viene mi interés por los caracteres?

De mi proyecto fin de carrera sobre un terminal inteligente para el que presenté un prototipo con su electrónica digital, su microcontrolador, su módem y su programa en lenguaje microprocesador.

El prototipo llevaba un teclado QWERTY pero la pantalla era muy cara y la sustituí por un televisor CRT en el que aparecían los caracteres en 24 filas y 80 columnas, codificados en ASCII, en una extensión ASCII propietaria y en EBCDIC pero no en Unicode que apareció 10 años después.


Juegos de caracteres

Jugando con los caracteres hacíamos muchos juegos informáticos cuando no había tarjetas gráficas avanzadas en los primeras Computadoras Personales - PC - Personal Computer.

Eran juegos basados en texto, text-based games, del tipo mazmorras (MUD), ping-pong, Star Trek o Amnesia (en un floppy disk de 5¼" - ver manuscrito aquí)

List of text-based computer games

También se daban algunas formas de arte:
Arte ASCII
ANSI art

En cuanto aparecieron los juegos gráficos, los japoneses nos apabullaron con sus impresionantes juegos, lo que no habían podido hacer con sus caracteres chinos, ininteligibles para los occidentales.

Aún ahora se puede seguir jugando con los caracteres para dibujar los corazones de las barajas en Excel o cualquier cosa que se nos ocurra.

Pues eso, que los que hemos pasado por las etapas más tempranas de la informática sabemos de codificación de caracteres, cosa que los jóvenes dejan de lado.

Deberían ponerse las pilas y aprender estas cosas para generar mejores emoticonos en las redes sociales con simples caracteres y para saber qué eventos se producen cuando aporrean las teclas.

English translation of this post here

No Response to "Juegos de Caracteres"

Leave A Reply

Indícame las erratas que encuentres y qué es lo que te gustaría ver en los próximos artículos.

Mi lista de blogs