English translation of this post
here
El carácter
El carácter de una persona o personalidad puede no ser entendido por otras
personas. Hay personas con mucho carácter y otras con poco, con carácter fácil
o difícil o de trato complicado, de carácter débil o fuerte, pero éste no es
un blog de psicología sino de tecnología.
Los caracteres
Lo mismo pasa con los caracteres de un ordenador o de una aplicación
informática que al leerlos en otra no los interpreta bien o no están las
fuentes de esos caracteres o son difíciles de ver o no dicen nada o expresan
mucho, como en una imagen.
Tengo que decir que no estoy conforme con el dicho popular "una imagen vale
más que mil palabras" porque una palabra con caracteres gráficos puede
contener mil imágenes y sino que se le pregunten a los chinos y japoneses.
Desde los primeros PCs, se ha intentado que eso no pase, creando
juegos de caracteres
e intentando que sean universales, cosa que aún no se ha conseguido hoy en
día.
Como ingeniero me inclino a usar los 94 caracteres con símbolos de unidades de
medida, desde &H3380 hasta &H33DD en el rango F52C129:F52C222 y, por
mi carrera en compañías telefónicas, los teléfonos en las celdas F39C15 y
F39C16.
☎ ☏
Por ejemplo,
los hercios o ciclos por segundo
para medir la velocidad de las CPUs:
㎐ ㎑ ㎒ ㎓ ㎔
Los caracteres Unicode
La última tentativa es la versión
Unicode 6.0 que
añade 2.088 caracteres, incluyendo más de 1.000 símbolos adicionales del tipo
emoji o emoticono, que son
especialmente importantes para
los teléfonos móviles japoneses
El carácter japonés
Esos japoneses habitualmente tan lejanos en sus islas pero tan cercanos
exportando su altísima tecnología y que tanto están sufriendo estos días con
los terremotos, los
tsunamis (¿por qué
inventarían esta palabra precisamente los japoneses?) y la amenaza nuclear.
Me quedo con sus muestras de valor y de civismo, comportándose con entereza
ante la desolación,
sin saqueos, incidentes ni protestas. Muy diferente al carácter occidental.
津波 = Tsunami, esta palabra está compuesta de dos caracteres:
津 = Tsu, puerto de una ciudad japonesa con una barrera que da tiempo a
evacuarla.
波 = nami - ola.
La casualidad debe haber puesto, dentro de Unicode, a continuación del
carácter que representa la Ola del Tsunami, éste otro:
泣 = Llorar.
Cuando me puse mi seudónimo
Wave
fue para referirme al poder de las olas para viajar en ondas y extender su
mensaje a todos los rincones, pero no como
una ola negra
sino como
una ola de ayuda - a wave of help.
Desde aquí, animo al pueblo japonés para que pueda recuperarse pronto de tanta
zozobra.
ここから、私は、このような不安から迅速に回復することができます日本の人々に私の励ましを与える。
(Traducido con el
Traductor de Google)
Codificación de caracteres
Para intentar entender un poco el carácter japonés, o la
codificación de caracteres
informáticos, lo mejor es poder generarlos. Me refiero a los caracteres del
idioma japonés y una manera fácil de generarlos en Windows es con esta hoja de
cálculo en Excel que he preparado para la ocasión y que genera 65.536
caracteres Unicode en 256 filas y 256 columnas.
UnicodeFontsPW1.xls
Es un subconjunto de Unicode conocido como BMP que no se refiere a un fichero
del tipo
Windows Bitmap, con
la extensión .bmp, sino a un
Basic Multilingual Plane o BMP
El primer plano (plano 0), de los 17 de que consta Unicode, es el BMP y
contiene caracteres de casi todas las lenguas modernas, y un gran número de
caracteres especiales. Su objetivo es apoyar la unificación de juegos de
carácter para escribir. La mayoría de los códigos asignados en el BMP se
utilizan para codificar los lenguajes chino,
japonés y
coreano
CJK según el
código
CJK Unified Ideographs
(&H4E00 a &H9FFF) en las líneas 79 a 160 de la tabla generada en
Excel, o sea, la friolera de 20.940 caracteres para 3 idiomas. (Toda una vida
para aprenderlos).
El japonés escrito se llama
Kanji y está compuesto
de caracteres chinos y de caracteres
hiragana (ひらがな,
平仮名) y
katakana (カタカナ,
片仮名).
La lista completa de los caracteres CJK y su correspondencia con cada uno de
los tres países está en este fichero de 974 páginas:
CJK Range: 4E00-9FCF.pdf
Enlaces de Wikipedia para saber más sobre caracteres Unicode:
Unicode
ISO 10646
Mapping of Unicode characters
Unicode compatibility characters
Unicode planes
Enlace de Microsoft:
Juego de caracteres Unicode
Caracteres generados con Alt + número
Pulsando a la vez la tecla Alt y un número se pueden escribir caracteres
extendidos de la vieja tabla ASCII pero, al usar sistemas y teclados
diferentes, cada uno es un mundo.
Cosas que hay que saber:
- La introducción de caracteres desde el teclado depende de la configuración
del teclado y del idioma.
- La tabla ASCII original es la del IBM PC y del MS-DOS:
Code page 437
- La correspondencia en Europa Occidental puede ser:
Code page 850
- En inglés suele ser:
Windows-1252
Una lista bastante completa de códigos ASCII y Unicode:
Microsoft code page numbers for various other character encodings
Adjunto un método para generar con macros todas las combinaciones de teclas
Alt + número
Metodo de Teclado Alt+PW1.xls
Se pueden comprobar los caracteres y compararlos:
- En la fila 24 la tabla ASCII compatible DOS.
- En la fila 25 se generan con la función
keybd_event
las teclas
Alt + número
- En la fila 26 se generan con
Alt + 0 + número
Para estudiar las diferencias entre estos códigos generados con la tecla Alt
ver esta página :
Alt code
Fuentes de caracteres
Para listar las
fuentes de caracteres en MS Windows
instaladas en tu ordenador se puede hacer con esta hoja Excel.
Fonts PW1.xls
Tarda un minuto en generarla y, si se selecciona un celda, la copia
automáticamente en el portapapeles para pegarla en Word, por ejemplo,
manteniendo el tipo de fuente - font.
Mi carácter
¿De dónde me viene mi interés por los caracteres?
De mi proyecto fin de carrera sobre un terminal inteligente para el que
presenté un prototipo con su electrónica digital, su microcontrolador, su
módem y su programa en lenguaje microprocesador.
El prototipo llevaba un
teclado QWERTY pero la
pantalla era muy cara y la sustituí por un televisor CRT en el que aparecían
los caracteres en 24 filas y 80 columnas, codificados en ASCII, en una
extensión ASCII propietaria y en EBCDIC pero no en Unicode que apareció 10
años después.
Juegos de caracteres
Jugando con los caracteres hacíamos muchos juegos informáticos cuando no había
tarjetas gráficas avanzadas en los primeras Computadoras Personales - PC -
Personal Computer.
Eran juegos basados en texto,
text-based games, del tipo mazmorras (
MUD), ping-pong, Star Trek o
Amnesia (en un
floppy disk de 5¼" -
ver manuscrito aquí)
List of text-based computer games
También se daban algunas formas de arte:
Arte ASCII
ANSI art
En cuanto aparecieron los juegos gráficos, los japoneses nos apabullaron con
sus impresionantes juegos, lo que no habían podido hacer con sus caracteres
chinos, ininteligibles para los occidentales.
Aún ahora se puede seguir jugando con los caracteres para
dibujar los corazones de las barajas en Excel
o cualquier cosa que se nos ocurra.
Pues eso, que los que hemos pasado por las etapas más tempranas de la
informática sabemos de codificación de caracteres, cosa que los jóvenes dejan
de lado.
Deberían ponerse las pilas y aprender estas cosas para generar mejores
emoticonos en las redes sociales con simples caracteres y para saber qué
eventos se producen cuando aporrean las teclas.
English translation of this post
here