sábado, 19 de agosto de 2023

Cifrado homofónico

Hoy hablaremos de lo que es un cifrado homofónico. Sería recomendable que tuvieras fresco el cifrado de sustitución general, ya que el homofónico es la solución al análisis de frecuencias que utilizábamos para romperlo.

A la hora de resolver un criptograma de sustitución general, contábamos cuántas veces aparecía cada letra, número o símbolo en el texto cifrado y comparábamos esas frecuencias con las naturales del idioma (puedes consultar las tablas de frecuencias relativas en castellano y en inglés en ese mismo post). Por simplificar, si un símbolo aparecía muchas veces en el texto cifrado, podíamos inferir que lo más probable es que se tratara de las letras E o la A, que son las más comunes en castellano. Este análisis de frecuencias, unido a uno más "gramatical", podía darnos la solución al cifrado. ¿Cómo hacer para evitar que nuestro mensaje sea descifrado utilizando las frecuencias relativas?

Muy fácil, haciendo que TODOS los símbolos tengan la misma frecuencia. Para ello, varios símbolos se corresponderán con la misma letra en el texto plano. Por ejemplo, la letra I tiene una frecuencia del 6%. Nos inventamos seis símbolos distintos para poder cifrar la I: 15, 32, 52, 78, 83 y 84. Cuando tengamos que cifrar una I, elegiremos aleatoriamente uno de esos seis símbolos de la lista. Hacemos lo mismo para el resto de letras (para que el número total de símbolos sea 100 y las de menor frecuencia tengan, al menos, un símbolo, hemos tenido que redondear y truncar un poco):

E A O S R
01, 06, 19, 22, 25, 31, 38, 44, 60, 75, 86, 94, 98 04, 05, 11, 16, 37, 46, 48, 63, 71, 88, 89, 95 08, 42, 54, 59, 66, 73, 81, 99 13, 27, 35, 50, 58, 69, 76, 93 00, 12, 23, 28, 41, 65, 90
N I D L C
18, 26, 40, 57, 74, 85 15, 32, 52, 78, 83, 84 33, 36, 47, 64, 70 02, 24, 55, 68, 92 14, 29, 53, 87
T U M P B
09, 10, 43, 79 20, 34, 62, 91 07, 45, 96 39, 61 72
G V Y Q H
17 80 77 30 56
F Z J Ñ X
97 51 82 21 49
K W
67 03

Por ejemplo, para cifrar LOS, elegimos uno de cada lista de homófonos de la L, la O y la S: 24-99-50. Así, un ataque por análisis de frecuencias es más difícil, ya que cada símbolo aparecerá, de media, un 1% de las veces en los textos cifrados.

En general, descifrar un mensaje de este tipo sin la tabla de homófonos es muy díficil. Se podría conseguir algo mediante un análisis gramatical, con los espacios entre las palabras.


No hay comentarios:

Publicar un comentario