Anda di halaman 1dari 4

Introduccin

Actualmente estamos viviendo en la sociedad de la informacin y la comunicacin,


donde es importante reconocer todos los avances que se hacen en el mbito de la
informtica, todos las pginas web, los programas, los cajeros electrnicos, todo lo
que nos facilita nuestra, tiene una esencia, y por ende la estaremos analizando en
el presente escrito, ya que analizramos un lenguaje de programacin, el cual est
centrado en datos y secuencias y sealaremos su funcionalidad en la vida
cotidiana.

Run-lenght encoding
La

compresin RLE o Run-length

encoding es

una

forma

muy

simple

de compresin de datos en la que secuencias de datos con el mismo valor


consecutivas son almacenadas como un nico valor ms su recuento. Esto es
ms til en datos que contienen muchas de estas "secuencias"; por ejemplo,
grficos sencillos con reas de color plano, como iconos y logotipos.
Por ejemplo, considera una pantalla que contiene texto en negro sobre un fondo
blanco. Habra muchas secuencias de este tipo con pxeles blancos en los
mrgenes vacos, y otras secuencias de pxeles negros en la zona del texto.
Supongamos una nica lnea (o scanline), con N representando las zonas en
negro y B las de blanco:
BBBBBBBBBBBBNBBBBBBBBBBBBNNNBBBBBBBBBBBBBBBBBBBBBBBBNB
BBBBBBBBBBBBB
Si aplicamos la codificacin run-length a esta lnea, obtendramos lo siguiente:
12B1N12B3N24B1N14B

Interpretado esto como 12 letras B, 1 letra N , 12 letras B, 3 letras N, etc. El


cdigo run-length representa el original de 67 caracteres en tan slo 16. Esto
quiere decir que la lnea original pesa 67 bytes y la cadena codificada pesa slo 16
bytes. Esta codificacin traducida a binario, cuyo principio es el mismo, se utiliza
para el almacenamiento de imgenes. Incluso ficheros de datos binarios pueden
ser comprimidos utilizando este mtodo. El primer byte contiene un nmero que
representa el nmero de veces que el carcter est repetido. El segundo byte
contiene al propio carcter. En otros casos se codifican en un solo byte: 1 bit (0 o
1) y 7 bits para especificar el nmero de caracteres consecutivos.
Sin embargo, sistemas de compresin ms modernos a menudo usan el algoritmo
de deflacin u otros algoritmos basados en el LZ77, el cual tiene la ventaja de
utilizar secuencias de cadenas de caracteres.
Algunos formatos que utilizan esta codificacin incluyen Packbits, PCX e ILBM.
La codificacin run-length realiza una compresin de datos sin prdidas y es muy
utilizado en imgenes de 8 bits indexadas (en un principio fue utilizado para
imgenes en blanco y negro). No funciona tan bien en imgenes donde vara
constantemente el color de los pixels como fotografas, aunque JPEG lo utiliza de
forma efectiva en los coeficientes que quedan despus de transformar y cuantificar
bloques de imgenes. Posteriormente ha formado la base de otros sistemas de
compresin como por ejemplo elCCITT grupo 3 1D
Varible lenght-encoding
Se conoce como cdigo de longitud variable (o varchar) en la teora de la
informacin a un cdigo en donde su ancho de palabra es variable de longitud, es
decir, al codificar el abecedario no es necesario hacerlo con el mismo nmero
de bits cada letra, ya que en el lenguaje espaol, es mucho ms probable que se
encuentre una vocal, por ejemplo "a", que la letra "k", entonces para hacer una
codificacin de reduccin de espacio o cdigo de compresin, la letra "a" se
codifica con un menor nmero de bits, por ejemplo 2 bits "01", y la letra "k" se
codifique con 8 bits, por decir un ejemplo "01001010". Entonces como sabemos

que es ms probable encontrar la letra "a" se codificara con un nmero mnimo


de bits que la letra "k".
Si seguimos haciendo una codificacin con respecto a las dems letras,
encontraremos que hay algunas que se utilizan menos que otras, y por lo tanto,
tenemos que analizar laprobabilidad de ocurrencia de cada letra, para codificarlo
con ms o menos bits. Pero hay que tener cuidado que sea un cdigo prefijo, es
decir, que ninguna palabra del cdigo constituye la palabra de otro cdigo y no
presentar ambigedad en la decodificacin.

En ciencias de la computacin y teora de la informacin, la codificacin


Huffman es un algoritmo usado paracompresin de datos. El trmino se refiere al
uso de una tabla de cdigos de longitud variable para codificar un determinado
smbolo (como puede ser un carcter en un archivo), donde la tabla ha sido
rellenada de una manera especfica basndose en la probabilidad estimada de
aparicin de cada posible valor de dicho smbolo. Fue desarrollado por David A.
Huffman mientras era estudiante de doctorado en el MIT, y publicado en "A
Method for the Construction of Minimum-Redundancy Codes".
La codificacin Huffman usa un mtodo especfico para elegir la representacin de
cada smbolo, que da lugar a uncdigo prefijo (es decir, la cadena de bits que
representa a un smbolo en particular nunca es prefijo de la cadena de bits de un
smbolo distinto) que representa los caracteres ms comunes usando las cadenas
de bits ms cortas, y viceversa. Huffman fue capaz de disear el mtodo de
compresin ms eficiente de este tipo: ninguna representacin alternativa de un
conjunto de smbolos de entrada produce una salida media ms pequea cuando
las frecuencias de los smbolos coinciden con las usadas para crear el cdigo.
Posteriormente se encontr un mtodo para llevar esto a cabo en un tiempo lineal
si las probabilidades de los smbolos de entrada (tambin conocidas como
"pesos") estn ordenadas.
Para un grupo de smbolos con una distribucin de probabilidad uniforme y un
nmero de miembros que es potencia de dos, la codificacin Huffman es

equivalente

una

codificacin

en

bloque

binaria,

por

ejemplo,

la

codificacin ASCII. La codificacin Huffman es un mtodo para crear cdigos


prefijo tan extendido que el trmino "codificacin Huffman" es ampliamente usado
como sinnimo de "cdigo prefijo", incluso cuando dicho cdigo no se ha
producido con el algoritmo de Huffman.
Aunque la codificacin de Huffman es ptima para una codificacin smbolo a
smbolo dada una distribucin de probabilidad, su optimalidad a veces puede
verse accidentalmente exagerada. Por ejemplo, la codificacin aritmtica y la
codificacin LZW normalmente ofrecen mayor capacidad de compresin. Estos
dos mtodos pueden agrupar un nmero arbitrario de smbolos para una
codificacin ms eficiente, y en general se adaptan a las estadsticas de entrada
reales. Este ltimo es til cuando las probabilidades no se conocen de forma
precisa o varan significativamente dentro del flujo de datos.

Pginas sobre el tema


Procesadores

digitales

http://iie.fing.edu.uy/ense/asign/dsp/proyectos/2002/compresion/comhuff.htm

Teora

de

la

informacin

mtodos

de

codificacin:

http://triana-

codificacion.blogspot.mx/2013/04/algoritmo-de-huffman.html

Conclusin
Todos estos temas, nos llevan a investigar sobre los procesos que realizan los
ordenes y conocer a fondo sobre su funcionalidad, en el texto se menciona el
cdigo Huffman y el Ascci, cdigos sin duda muy importantes en estos das, en
cuanto a la informtica.

Anda mungkin juga menyukai