Anda di halaman 1dari 10

Ayuda:Caracteres especiales

1
Ayuda:Caracteres especiales
Para una versin ms actualizada (en obras), ver meta:Ayuda:Caracteres especiales.
A partir de la versin 1.5 de MediaWiki, todos los proyectos usan la codificacin de caracteres Unicode (UTF-8).
Para ver qu caracteres corresponden con un proyecto se le pide al navegador que ensee el cdigo fuente de la
pgina y se ve:
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
o (el que esta pgina tiene):
<meta http-equiv="Content-type" content="text/html; charset=utf-8" />
Ayuda de edicin
Antes de comenzar
Cmo se edita una pgina
La interfaz de Wikipedia
Barra de herramientas de edicin
Creando un artculo
Manual de estilo
Estructura de un artculo
Cmo cambiarle el ttulo
(1) (2)
Cmo empezarlo
Cmo redactarlo mejor
Cmo aadirle imgenes
(3)
Cmo referenciarlo
(4)
Cmo categorizarlo
Cmo aadirle enlaces
interlingsticos
No lo firmes
(5) (6)
Clases de artculos
Los espacios de nombres
Modelos Anexos Redirecciones
Usando MediaWiki
Cronologas Listas Tablas
Plantillas Palabras mgicas
Caracteres especiales TeX LaTeX
Ms ayuda
Preguntas idiomticas
Transliteracin
Enlaces tiles
Dnde colaborar
Recursos
Recursos de dominio pblico
Imgenes de dominio pbilico
Ms recursos y herramientas
Ejemplos de peticiones de permiso
Varios caracteres que no forman parte del repertorio ASCII estndar resultan tiles incluso necesarios para las
pginas Wiki, especialmente las pginas internacionales. En principio, si se usa la moderna codificacin UTF-8 no
debera dar problemas, incluso permite en pginas escritas en varios idiomas simultneos poder leerse sin problemas.
Ayuda:Caracteres especiales
2
No importa si tienen caracteres rabes o chinos, todos estn incluidos. Si tienes tu sistema operativo actualizado para
usar el UTF-8 podrs escribir sin problemas y podrs leer igualmente sin problemas. Si ves que queda alguna pgina
antigua con cuadraditos en vez de letras acentuadas, aydanos a corregirlos.
As, si ves esta serie de acentos: (aeiou acentuadas) en vez de cuadraditos o letras raras, es que puedes leer lo
que est en UTF-8. Si necesitas ms informacin mira aqu: UTF-8
Esta pgina contiene recomendaciones sobre aquellos caracteres que se pueden utilizar con seguridad y cmo
usarlos. Existen tres formas de ingresar un carcter no-ASCII en una pgina Wiki aparte de usar el UTF-8 que
recomendamos:
Introduce el carcter directamente desde el teclado apropiado, o copindolo de alguna aplicacin tipo "mapa de
caracteres" y luego pegndolo, o por medio de recursos especiales que pueda ofrecer su sistema operativo, o
programa de edicin de texto. El servidor web deber entonces ser configurado para informar de qu juego de
caracteres de 8-bits se debe usar.
Utiliza una entidad de referencia HTML conocida, como por ejemplo &agrave;. ste es el mtodo ms seguro
y compatible, y no resulta ambiguo aun cuando el servidor no anuncia el uso de algn juego de caracteres
especial, e incluso cuando el carcter no se muestra apropiadamente en algunos navegadores.
Utiliza una entidad numrica de referencia HTML, como por ejemplo &#161;. Esto no se recomienda, ya que
muchos navegadores interpretan incorrectamente estas entidades como referencias al juego de caracteres nativo.
Sin embargo, sta es la nica forma de ingresar valores Unicode para los que no existe entidad alguna, como las
letras del idioma turco. Note que debido a que los caracteres a los que apuntan los valores 128 al 159 no se usan
tanto en ISO-8859-1 como en Unicode, las referencias en este rango como &#131; son invlidas y ambiguas,
aun cuando sean usadas con frecuencia por varios sitios web.
Caracteres ISO-8859-1
Los siguientes caracteres del conjunto ISO-8859-1 (uno de los cdigos ASCII extendido) se pueden usar con
seguridad en todas las pginas Wiki. La siguiente tabla lista el carcter en s, el cdigo para cada carcter en decimal
y en hexadecimal, el nombre de la entidad HTML, y el nombre comn del carcter.
Literal Hex Dec Entidad Carcter
00A0 0160 &nbsp; espacio que no produce saltos de lnea
00A1 0161 &iexcl; exclamacin de apertura
00A2 0162 &cent; signo de centavo
00A3 0163 &pound; signo de libra
00A4 0164 &curren; signo internacional de moneda
00A5 0165 &yen; signo de yen
00A7 0167 &sect; signo de seccin
00A8 0168 &uml; diresis
00A9 0169 &copy; signo de copyright
00AA 0170 &ordf; indicador ordinal femenino
00AB 0171 &laquo; comillas anguladas de apertura
00AC 0172 &not; signo de negacin lgica
00AE 0174 &reg; signo de marca registrada
00AF 0175 &macr; raya alta
00B0 0176 &deg; signo de grado
Ayuda:Caracteres especiales
3
00B1 0177 &plusmn; signo de ms/menos
00B4 0180 &acute; acento agudo
00B5 0181 &micro; signo de micro
00B6 0182 &para; signo de fin de pargrafo
00B7 0183 &middot; punto medio (coma georgiana)
00B8 0184 &cedil; cedilla
00BA 0186 &ordm; indicador ordinal masculino
00BB 0187 &raquo; comillas anguladas de cierre
00BF 0191 &iquest; signo de interrogacin de apertura
00C0 0192 &Agrave; A con acento grave
00C1 0193 &Aacute; A con acento agudo
00C2 0194 &Acirc; A con acento circunflejo
00C3 0195 &Atilde; A con tilde
00C4 0196 &Auml; A con diresis
00C5 0197 &Aring; A con anillo
00C6 0198 &AElig; Ligadura AE
00C7 0199 &Ccedil; C cedilla
00C8 0200 &Egrave; E con acento grave
00C9 0201 &Eacute; E con acento agudo
00CA 0202 &Ecirc; E con acento circunflejo
00CB 0203 &Euml; E con diresis
00CC 0204 &Igrave; I con acento grave
00CD 0205 &Iacute; I con acento agudo
- 00CE 0206 &Icirc; I con acento circunflejo
00CF 0207 &Iuml; I con diresis
00D1 0209 &Ntilde; N con tilde
00D2 0210 &Ograve; O con acento grave
00D3 0211 &Oacute; O con acento agudo
00D4 0212 &Ocirc; O con acento circunflejo
00D5 0213 &Otilde; O con tilde
00D6 0214 &Ouml; O con diresis
00D8 0216 &Oslash; O con barra
00D9 0217 &Ugrave; U con acento grave
00DA 0218 &Uacute; U con acento agudo
00DB 0219 &Ucirc; U con acento circunflejo
00DC 0220 &Uuml; U con diresis
00DF 0223 &szlig; doble s (alemn)
00E0 0224 &agrave; a con acento grave
00E1 0225 &aacute; a con acento agudo
Ayuda:Caracteres especiales
4
00E2 0226 &acirc; a con acento circunflejo
00E3 0227 &atilde; a con tilde
00E4 0228 &auml; a con diresis
00E5 0229 &aring; a con anillo
00E6 0230 &aelig; diptongo (ligadura) ae
00E7 0231 &ccedil; c cedilla
00E8 0232 &egrave; e con acento grave
00E9 0233 &eacute; e con acento agudo i co
00EA 0234 &ecirc; e con acento circunflejo
00EB 0235 &euml; e con diresis
00EC 0236 &igrave; i con acento grave
00ED 0237 &iacute; i con acento agudo
00EE 0238 &icirc; i con acento circunflejo
00EF 0239 &iuml; i con diresis
00F1 0241 &ntilde; n con tilde
00F2 0242 &ograve; o con acento grave
00F3 0243 &oacute; o con acento agudo
00F4 0244 &ocirc; o con acento circunflejo
00F5 0245 &otilde; o con tilde
00F6 0246 &ouml; o con diresis
00F7 0247 &divide; signo de divisin
00F8 0248 &oslash; o con barra
00F9 0249 &ugrave; u con acento grave
00FA 0250 &uacute; u con acento agudo
00FB 0251 &ucirc; u con acento circunflejo
00FC 0252 &uuml; u con diresis
00FF 0255 &yuml; y con diresis
20AB 20AB &dong; dong
Estos caracteres son un subconjunto de los smbolos ms frecuentemente usados en Internet del juego de caracteres
ASCII extendido, ISO 8859-1. Las pginas de Wikipedia son identificadas por el servidor como pginas con texto
ISO-8859-1. Los caracteres mencionados anteriormente son un grupo seleccionado para mejorar la compatibilidad
con otras mquinas.
Por ejemplo, el Apple Macintosh se utiliza con frecuencia para su uso en Internet, no se encuentra limitado a ningn
idioma en especial, y su juego de caracteres nativo (que no es ISO-8859-1) contiene muchos de los caracteres
internacionales. Varios navegadores para Macintosh traducen correctamente texto ISO en el juego de caracteres
nativo, siempre y cuando los caracteres usados estn disponibles. As que la tabla descrita antes es un subconjunto de
caracteres ISO-8859-1 que tambin se encuentran disponibles en el juego de caracteres nativo de Macintosh. El
documento de cdigo estndar 1252 de Microsoft Windows es un conjunto ampliado de ISO-8859-1, as que estos
caracteres tambin estn disponibles en mquinas Windows. Los juegos de caracteres latinos ms comunes aparte
del ISO-8859-1 son el documento de cdigo MS-DOS 437 (pre-Windows), el Macintosh Roman, y otros conjuntos
ISO como el ISO-8859-2. El nmero de mquinas pre-Windows MS-DOS con navegadores web es reducido y con
Ayuda:Caracteres especiales
5
frecuencia son mquinas dedicadas a un propsito especfico que no usaran Wikipedia de todas formas, as que es
razonablemente seguro sacrificar la compatibilidad con aquellas mquinas a favor de los caracteres extranjeros
necesitados. Otros conjuntos ISO por lo general estn orientados para ser ledos por otros navegadores que usan el
mismo juego de caracteres en un mismo pas, y por lo tanto esas pginas deberan utilizar un juego de caracteres
especfico a tal idioma.
Estos caracteres pueden ingresarse bien sea usando referencias a entidades HTML conocidas como &agrave;,
directamente por medio de algunos teclados, o por medio de cualquier tipo de recurso que est disponible al autor de
pginas Wiki que necesite ingresar estos caracteres. Por ejemplo, autores Wiki que usan mquinas Windows pueden
ingresar estos caracteres manteniendo pulsada la tecla Alt mientras que escriben el cdigo decimal de 4 dgitos
correspondientes al carcter en el sector numrico del teclado. Es importante que todos los 4 dgitos (incluyendo el 0
del comienzo) se ingresen; usando un cdigo de 3 dgitos producir que se ingresen caracteres de la obsoleta
codificacin 437. Autores Wiki que usan mquinas Macintosh deben tener cuidado de usar recursos especiales para
ingresar estos caracteres en formato ISO-8859-1 en lugar de hacerlo con el juego de caracteres nativo, o bien puede
usar las referencias a entidades HTML conocidas. Note que algunos usuarios de Windows pueden experimentar
problemas con versiones del navegador Microsoft Internet Explorer que utilizan "Alt-Flecha Izquierda" y
"Alt-Flecha Derecha" para el desplazamiento entre pginas. Estas combinaciones interfieren con el ingreso de
cdigos que contienen los dgitos 4 y 6. En este caso use referencias a entidades HTML.
Los caracteres de la tabla descrita pueden ser utilizados directamente como caracteres 8-bit en todas las pginas
Wiki, y son suficientes para todas las pginas escritas principalmente en ingls, espaol, francs, alemn e idiomas
que no requieren caracteres especiales aparte de aquellos (como el cataln). A pesar de su seguridad general, en este
momento, no es posible utilizar estos caracteres en ttulos de pginas Wiki en la Wikipedia en ingls, aunque algunos
de los Wikipedia Internacionales se encuentran configurados para aceptarlos.
Caracteres inseguros
Note en especial lo que hace falta aqu del juego de caracteres ISO-8859-1 completo: La barra vertical partida
(0166=&brvbar;), el guion suave (0173=&shy;), los dgitos en superndice (0178=&sup2;,
0179=&sup3;), las fracciones comunes (0188=&frac14;, 0189=&frac12;, 0190=&frac34;), los
caracteres eth y thorn islandeses (0208=&ETH;, 0240=&eth;, 0222=&THORN;, 0254=&thorn;), y el
signo de multiplicacin (0215=&times;). Estos deberan considerarse inseguros (aparte existen sustitutos
adecuados para muchos de ellos).
Debe tenerse especial cuidado con aquellos caracteres que existen en el juego de caracteres nativo de algunas
mquinas populares pero no en el conjunto mencionado anteriormente. No son seguros, aun cuando posiblemente
usted los vea correctamente cuando los usa. Entre los caracteres que forman parte del documento de cdigo 1252
Windows pero no del ISO-8859-1 se encuentran el signo del euro (&euro;), la cruz y la doble cruz (&dagger;,
&Dagger;), la vieta (&bull;), el signo de marca registrada (&trade;), los signos de puntuacin con estilo (ver
ms adelante), el signo por mil (&permil;), algunas letras con acento carn de Europa Oriental, y los dgrafos oe.
Entre los caracteres del juego de caracteres Macintosh Roman que no forman parte del ISO-8859-1 se encuentran la
cruz y doble cruz, la vieta, el signo de marca registrada, algunos pocos smbolos matemticos como el infinito
(&infin;) y el no-igual (&ne;), algunas letras griegas comnmente usadas como pi (&pi;), dgrafos (ligaduras)
como oe y fl, signos de puntuacin con estilo, el signo de por mil, y algunos acentos como el breve, onogek y el
carn.
El lenguaje de etiquetas HTML 4.0
[1]
define entidades para algunos caracteres latinos no incluidos en el ISO-8859-1
y que son utilizados por idiomas populares, como el dgrafo OE (&OElig;, &oelig;), la Y mayscula con
diresis (&Yuml;), y algunos caracteres de Europa Oriental con acentos como &scaron;. Estos tambin son
inseguros; aun cuando si se ingresan como referencias a entidades HTML, puede que se muestren correctamente en
algunas mquinas.
Ayuda:Caracteres especiales
6
En resumen, no asuma que es seguro utilizar algn carcter especial solo porque se ve bien en su mquina. Utilice
los caracteres de la tabla listada antes, y lea y entienda cmo usar los otros que se mencionan ms abajo.
Caracteres no-ISO posiblemente utilizables
Desde hace ya muchos aos la web est basada en el repertorio de caracteres Unicode. Se pueden tomar muchos
caracteres de este conjunto extendido, ingresndolos ya sea como referencias a entidades HTML o directamente. Los
navegadores web los reconocen e interpretan correctamente, quizs utilizando fuentes de carcter alternativas segn
se requiera. Todos estos caracteres deben ser considerados menos seguros que los mencionados antes, pero solo en el
sentido de que puede que no se muestren apropiadamente en algunas mquinas, aunque en forma de referencias a
entidades HTML no resultan ambiguos, y preservan la integridad de los datos.
Para muchos de estos, se encuentran disponibles sustitutos adecuados y arreglos, y deberan ser utilizados cuando la
importancia de hacer el texto adecuado para usuarios de mquinas y software antiguo sobrepasa la importancia que
puede tener una buena presentacin para aquellos con software ms reciente (a juicio del autor o editor).
Signos de puntuacin con estilo
Ausentes en el juego de caracteres ISO-8859-1, pero utilizados con frecuencia y presentes tanto en los conjuntos
Macintosh Roman como en el documento de cdigo Windows 1252, y posteriormente incluidos en Unicode, existen
algunos signos de puntuacin (comillas y rayas) apropiados para idiomas como el ingls y el espaol que poseen
cierto estilo nico. Estos pueden ingresarse como referencias a entidades, y deberan mostrarse correctamente en la
mayora de mquinas. Incluso algunos navegadores de modo texto son capaces de realizar las sustituciones
apropiadas utilizando simples comillas y rayas de ASCII plano. Muchas de estas referencias no existan en versiones
antiguas de HTML, por lo que es posible que no sean reconocidas por software poco reciente. Ya que utilizando
estos caracteres se mantiene la integridad de los datos incluso en aquellas mquinas que no los muestran
correctamente, se pueden considerar seguros de usar a menos que un despliegue adecuado en software antiguo sea
crtico. Las comillas alemanas "low-9" son un caso similar, pero es menos frecuente que sean traducidas por
software, y por lo tanto no son tan seguras. La siguiente tabla muestra estos caracteres precediendo a una "O"
mayscula para mejor visibilidad:
O &lsquo; comilla izquierda sencilla
O' &rsquo; comilla derecha simple
O &ldquo; comilla izquierda doble
O &rdquo; comilla derecha doble
O &mdash; raya larga
O &ndash; raya corta
O &sbquo; comilla low-9 sencilla
O &bdquo; comilla low-9 doble
Muchos sitios web orientados a una audiencia de usuarios de Windows utilizan entidades tomadas del cdigo 1252
para estos caracteres: por ejemplo, utilizando &#151; para la raya larga. Esta no es una prctica aceptable, ya que
se estara haciendo referencia en realidad al cdigo 151 de Unicode, que slo tiene un caracter de control. Con el
propsito de asegurar la futura integridad de los datos y mxima compatibilidad, se deben reescribir estos caracteres
a referencias como &mdash;.
Ayuda:Caracteres especiales
7
Letras griegas y smbolos matemticos
Tradicionalmente para representar letras del alfabeto griego y otros smbolos matemticos en el entorno Windows
era comn el uso de la tipografa Symbol. Con la adopcin generalizada de Unicode este mtodo es no slo obsoleto
sino errneo. Para usar estos smbolos, ahora es necesario usar, como ya se dijo, entidades HTML o simplemente
tipearlos (o copiarlos, ya que no suelen estar en los teclados).
Las letras griegas maysculas y minsculas simplemente usan sus nombres completos como entidades. Estos
caracteres deberan, por supuesto, ser utilizados nicamente para representar letras griegas ocasionales en texto
principalmente latino. Texto realmente griego debera ser escrito utilizando un juego de caracteres griego para evitar
archivos sobrecargados y de pobre respuesta. Aqu hay algunos ejemplos:
&alpha;
&Gamma;
&beta;
&Lambda;
&gamma;
&Sigma;
&pi;
&Pi;
&sigma;
&Omega;
&sigmaf; (sigma "final", nicamente en minscula)
Otros smbolos matemticos comunes:
< &lt;
> &rt;
&ne;
&prime;
&le;
&Prime;
&ge;
&part;
&equiv;
&int;
&asymp;
&sum;
&infin;
&prod;
&radic;
Muchos de los smbolos en la fuente de carcter de Windows "Symbol" usados para interpretar smbolos
matemticos (como los segmentos de corchetes expandibles) no estn presentes en muchas otras mquinas, y ni
siquiera estn presentes en el Unicode 3.1 o como entidades HTML (aunque se encuentran planeados para Unicode
Ayuda:Caracteres especiales
8
3.2). Estos son utilizados en productos como TtH para interpretar ecuaciones. No es posible hoy en da utilizar estos
caracteres en pginas web de forma compatible para todos los lectores.
Otros smbolos comunes
Algunos caracteres como la vieta, el signo de la moneda euro, y el signo de marca registrada son casos especiales.
Es muy factible que sean asimilados e interpretados de alguna manera en muchos navegadores. Debido a que son
importantes para el comercio internacional, muchos sistemas los agregan a fuentes de carcter en alguna ubicacin
no-estndar y los interpretan cuando se solicitan, o de lo contrario simplemente los interpreta en modos especiales
que no requieren que se encuentren presentes en alguna fuente. Consulte la tabla a continuacin para ver cmo
interpreta su navegador los siguientes smbolos:
&bull; Vieta
&euro; Signo de la moneda euro
&trade; Signo de marca registrada
Entre otros smbolos un poco menos comunes se encuentran los siguientes:
&dagger; cruz
&Dagger; doble cruz
&loz; diamante
&permil; signo por mil
&larr; flecha hacia la izquierda
&uarr; flecha hacia arriba
&rarr; flecha hacia la derecha
&darr; flecha hacia abajo
&spades; pinta negra de espadas
&clubs; pinta negra de picas
&hearts; pinta negra de corazones
&diams; pinta negra de diamantes
&lsaquo; comilla angulada sencilla de apertura
&rsaquo; comilla angulada sencilla de cierre
El uso de estos smbolos debe considerarse inseguro, excepto quiz en pginas orientadas a una audiencia especfica
que muy probablemente utilice software bastante actualizado sobre mquinas populares.
Unicode
La codificacin de caracteres Unicode UCS-4 es la codificacin de caracteres oficial en HTML 4.0
[2]
. Muchos
navegadores, sin embargo, solo son capaces de mostrar un pequeo subconjunto del repertorio completo UCS-4. Por
ejemplo, los cdigos &#1049; &#1511; &#1605; se despliegan en su navegador como , , y , los cuales
idealmente deberan verse como la letra cirlica "I corta", la letra hebrea "qof", y la letra arbiga "mim",
respectivamente. Es poco probable que su computador tenga todas esas fuentes y las muestre correctamente, aunque
puede que muestre algunas de ellas. En cualquier caso, debido a que estos caracteres estn codificados de acuerdo al
estndar, debern mostrarse correctamente en cualquier sistema que cumpla con el estndar y tenga disponibles los
caracteres. Referencias a entidades numricas son la nica manera de ingresar estos caracteres en una pgina Wiki
por el momento. Note que codificarlos utilizando decimal en lugar de hexadecimal (por ejemplo &#1049; en lugar
Ayuda:Caracteres especiales
9
de &#x419;) incrementar el nmero de navegadores en los que la referencia dar resultado.
Vea tambin Unicode y HTML para consultar tablas de entidades de caracteres.
Referencias
[1] http:/ / www. w3. org/ TR/ html4/
[2] http:/ / www. w3. org/ TR/ html4/ charset.html#entities
Fuentes y contribuyentes del artculo
10
Fuentes y contribuyentes del artculo
Ayuda:Caracteres especiales Fuente: http://es.wikipedia.org/w/index.php?oldid=65724467 Contribuyentes: Abdon3, Alhen, Amanuense, Axxgreazz, CHUCAO, Cillas, Comae, Copydays,
Damifb, DarkInVader, Diegusjaimes, Dodo, FrancoGG, Gustronico, Humberto, Icvav, Jarisleif, Javier Carro, Jesuja, JorgeGG, Kokoo, Kordas, Krous, Kurt86, Lasneyx, Leonardo, Mali loura,
ManuelGR, Matdrodes, Metrnomo, Muro de Aguas, Niqueco, Noilegrus, Pablo.cl, Pahpaha, Pfootios, Platonides, Psion7s, Plux, Qrc2006, Qu3tzalc0atl5, Sabbut, Sanbec, Supersouissi,
Trebol6, Unai Fdz. de Betoo, Xmtbumyxsimpson, Yrithinnd, conversion script, 70 ediciones annimas
Licencia
Creative Commons Attribution-Share Alike 3.0 Unported
//creativecommons.org/licenses/by-sa/3.0/

Anda mungkin juga menyukai