Resumen.
Se definen las figuras geomtricas de n dimensiones y se muestra su estructura matemtica
para su descripcin completa, al menos al nivel de su forma exterior. Se generalizan las
frmulas matemticas correspondientes hasta el lmite de n en infinito. Se procede a
mostrar su aplicacin para la estadstica, haciendo primero una descripcin geomtrica del
teseracto como la figura bsica representativa de la cuarta dimensin, aunque esto no niega
la posibilidad de aplicacin en dimensiones superiores. En segundo lugar, se trata ms en
concreto la utilidad del teseracto para fines de estadstica descriptiva, sugiriendo diversas
interpretaciones grficas ilustrativas.
Abstract.
We define the geometric figures in n dimensions, with their mathematical structure for a
full description, at least at its outer shape level. The corresponding mathematical formulas
are generalized from the limit of n to infinity. We proceed to show the application to
statistics, by first making a geometric description of the tesseract as the basic representative
figure of the fourth dimension, but this does not forbid the possibility of future applications
in higher dimensions. Secondly, we work in the specific use of the teseracto in the context
of descriptive statistics, suggesting various illustrative graphical interpretations.
Palabras clave.
Teseracto, hipercubo, grficos, estadstica descriptiva, anlisis multidimensional.
Keywords.
Tesseract, hypercube, graphics, descriptive statistics, hyperdimensional analysis.
INTRODUCCIN.
Es posible comprender todas las figuras regulares posibles de un universo que contenga n
dimensiones? Cmo ello puede ayudar en el contexto de la estadstica aplicada?
Nos vamos a mover desde un marco puramente geomtrico y matemtico, hacia sus
implicaciones para la formacin de figuras de n dimensiones y cmo ello puede ser usado
en la estadstica aplicada. Por lo general, se supone que no es posible visualizar la cuarta
dimensin, inclusive que imaginarla es psicolgicamente imposible. No obstante, aqu
partimos de la hiptesis contraria, utilizando una perspectiva original que nos permitir
describir en forma suficientemente clara las figuras regulares de n dimensiones, rompiendo
con el esquema habitual.
En los libros de texto de estadstica descriptiva se nos dice por lo general lo mismo, que
se pueden graficar hasta 3 variables en una hoja plana, utilizando los ejes (x,y,z), pero no es
posible ir ms all porque no se pueden visualizar cuatro dimensiones, menos cinco o
seis. Nuestra perspectiva critica tal enfoque desde su origen, mostrando que la cuarta
prueba al infinito podra ser resuelta a travs del lmite de n hasta el infinito en las
respectivas funciones. Una manera simple de ilustrar esto es recurrir a la frmula
generalizada que se define como:
Sm(n) = 2n (n/2) ((n-1)/4)) ((n-2)/6)) ((n-3)/8)) ..... ((n-(m-1))/2m)
Donde m debe ser mayor que 4, y n mayor que 0.
Los trminos en m representan constantes que se fijan cuando se escoge el nivel de la
magnitud o trazo a considerar. Con ello son matemticamente generados todos los nmeros
enteros que aparecen en la frmula. Ahora bien, suponiendo que m es igual a n, podemos
saber cuntas figuras de la dimensin correspondiente a su misma magnitud existen para
todos los hipercubos de tamao n hasta infinito. Al atar el smbolo m con el smbolo n
podemos decir que, para todo m igual a n, esto es, en la diagonal de la matriz:
Sm(n) = 2n (n/2) ((n-1)/4)) ((n-2)/6)) ((n-3)/8)) ..... ((n-(n-1))/2n)
Sm(n) = (2n / 2n) (n/1) ((n-1)/2)) ((n-2)/3)) ((n-3)/4)) ..... (1/n)
Observando que la cadena de enes de arriba, es idntica a la cadena de enes de
abajo, tenemos necesariamente: Sm(n) = (2n / 2n) = 1.
Esto significa, que siempre que m sea igual a n, es decir, en el nivel de la figura
correspondiente a la ensima dimensin, slo va a existir una figura. En otras palabras, slo
hay un hexeracto en la sexta dimensin, slo hay un hepteracto en la sptima dimensin, y
as sucesivamente hasta llegar a infinito. Es lgico adems que, en la matriz, debajo de la
diagonal desde la dimensin 1 hasta la n-1, no se forme ninguna figura. Probmoslo:
sabemos que la matriz tiene unos en toda la diagonal, y ceros debajo de la diagonal,
entonces, se puede especular con bastante seguridad, que el valor ubicado en el punto (n,m)
cuando n y m tienden a infinito es de 1. As que slo hay una figura que cumple las
condiciones. Puesto que tal figura tiene, aparentemente, infinito nmero de todas las figuras
inferiores, se puede especular que se trata de una esfera n-dimensional. El cmo se pueda
alguien imaginar una esfera n-dimensional suena misterioso, aunque parece claro que no
tendra ninguna irregularidad, puesto que sera perfectamente igual vista desde todas las
direcciones, de forma que si se le girara quedara exactamente igual y no se le podran ver
protuberancias, vrtices o esquinas en ninguna perspectiva. sta es, en nuestra opinin, una
buena imagen de una esfera n-dimensional (no confundirla con una esfera comn).
2. LAS N DIMENSIONES EN LA ESTADSTICA APLICADA.
2.1. DESCRIPCIN DEL TESERACTO.
En esta segunda parte nos ocuparemos de la importancia de las figuras de n dimensiones en
la estadstica aplicada. Nos centraremos en el teseracto, aunque se puede continuar el
anlisis por analoga a otros niveles dimensionales.
Primero, asignaremos smbolos (equivalentes a colores) a los ocho cubos del teseracto.
El primer cubo o cuarto ser M (morado), los seis que representan las salidas a los cuartos
contiguos para cada pared sern: V (verde), Am (amarillo), A (azul), B (blanco), R (rojo) y
Na (naranja). V es la pareja contraria de A, B es la pareja contraria de Am, y R la pareja
contraria de Na, esto es, van en direcciones opuestas. El ltimo cubo ser el cubo destino N
(negro), slo accesible desde los 6 intermedios.
Hasta la tercera dimensin se acostumbra utilizar al espacio fsico como una direccin
anloga, esto es: derecha-izquierda, arriba-abajo, y frente-atrs. Lo que corresponde a las
direcciones acostumbradas en un grfico tridimensional. Cabe advertir que esto podra ser
distinto, puesto que es factible usar varias direcciones temporales. No obstante, para
mantenernos en un contexto conocido, respetaremos este orden habitual.
Introducimos al tiempo como la cuarta dimensin, de tal manera que el cubo M estara
en el tiempo original, y el cubo N en el tiempo final (Figura 1). Denotaremos esto por el
tiempo 0 y el tiempo 1, o bien, el tiempo presente y el tiempo futuro. Obsrvese que desde
esta perspectiva no hay limitaciones para regresarse en el tiempo puesto que slo estamos
describiendo una figura terica, de tal manera que no tenemos las limitaciones habituales
del espacio-tiempo de Einstein que slo fluye (en apariencia) en una direccin (del pasado
al futuro). No obstante, por lo dems, el tiempo funciona de la manera usual, permitiendo
introducir el movimiento de los objetos que se encontraran en la cuarta dimensin.
Recurdese que hasta la tercera dimensin no podra existir movimiento en absoluto puesto
que no habra variable tiempo, slo tendramos objetos congelados: pensar en objetos que
se mueven slo en las tres primeras dimensiones debe entenderse en trminos simplistas.
Figura 1
Diagrama del teseracto visto desde M hacia N
promedio de los dos tiempos, puesto que de abajo hacia arriba estaramos midiendo el
tiempo. No se generara ninguna confusin de variables siempre que se tenga presente que
en cada pared una longitud puede estar midiendo tanto la variable involucrada como el
tiempo. De la misma manera que lo podemos hacer en un grfico bidimensional usual, en
donde la vertical puede medir simultneamente el tiempo y la frecuencia de la variable
involucrada, incluso con varios tiempos y cambios de escala en el mismo grfico siempre
que se especifique el patrn o color que corresponde a cada lnea, trazo o curva. Slo el
octavo cubo, denotado aqu como N, sera diferente en el sentido de que tendra que
corresponder a la variable Ingreso en el tiempo final 1.
En cuanto a la geometra, hay que recordar que del cuarto original se puede salir por
cualquiera de las paredes a cada una de las 6 variables adyacentes, y si se contina en la
misma direccin, en el siguiente paso se llega necesariamente al cubo N (y por tanto al
tiempo 1) por ser el opuesto al cubo M. Puesto que arriba y abajo estn los cuartos M y N,
puede parecer que no hay acceso entre ellos, pero eso se remedia cambiando de perspectiva
el teseracto. Adems, si salimos del cuarto V y continuamos en la misma direccin un paso
ms, nos encontraremos en el cuarto contrario a V, en este caso el A, y estaremos
exactamente en el mismo tiempo que se haya definido de acuerdo al prrafo anterior. Esto
es, los 6 cuartos adyacentes estn exactamente en el mismo tiempo, o en rebanadas del
tiempo 0 al tiempo 1 (Figura 2) si se quiere decir de una manera ms precisa. Por fin, si
continuamos en la misma direccin, regresaremos al cuarto M, en el tiempo 0 original.
Figura 2
El Teseracto visto desde el cuarto V
Otra posible descripcin geomtrica, que de hecho parece idntica, se puede hacer
imaginando que en cada movimiento de cuarto a cuarto el cubo se desplaza 90 grados en la
misma direccin. En el cubo original el tiempo se mide de abajo hacia arriba, y tomando la
perspectiva correcta, en los 6 cubos adyacentes estaramos viendo el tiempo rebanado
desde 0 hasta 1. Podemos imaginar un reloj que indica el tiempo en cada rebanada y que del
tiempo 0 al 1 pasan 10 minutos, entonces en cada una de las 10 rebanadas de los 6 cubos
podramos ver que el reloj va marcando el minuto 1, el minuto 2, y as sucesivamente hasta
llegar a la ltima rebanada que marcara el minuto 10. De repente puede parecer que no es
as, porque eventualmente nos encontraramos de cabeza, pero el truco est en volverse a
colocar en la perspectiva correcta viendo el tiempo 0 en el piso, y el tiempo 10 en el techo.
El cubo N estar en 180 grados y por tanto en 10 minutos y el cubo M en 360 grados y por
tanto en el tiempo 0. Esto ilustra el uso del tiempo en el teseracto, as que no requerimos
conocer los valores de las variables en cada uno de los 10 minutos, sino que nos bastar con
dos valores del Ingreso o un slo valor temporal en los 6 cubos adyacentes.
2.2. UTILIDAD PARA LA ESTADSTICA APLICADA.
Esta cuestin ser complicada porque nos veremos obligados a cambiar los grficos de
perspectiva. Pero, en principio, tomadas las debidas reservas, la representacin parece
posible y eficaz.
Ya sabemos que el cuarto inicial M est conectado con sus seis adyacentes. Tomemos,
por ejemplo, el camino verde y miremos hacia la pared del color respectivo. En tal pared
podramos colocar, para empezar, el grfico de dispersin entre M y V en el ao inicial. Si
estn correlacionados positivamente tendremos una bonita imagen de la nube de puntos
entre las dos variables. Esto es vlido para todas las 6 paredes posibles. Tambin podramos
incluir el coeficiente de correlacin de Pearson para tener un valor matemtico asociado,
obviamente R2 medir la calidad del ajuste en trminos del porcentaje de la varianza
explicada. Por analoga lo mismo sera vlido para el cubo negro en el tiempo final.
Tambin podramos colocar en las paredes los grficos de dispersin correspondientes para
el tiempo promedio, siempre que indiquemos con claridad lo que estamos haciendo. En fin,
las paredes podran usarse como pantallas flexibles que se pueden sustituir con el uso del
software adecuado, simplemente colocando un botn o men que nos permitiera acceder al
grfico que necesitamos, respetando la geometra correspondiente.
Si pasamos al nivel en que estn las 6 variables independientes, habra 6 paredes en cada
cuarto, por ejemplo el verde, que nos mostraran arriba y abajo los mismos diagramas de
dispersin temporales ya mencionados, y en las 4 paredes restantes las variables que estn
directamente adyacentes. De nuevo, all podramos colocar los grficos de dispersin
respectivos, que ahora comparan, cada uno, 2 variables independientes. Las variables
faltantes se pueden acceder dando 2 pasos en cualquier direccin para llegar al cuarto
opuesto, donde podramos colocar el grfico de dispersin correspondiente. Para el
software se colocara un botn que nos indicara que estamos viendo la conexin entre
cuartos opuestos, que en realidad no son adyacentes. Con imaginacin seguramente se
podran disear ms grficas, recordando que todas las 6 variables independientes estn en
el mismo tiempo (o un promedio del tiempo inicial y final si usamos tasas de crecimiento).
Hemos estado trabajando con 6 variables independientes. Ahora resultar ms claro que,
en un ejemplo caracterstico, es mejor trabajar slo con 3, usando las variables de los
cuartos opuestos como variables espejo, esto es, duplicndolas. Con ello seguiremos
visualizando al teseracto, con sus 8 cubos completos, y mantendremos en todas las paredes
los diagramas de dispersin. Por supuesto que los grficos que estn en los cuartos opuestos
en tiempos iguales sern puntos colocados en 45 grados sobre la diagonal y no tendrn
significado estadstico alguno por tratarse de la misma variable, pero en compensacin, no
romperemos la estructura de la figura. Al experimentar con esto notaremos que a veces los
ejes de los cuartos se tienen que modificar de direccin, esto es, se tienen que poner como
crecientes o decrecientes segn convenga para que se pueda apreciar la figura correcta, pero
estos son problemas de pura perspectiva, con los que se requiere lidiar para romper con
nuestra costumbre de ver slo grficos planos. De manera similar podemos trabajar con 2, 4
o 5 variables independientes, usando las variables espejo como relleno.
Hemos visto que el tiempo transcurre desde el cubo M hacia el cubo N, adems de que
hemos explicado por qu en principio se tiene que usar slo un eje de carcter temporal.
Esta perspectiva es muy ventajosa porque podremos ver la evolucin de la variable
dependiente, en este caso el ingreso, no slo desde su respectivo cuarto, sino que cuando
unamos el cuarto inicial con el cuarto final, podremos dibujar la trayectoria de la nube de
datos de la variable ingreso desde el tiempo cero hasta el tiempo 1 de forma anloga al
tiempo normal. De hecho, si tuviramos los datos continuos de todos los momentos
podramos ver el movimiento de la variable paso a paso, lo que colocado en un espacio de
tres dimensiones, es el equivalente a una pelcula o clip de video que puede perfectamente
ser visualizado con la ayuda de una computadora. Por analoga, podramos hacer lo mismo
con todas las dems variables implicadas en el problema. Una presentacin ms simple se
podra hacer con tasas de crecimiento, o con flechas que vinculen el tiempo original y final.
Ahora bien, nos hemos concentrado en el exterior del teseracto, pero realmente, cuando
los 8 cubos del teseracto se envuelven conforman un espacio de 4 dimensiones que tambin
podemos intentar visualizar. En principio sera imposible ver directamente todo lo que est
sucediendo dentro del teseracto pero ello no impide que podamos hacernos una buena idea
de cmo utilizarlo para la estadstica aplicada. La visualizacin de las 6 variables
independientes
es
prcticamente
imposible,
excepto
que
usemos
tcnicas
de
independientes y/o por una variable dependiente, la asociacin entre tales puntos se puede
visualizar a la manera de un clip de video. Tambin se pueden usar grficos
tridimensionales que incluyan flechas que asocien las variables, pero en tal caso la
visualizacin se hace ms difcil. La utilizacin de tasas de crecimiento constante entre el
perodo inicial y final simplifica el problema, aunque no lo resuelve, por lo que el uso del
teseracto puede ser no slo til, sino parte integral de una visualizacin autntica.
REFERENCIAS.
Anderson, T. W. (1984). An introduction to Multivariate analisys. New York, USA: Wiley
& Sons.
Coxeter, H. S. M. (1948). Regular polytopes. Londres, England: Methuen y Co. Ltd., pg.
120.
Gardarin , G. (1987). Bases de datos. Madrid, Espaa: Paraninfo.
Gelfand, I. M. (1994). Discriminants, resultants, and multidimensional analisys. New York,
USA: Wiley & Sons.
Jonathan, R. (2014). Multivariate methods for the statistical analysis of hyperdimensional
high-content screening data. Massachusetts, USA: Massachusetts Institute of
Technology.
Jones, T. R. et al. (2008). CellPro ler Analyst: data exploration and analysis software for
complex image-based screens. BMC Bioinformatics, 9, 482.
Nortes Checa, A. (1977). Estadstica teorica y aplicada. Burgos, Espaa: S. Rodrguez.
sociales.
http://www.uv.es/ceaces/.
Valencia,
Espaa,
Direccin
de
internet: