Las Matemáticas del Cubo de Rubik

1. Introducción

El cubo de Rubik es uno de los rompecabezas más populares de la historia. Prácticamente todos los aficionados a las matemáticas hemos tratado de aprender a resolverlo en algún momento de nuestras vidas. Creado por el arquitecto y escultor Ernő Rubik en 1974, este juguete es considerado el más vendido del mundo, con más de 450 millones de cubos distribuidos hasta 2020[1]. Su fama se explica sola en cuanto tenemos la oportunidad de tenerlo en nuestras manos un rato. La cantidad de maneras diferentes que existen para resolverlo, o los patrones bonitos que podemos hacer con él, son solo dos de los objetos de estudio que han motivado que expertos de todo el mundo le hayan dedicado mucho tiempo de investigación. En concreto, en este artículo veremos cómo la teoría de grupos nos puede ayudar a comprender mejor la estructura del cubo y sus características principales. Recorreremos primero los conceptos matemáticos necesarios, y después analiza remos cuáles son las configuraciones que se pueden dar en un cubo de Rubik.

2. Teoría de grupos

En matemáticas, un grupo es una estructura algebraica formada por un conjunto no vacío GG dotado de una operación binaria (es decir, que opera dos elementos para devolver otro) que cumple una serie de propiedades:

  • Operación interna: Cuando operamos dos elementos cualesquiera de G, obtenemos otro elemento que también pertenece a G.
    :G×GG*:G\times G \rightarrow G
  • Elemento neutro: Existe un elemento ee en GG tal que: ge=eg=gg*e=e*g=g para todo gg en GG.
  • Elemento inverso: Para todo elemento gg de GG, existe g1g^{-1} en GG tal que
    gg1=g1g=e.g*g^{-1}=g^{-1}*g=e.
  • Asociatividad: Para cualesquiera tres elementos g,h,kg,h,k de GG se tiene que
    (gh)k=g(hk).(g*h)*k=g*(h*k).

Veamos un par de ejemplos sencillos. Al escoger los números naturales (sin el cero) con la operación suma, no estamos frente a un grupo ya que carece de elemento neutro. Es decir, necesitaríamos que existiera un número ee en GG tal que e+1=1e+1=1 y 1+e=11+e=1. Nosotros sabemos que ese ee ha de ser el 0; pero este no pertenece al conjunto que acabamos de definir. Por lo tanto, no estamos ante un grupo. Distinto es el caso de los números enteros con la suma. Ahora sí que tenemos elemento neutro (el 0); la operación es cerrada (al sumar dos enteros obtenemos otro entero) y todo elemento xx tiene un inverso x-x ya que x+(x)=0x+(-x)=0. Por útlimo, comprobamos que la propiedad asociativa también se cumple, y concluimos que ahora sí que estamos ante un grupo.

Un tipo de grupo muy especial, y que nos va a ser útil en el resto del artículo, viene dado por el grupo de permutaciones. Este viene dado por las funciones biyectivas de un conjunto en sí mismo con la operación composición de estas funciones. Es decir, el conjunto de todas las maneras en que podemos reordenar los elementos del conjunto. Vamos a ver un ejemplo sencillo: el grupo S4S_{4}. Este es el grupo de permutaciones de los elementos 1,2,3,4{1,2,3,4}. En este caso existen 24 permutaciones posibles:

1 → 1
2 → 2
3 → 3
4 → 4
1 → 1
2 → 2
3 → 4
4 → 3
1 → 1
2 → 3
3 → 2
4 → 4
1 → 1
2 → 3
3 → 4
4 → 2
1 → 1
2 → 4
3 → 2
4 → 3
1 → 1
2 → 4
3 → 3
4 → 2
1 → 2
2 → 1
3 → 3
4 → 4
1 → 2
2 → 1
3 → 4
4 → 3
1 → 2
2 → 3
1 → 3
4 → 4
1 → 2
2 → 3
3 → 4
4 → 1
1 → 2
2 → 4
3 → 1
4 → 3
1 → 2
2 → 4
3 → 3
4 → 1
1 → 3
2 → 1
3 → 2
4 → 4
1 → 3
2 → 1
3 → 4
4 → 2
1 → 3
2 → 2
3 → 1
4 → 4
1 → 3
2 → 2
3 → 4
4 → 1
1 → 3
2 → 4
3 → 1
4 → 2
1 → 3
2 → 4
3 → 2
4 → 1
1 → 4
2 → 1
3 → 2
4 → 3
1 → 4
2 → 1
3 → 3
4 → 2
1 → 4
2 → 2
3 → 1
4 → 3
1 → 4
2 → 2
3 → 3
4 → 1
1 → 4
2 → 3
3 → 1
4 → 2
1 → 4
2 → 3
3 → 2
4 → 1

Cada permutación de las anteriores se puede describir en forma de ciclo de la siguiente manera:

En la expresión en ciclos de la primera permutación, se entiende que el número 1 va a parar a la posición del 2; el 2 va al 3; el 3 al 4, y el 4 vuelve a la posición del 1. En el segundo ejemplo tenemos dos ciclos separados; es decir el 1 va al 2 y el 2 al 1; y el 3 va al 4 y el 4 al 3. En el último caso, el 1 y el 2 se quedan donde están, por lo que no hace falta que los escribamos.

Ahora podemos definir la operación composición de dos permutaciones A y B como ABA \circ B, que no es más que el resultado de primero aplicar B y después A. El conjunto de permutaciones con la composición de las mismas tiene estructura de grupo, y es un buen ejercicio para el lector comprobarlo.

Solamente nos queda ver un resultado muy importante, y es que toda permutación se puede escribir como composición de trasposiciones (esto son permutaciones de dos elementos). Por ejemplo (1234)=(12)(23)(34)(1234)=(12)(23)(34). Puedes probar en un papel a ejecutar las permutaciones de derecha a izquierda (primero (34), luego (23) y luego (12)) y verás como el resultado es el mismo que haciendo (1234). Diremos que una permutación tiene signo par cuando se descompone en un número par de trasposiciones; y signo impar cuando se descompone en un número impar de ellas. Un resultado algo más avanzado que puede ser interesante para quienes ya tengan alguna noción en teoría de grupos, es el siguiente: si una permutación se puede descomponer en un número par (impar) de trasposiciones, entonces todas las demás descomposiciones posibles en trasposiciones de dicha permutación también son pares (impares). De este modo podemos definir la signatura sin problema.

3. El cubo de Rubik como grupo

Antes de adentrarnos en las matemáticas del cubo de Rubik, necesitamos introducir la notación de Singmaster con la que vamos a trabajar. Asignaremos a cada cara una letra del siguiente modo:

  • F (Front): Cara frontal
  • B (Back): Cara trasera
  • U (Up): Cara que queda hacia arriba
  • D (Down): Cara que queda hacia abajo
  • R (Right): Cara derecha
  • L (Left): Cara izquierda

Con estas letras podemos transcribir todos los movimientos posibles que se le pueden hacer al cubo. Denotaremos por X el giro de dicha cara 90º en sentido horario, y por X’ el giro de 90º en sentido antihorario, al poner dicha cara frente a nosotros y mirar hacia el centro del cubo. Si queremos hacer dos movimientos seguidos los escribimos de izquierda a derecha, es decir: R’F es el resultado de primero girar la cara derecha en sentido antihorario y después la cara frontal en sentido horario.

Ya estamos muy cerca de ver cuál va a ser el grupo con el que vamos a trabajar. Si lo pensamos con detalle, girar una cara no es más que permutar entre sí las piezas que hay en ella. Coge tu cubo y gira en sentido horario la cara frontal. Lo que has hecho ha sido permutar sus piezas tal y como se muestra en el siguiente dibujo:

Esta permutación que acabamos de estudiar es la que antes hemos denotado por la letra F. Sucede algo análogo cuando movemos el resto de las caras; que siempre lo podemos describir en forma de permutación. ¡Ojo! Para este artículo, cuando describamos permutaciones hablaremos de las piezas que movemos, independientemente de su orientación. Es decir, en el ejemplo anterior hemos llevado la esquina blanco-rojo-verde (2) al sitio de la blanco-azul-rojo (3); y la arista blanco-rojo (B) al sitio de la blanco-azul ©. Los estudios más avanzados del cubo requieren utilizar las permutaciones de las piezas atendiendo a su orientación, pero en este breve espacio se nos escapa de las manos[2]. Nótese aquí que siempre vamos a descomponer el movimiento de una cara en dos ciclos disjuntos: el de las esquinas (números) y el de las aristas (letras). Es decir, una arista nunca va a terminar en la posición de una esquina y viceversa.

Ahora ya estamos listos para aplicar los conceptos teóricos antes vistos al cubo de Rubik. Llamaremos (G,)(G,*) al grupo de todas las posibles permutaciones de las piezas del cubo con la operación “movimiento”. Esto, formalmente, no es más que un grupo de permutaciones como el que hemos visto antes con la operación composición. Comprobemos que tiene estructura de grupo:

  1. Operación binaria: Dada una configuración del cubo de Rubik, al aplicarle una secuencia de movimientos (permutaciones), el resultado sigue siendo otra configuración de las piezas del cubo. La operación es cerrada.
  2. Elemento neutro: Dada una configuración de las piezas del cubo de rubik, la operación “no hacer ningún movimiento” será el elemento neutro. Es equivalente a sumar 0 cuando trabajámos con los números enteros.
  3. Elemento inverso: Dada un configuración del cubo, su inverso será “deshacer los movimientos que hemos hecho” para llegar a la posición inicial.
    Si, por ejemplo, habíamos aplicado R’F, tenemos que deshacer esa combinación de movimientos. Primero hay que deshacer el movimiento F haciendo F’ y después el movimiento R’ haciendo el movimiento R. Así, el inverso de R’F será F’R. Para cualquier otra secuencia de movimientos, será suficiente con escribir de derecha a izquierda los que acabamos de hacer, y cambiarles el sentido de giro.
  4. Asociatividad: Dados tres movimientos X, Y, Z, es equivalente hacer (XY)Z o X(YZ), ya que los movimientos se le aplican al cubo de izquierda a derecha (en ambos casos se hace primero X, luego Y, luego Z).

Concluimos así que las configuraciones de las piezas del cubo de rubik con la operación “movimiento” tienen estructura de grupo. Te invito a que pruebes en tu cubo a ejecutar el movimiento FR y el RF. Verás fácilmente cómo el resultado es diferente. Para aquellos con alguna noción más en álgebra abstracta, diremos que este grupo está generado por los elementos {F,B,U,D,R,L} y que cada uno de ellos tiene orden 4. Además, resulta claro que el grupo no es abeliano.

4. ¿Cuántas configuraciones legales del cubo existen?

Entender el cubo de Rubik como un grupo de permutaciones ha permitido a muchos matemáticos hacer extensos trabajos sobre él. En esta sección vamos a ver el grupo de “posiciones legales del cubo de Rubik”. Coge tu cubo de rubik e intenta permutar entre sí las esquinas (blanco-rojo-azul) y (amarillo-azul-rojo) sin que esto afecte a ninguna otra pieza. Después de probar un buen rato te empezarás a preguntar si es acaso posible hacerlo. Y en efecto, no lo es. Si quieres cambiar dos esquinas entre sí, la única opción que tienes es desmontar el cubo físicamente y volver a montarlo como a ti te guste. ¿Y esto a qué se debe?

Vamos a ver un resultado muy interesante sobre qué posiciones se pueden dar en un cubo y cuáles no. Llamaremos ‘‘configuraciones legales’’ a aquellas que podemos alcanzar realizando movimientos en el cubo, y ‘‘configuraciones ilegales’’ a aquellas que no podemos alcanzar si no es desmontando el cubo. La anterior era un ejemplo de las ilegales.

Un primer resultado fácilmente obtenible es que si una configuración del cubo de rubik es legal, entonces la permutación que la describe tiene signo par. La demostración sale de manera relativamente sencilla por inducción. Si tenemos el cubo en la posición inicial, no se le ha aplicado ninguna permutación, y por lo tanto el signo es par. Después cada vez que giremos una cara, estaremos haciendo una permutación de signo par.

Si llamamos respectivamente 1 y 2 a las esquinas que queríamos cambiar de sitio antes; la permutación resultante sería (12), que es impar (es una sola trasposición).
Sin embargo, si pruebas a hacer el algoritmo R U R’ F’ R U R’ U’ R’ F R2 U’ R’ U’, se cambiarán de sitio dos esquinas (1 y 2) y dos aristas (A y B). La permutación resultante sería (12)(AB), que tiene signo par (dos trasposiciones).

Ahora te planteo el siguiente problema: intenta cambiar la orientación de una sola esquina sin que esto afecte al resto del cubo. Es decir, trata de conseguir algo así:

Esta vez seguro que no tardas tanto en darte cuenta de que no es posible hacerlo; ya no te fías de mí. En efecto, para cambiar la orientación de las esquinas, lo tenemos que hacer de dos en dos. ¿Por qué ocurre esto? En un cubo convencional, la cara blanca y la amarilla son opuestas. De este modo, todas las esquinas tienen o bien una pegatina blanca o bien una amarilla, pero nunca ambas o ninguna. En la posición resuelta del cubo, todas las pegatinas blancas están en la cara de arriba y todas las amarillas en la cara de abajo.
Dada una configuración cualquiera del cubo, vamos a asignarle un valor a cada esquina:

  • 0 si la pegatina blanca o amarilla está en la cara de arriba o abajo del cubo.
  • 1 si le tenemos que aplicar un giro en sentido horario a la esquina para poner la pegatina blanca (o amarilla) en la cara de arriba (o abajo). Ojo, estamos hablando de girar la esquina en sí; no una cara.
  • 2 si le tenemos que aplicar dos giros en sentido horario para poner la pegatina blanca (o amarilla) en la cara de arriba (o abajo).

Podemos llegar así a otro resultado de gran relevancia: si una configuración del cubo de rubik es legal, entonces la suma de los valores asignados a todas sus esquinas es un múltiplo de 3 (decimos que es congruente con 00 modúlo 33). De nuevo, la demostración también se hace por inducción. Al tener el cubo en su configuración resuelta, la ecuación de congruencias se cumple. Después, cada vez que giramos una cara o bien estamos girando dos esquinas en sentido horario, y dos en sentido antihorario; o bien no se cambian los valores; por lo que la suma de sus valores sigue siendo la adecuada.

En el dibujo de arriba, hemos asignado un 0 a todas las las esquinas que tenían la pegatina blanca o amarilla en la cara de arriba o abajo. Les hemos puesto un 1 a las esquinas blanco-rojo-verde y blanco-azul-rojo, a las que hay que aplicar un giro en sentido horario para poner la pegatina blanca en la cara de abajo. Por último, le hemos puesto un 2 a la esquina amarillo-naranja-verde y a la blanco-verde-naranja, a las que hay que aplicarle dos giros en sentido horario. Si sumamos estos valores, obtenemos 1+1+2+2=61+1+2+2=6, que es un múltiplo de 3. (66 \equiv 0 mod 3).

Por último, podemos hacer algo similar con las aristas, aunque resulta ligeramente más complicado. Vamos a asignarle a las caras de cada arista un 0 o un 1 del siguiente modo. Puedes comprobar este resultado en tu propio cubo de Rubik. Este debe estar resuelto inicialmente. Es importante que lo sostengas con la cara blanca hacia arriba y la roja frente a ti.

  • Las aristas con una pegatina blanca tendrán un 0 en el lado blanco, y un 1 en el lado coloreado.
  • Las aristas con una pegatina amarilla tendrán un 0 en el lado amarillo y un 1 en el lado coloreado.
  • Las aristas que tienen dos colores, tendrán un 0 en el color más frío (el verde o el azul) y un 1 en el color más cálido (el rojo o el naranja).
  • NOTA No existen las aristas azul-verde ni las rojo-naranja.

Mira tu cubo y piensa en esta notación. ¿Lo tienes? Si recordamos las posiciones en las que hay un 0, estas serían las aristas de la cara superior, las de la inferior y las aristas azul-rojo y verde-naranja (en los colores fríos). En la siguiente figura te las marco con un asterisco.

Con lo que acabamos de estudiar, ya estamos listos para entender el último resultado del artículo: si una configuración del cubo de rubik es legal, entonces la suma de las caras de las aristas que tienen una marca, es par (o congruente con 0 mod 2).
De nuevo la demostración sale por inducción. El cubo resuelto cumple con el teorema, y al girar una cara, o bien no cambiamos el valor de ninguna arista (caras U,B), o bien se cambia el valor de las cuatro aristas (dos 0 pasan a ser 1, y dos 1 pasan a ser 0).

Vamos a verlo con un ejemplo:

Ahora hemos deshecho el cubo y, en las posiciones que habíamos marcado con un asterisco, escribimos el número que correspodería con la nueva configuración del cubo, siguiendo las condiciones de los colores.
Por ejemplo, la arista verde-amarillo tiene un 1, porque la cara verde está en la posición del asterisco. La amarillo-azul tiene un 0 porque la cara amarilla está en la posición del asterisco. Puedes volver a mirar el sistema de numeración si es necesario.

Lo sorprendente de los dos teoremas que se han mostrado es que se pueden combinar, dando lugar a una doble implicación entre ellos. Es decir, una configuración del cubo de Rubik es legal si y solo si la permutación de sus piezas es par; la suma de los valores asignados a sus esquinas es múltiplo de 3 y la suma de los valores asignados a sus aristas es múltiplo de 2.

Este sorprendente resultado nos permite averiguar cuántas ‘‘configuraciones legales’’ existen.

  • Podemos disponer las 12 aristas de 12!=12×11×10×...×2×112!=12\times 11\times 10 \times ... \times 2 \times 1 maneras posibles (a la primera arista le asignamos un sitio cualquiera, a la segunda uno de los once restantes, a la tercera, uno entre los otros diez, y así sucesivamente).
    Intuitivamente, cuesta creer que es posible distribuir las aristas de todas estas maneras posibles. Parece que dos aristas contiguas seguirán siéndolo después de hacer un movimiento de una cara. Así, podemos colocar la primera arista donde queramos, pero no está claro que luego podamos llevar la segunda al lugar que deseemos.

Sin embargo, existen algoritmos que permutan la posición de dos aristas cualesquiera sin afectar a ninguna otra pieza del cubo. De este modo, si descomponemos el ciclo de permutaciones final de las aristas en sus correspondientes trasposiciones, podremos llegar a cualquiera de las 12!12! configuraciones posibles.

  • Podemos disponer las 8 esquinas de 8! maneras (análogo al caso anterior).
  • Las primeras 7 esquinas las podemos orientar de la manera que queramos. La última esquina se deberá colocar de modo que la suma «cuadre», es decir, no vamos a poder elegir su orientación, sino que esta va a venir dada por las posiciones anteriores. Esto es debido a la condición de la suma de estos valores debe ser múltiplo de 3. Esto nos da 373^{7} posibilidades distintas (cada una de las 7 primeras esquinas se puede orientar de 3 maneras distintas).
  • Las primeras 11 aristas las vamos a poder orientar como queramos, pero la última la vamos a tener que poner de modo “que la suma cuadre”. Es decir, que tenemos 272^{7} posibilidades análogamente al caso anterior.

En principio esto nos daría un total de 12!×8!×37×21112!\times 8! \times 3^{7} \times 2^{11} configuraciones diferentes[1:1]. Sin embargo, recordemos que antes hemos visto que las permutaciones tienen que ser pares. Esto supone la mitad de todas las permutaciones posibles. Existe un resultado que demuestra que las permutaciones pares son la mitad de las permutaciones totales. Así, concluimos que el número total de configuraciones del cubo de rubik es[2:1]:

12!×8!×37×2112=12!×8!×37×210=43.252.003.274.489.856.000.\frac{12!\times 8!\times 3^{7}\times 2^{11}}{2} = 12! \times 8! \times 3^{7} \times 2^{10} = 43.252.003.274.489.856.000.

Para hacernos una idea de la magnitud de este número, si una persona realizase un giro por segundo, necesitaría aproximadamente 1.400 billones de años para resolver todas las configuraciones posibles del cubo.

5. ¿Cómo se usó la teoría de grupos en la demostración del número de Dios?

Uno de los problemas más famosos que se han planteado respecto al cubo de Rubik ha sido encontrar el número máximo de movimientos necesarios para resolverlo dada una configuración inicial cualquiera. Han sido muchos los investigadores que se han enfrentado a esta búsqueda, dando cotas cada vez más acertadas. Sin embargo, este problema se mantuvo sin resolver hasta el año 2010. Fueron Tomas Rokicki, Herbert Kociemba, Morley Davidson y John Dethridge quienes, apoyados en el trabajo de muchos expertos anteriores, demostraron que como mucho se necesitan 20 movimientos para resolver cualquier configuración del cubo de Rubik[3].

¿Qué papel jugaron aquí las Matemáticas, y en concreto, la teoría de grupos? Lo que se hizo fue clasificar las 43 billones de configuraciones posibles en varios conjuntos de posiciones que eran equivalentes entre sí, es decir, que se podían resolver de maneras relativamente simétricas. Para esto, se usaron las clases de laterales de ciertos subgrupos. Este es un concepto que se nos escapa un poco del artículo pero sobre el que podéis encontrar información en [4].

Una vez hecha esta división, obtenida gracias a resultados provenientes de la teoría de grupos, se resolvieron con un ordenador todas las posiciones restantes. Para ello se necesitaron 35 años de CPU.

Sin embargo, este problema continúa sin estar resuelto para cubos de Rubik 4×4×44\times 4\times 4 y de mayor tamaño[4]. Se han encontrado cotas del número máximo de movimientos necesarios para resolver cualquier configuración incluso para cubos n×n×nn\times n \times n, pero no el número exacto de movimiento mínimos requierdos. ¿Qué papel jugará la teoría de grupos para encontrar este tan ansiado número?


  1. Chen J. [Janet] Group Theory and the Rubik’s Cube. Harvard Mathematics Department\textit{Harvard Mathematics Department}. https://people.math.harvard.edu/~jjchen/docs/Group Theory and the Rubik’s Cube.pdf ↩︎ ↩︎

  2. Daniels L. [Lindsey] (2014) Group Theory and the Rubik’s Cube. Lakehead University\textit{Lakehead University}. http://math.fon.rs/files/DanielsProject58.pdf ↩︎ ↩︎

  3. God’s Number is 20. https://www.cube20.org/ ↩︎

  4. Salkinder D. [Daniel] (16 de diciembre de 2021). n×n×nn\times n\times n Rubik’s Cubes and god’s Number. https://arxiv.org/pdf/2112.08602.pdf ↩︎