N°04-2024
Enunciado
Dada la matriz $A \in \mathbb{R}^{2 \times 2}$, se define su radio numérico como
$$ r(A) := \text{máx} \bigg\lbrace \left| \left( x, y\right) A \left( \begin{split} &x \\ &y \end{split} \right) \right| : x^2+y^2=1\bigg\rbrace $$
a) Calcular $r \left( \begin{pmatrix} 1 & 1 \\ 4 & 1 \end{pmatrix}\right)$.
b) Mostrar que si
$$ D=\begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix} \in \mathbb{R}^{2 \times 2}, $$ entonces $r(D)=\text{máx} \lbrace |\lambda_1|,|\lambda_2|\rbrace $.
Resoluciones
Nos enfrentamos claramente a un problema de optimización. Y siempre que hay un vínculo hay dos posibles estrategias de resolución:
- remplazar el vinculo en la función;
- aplicar multiplicadores de Lagrange.
Uno ya tiene sus años resolviendo problemas de este estilo, sabe que siempre hay que intentar lo primero (salvo que te exijan hacerlo por el segundo método) y sólo pasar a la segunda opción cuando la expresión es poco amigable para derivar. Sin embargo, suele pasar que nos ponemos la corbata y le metemos al formalismo, con anteojos de sol en una noche de campo. Eso mismo me pasó a mi hasta que Santiago Noya, estudiante de Licenciatura en Física de la UBA, me escribió para mostrarme que la primera estrategia funciona de maravilla. Veamos ambas para comparar.
Remplazando el vínculo en la función
En este caso, la función a maximizar es el módulo de la forma cuadrática $ \left( x, y\right) A \left( \begin{split} &x \\ &y \end{split} \right) $ sometida al vinculo dado por la relación $x^2+y^2=1$. Es decir, buscamos los valores máximos de la forma cuadrática para aquellos puntos que pertenecen a la circunferencia unidad. Así, para imponer el vínculo es posible parametrizar las coordenadas en función del angulo polar $\theta$
$$ \begin{cases} \begin{split} x &= \cos \theta \\ y &= \sin \theta, \end{split} \end{cases} $$
y así obtener la función
$$ f (\theta) = \left| \left( \cos \theta, \sin \theta \right) A \left( \begin{split} &\cos \theta \\ &\sin \theta \end{split} \right) \right| $$
cuyo valor máximo será el rango $r(A)$. Veamos como determinarlo en cada caso:
a)
En este caso
$$ \begin{split} f (\theta) &= \left| \left( \cos \theta, \sin \theta \right) \begin{pmatrix} 1 & 1 \\ 4 & 1 \end{pmatrix} \left( \begin{split} &\cos \theta \\ &\sin \theta \end{split} \right) \right| \\ &= \left| \left( \cos \theta, \sin \theta \right) \left( \begin{split} &\cos \theta + \sin \theta \\ & 4 \cos \theta +\sin \theta \end{split} \right) \right| \\ &= \left|\cos \theta (\cos \theta + \sin \theta)+ \sin \theta (4 \cos \theta +\sin \theta)\right|\\ &= \left| \cos^2 \theta + \cos \theta \sin \theta + 4 \cos \theta \sin \theta +\sin^2 \theta \right|\\ &= \left| 1 + 5\cos \theta \sin \theta \right| \end{split} $$
es decir
$$ f (\theta) = \left| 1 + \frac{5}{2} \sin (2 \theta) \right|. $$
El valor máximo de esta función corresponde al caso en que $\sin (2 \theta)=1$ y es por lo tanto:
$$ \boxed{r(A)= f_{\text{máx}} = \frac{7}{2}}. $$
b)
En el caso de la matriz diagonal es fácil demostrar que
$$ f (\theta) = \left| \lambda_1 \cos^2 \theta + \lambda_2 \sin^2 \theta \right|, $$
lo cual podemos reexpresar como
$$ f (\theta) =\left| \lambda_1 + (\lambda_2 - \lambda_1) \sin^2 \theta \right|. $$
Así, tenemos las siguiente posibilidades:
- si $\lambda_1< \lambda_2$ el valor máximo corresponde al caso en que $\sin^2 \theta=1$ y es igual a $\left| \lambda_2 \right|$
- si $\lambda_1 > \lambda_2$ el valor máximo corresponde al caso en que $\sin^2 \theta=0$ y es igual a $\left| \lambda_1 \right|$
lo cual puede resumirse diciendo que
$$ \boxed{r(D)=\text{máx} \lbrace |\lambda_1|,|\lambda_2|\rbrace}. $$
Aplicando multiplicadores de Lagrange
Para simplificar las cosas, definamos la forma cuadrática $Q_A(\bar{x})=\bar{x}^{T}A\bar{x}$. Así, aquel extremo de $Q_A(\bar{x})$, bajo la restricción $x^2+y^2=1$, que tenga mayor valor absoluto será $r(A)$. Es decir, si $\lbrace Q_A^{(i)}\rbrace$ son los extremos de $Q_A(\bar{x})$, bajo la restricción $x^2+y^2=1$, entonces $r(A)=\text{máx} \lbrace |Q_A^{(i)}|\rbrace$.
En sintonía con lo anterior, debemos definir el lagrangeano $\mathcal{L}_A (\bar{x},\lambda) = Q_A(\bar{x}) - \lambda (x^2+y^2-1)$ y obtener los valores de $\bar{x}_e$ tales $\nabla \mathcal{L}_A (\bar{x}_e, \lambda_e)=\bar{0}$.
a)
Como $A=\begin{pmatrix} 1 & 1 \\ 4 & 1 \end{pmatrix}$, entonces $Q_A(\bar{x})=\bar{x}^{T}A\bar{x}=x^2+5xy+y^2$ y el lagrangeano adquiere la siguiente forma
$$ \mathcal{L}_A (\bar{x},\lambda) =x^2+5xy+y^2- \lambda (x^2+y^2-1) $$
entonces
$$ \nabla \mathcal{L}_A (\bar{x}_e, \lambda_e) = \begin{pmatrix} 2(1-\lambda)x_e+5y_e & \\ 5x_e+2(1-\lambda)y_e & \\ x_e^2+y_e^2-1 \end{pmatrix} = \bar{0} $$
sólo si
$$ \begin{cases} \begin{split} 2(1-\lambda)x_e+5y_e&=0 \\ 5x_e+2(1-\lambda)y_e&=0 \\ x_e^2+y_e^2-1&=0 \end{split} \end{cases}~~~~~~~~(1) $$
Si multiplicamos por $y_e$ la primer relación y por $x_e$ la segunda tendremos que
$$ \begin{cases} \begin{split} 2(1-\lambda)x_e y_e+5y_e^2&=0 \\ 5x_e^2+2(1-\lambda)x_ey_e&=0, \end{split} \end{cases} $$
que al restarlas nos permite obtener que $x_e^2=y_e^2$. Al remplazar esa igualdad en la tercera relación de (1) podemos obtener que $x_e=\pm \frac{1}{\sqrt{2}}$ y $y_e=\pm \frac{1}{\sqrt{2}}$, es decir, $Q_A^{(i)}=1\pm \frac{5}{2}$ entonces
$$ \begin{split} r(A)&=\text{máx} \lbrace |Q_A^{(i)}|\rbrace \\ &=\text{máx} \bigg\lbrace \left|1\pm \frac{5}{2} \right|\bigg\rbrace \\ &= \text{máx} \bigg\lbrace \left| \frac{7}{2} \right|, \left| -\frac{3}{2} \right|\bigg\rbrace \end{split} $$
es decir
$$ \boxed{r(A)=\frac{7}{2}}. $$
¡Qué belleza! Decime si esa hermosa fracción no merece un aporte libre y voluntario. ¡Gracias!
b)
En este caso $Q_D(\bar{x})= \lambda_1 x^2+\lambda_2 y^2$ y por lo tanto
$$ \mathcal{L}_D (\bar{x},\lambda) =\lambda_1 x^2+\lambda_2 y^2- \lambda (x^2+y^2-1) $$
entonces
$$ \nabla \mathcal{L}_D (\bar{x}_e, \lambda_e) = \begin{pmatrix} 2(\lambda_1-\lambda)x_e & \\ 2(\lambda_2-\lambda)y_e & \\ x_e^2+y_e^2-1 \end{pmatrix} = \bar{0} $$
sólo si
$$ \begin{cases} \begin{split} 2(\lambda_1-\lambda)x_e&=0 \\ 2(\lambda_2-\lambda)y_e&=0 \\ x_e^2+y_e^2-1&=0 \end{split} \end{cases}~~~~~~~~(2) $$
A partir de aquí podemos analizar distintos casos.
- Si $\lambda_1\neq\lambda$, entonces $x_e=0$ y $y_e=\pm1$ de esta forma $Q_D^{(1)}=\lambda_2$.
- Si $\lambda_2\neq\lambda$, entonces $y_e=0$ y $x_e=\pm1$ de esta forma $Q_D^{(2)}=\lambda_1$.
- Si $\lambda_1=\lambda_2=\lambda$ entonces $Q_D$ es constante e igual a $Q_D=\lambda_1=\lambda_2$.
Así, habiendo encontrado todos los posibles extremos, como todos ellos coinciden con alguno de los autovalores:
$$ \boxed{r(D)=\text{máx} \lbrace |\lambda_1|,|\lambda_2|\rbrace}. $$