Cociente de Rayleigh

Propuesto en examen de Álgebra de Ingenieros de Montes de la UPM. Trata sobre el cociente de Rayleigh $X^tAX/X^tBX$, si bien no se menciona en el enunciado este nombre.

Enunciado
Sean $q_1(x)=X^tAX$ y $q_2(x)=X^tBX$ dos formas cuadráticas de $\mathbb{R}^n\rightarrow \mathbb{R}$, siendo $A$ y $B$ matrices cuadradas de orden $n$, reales y simétricas. Se supone que $q_2$ es definida positiva. Entonces se sabe (y lo admitiremos) que existe un cambio de base de ecuación $X=PY$ que permite diagonalizar simultaneamente las dos formas cuadráticas, expresándolas en la forma: $$\; { }\\q_1(x)=a_1y_1^2+a_2y_2^2+\ldots+a_ny_n^2,\\ q_2(x)=y_1^2+y_2^2+\ldots+y_n^2.$$ Se pide:

1. Encontrar y justificar una relación entre los coeficientes $a_1,a_2,\ldots,a_n$ y las raíces de la ecuación $\det (A-\lambda B)=0$.

2. Clasificar las formas cuadráticas $q_1$ y $q_2$ en el caso particular:

$A=\begin{bmatrix}{0}&{1}\\{1}&{0}\end{bmatrix} \;,\quad B=\begin{bmatrix}{2}&{1}\\{1}&{2}\end{bmatrix}\;.$

Como aplicación, diagonalizar simultaneamente en este caso las formas cuadráticas $q_1$ y $q_2$ (no se pide la matriz de paso $P$ ).

3. Ordenar de menor a mayor:

$\max \left\{{a_1,a_2,\ldots,a_n}\right\},\; \min \left\{{a_1,a_2,\ldots,a_n}\right\},\; \dfrac{X^tAX}{X^tBX}\;(X\neq 0).$

Como aplicación, encontrar los valores máximo y mínimo de $F:\mathbb{R}^n\rightarrow{\mathbb{R}}$ dada por $F(x)=X^tAX$, con la condición $X^tBX=1$.

4. Si $v_1,v_2,\ldots,v_n$ son los vectores columna de la matriz $P$ de paso, comprobar que se cumplen las condiciones:

$(i)\;Av_1=a_1Bv_1,\;Av_2=a_2Bv_2,\ldots ,Av_n=a_nBv_n.\\(ii)\;
v_i^tBv_j=0\;\textrm{si}\;i\neq j,\quad v_i^tBv_i=1,\quad i,j=1,2,\ldots,n.$

5. Las condiciones del apartado 4. permiten hallar una matriz de paso $P$. Escribir detalladamente dichas condiciones para las matrices $A$ y $B$ del apartado 2., en particular, determinar el cambio de base $X=PY$ que diagonalice de manera simultánea las formas cuadráticas $q_1$ y $q_2$ del apartado 2.

Solución
1. Por hipótesis existe una matriz $P$ real invertible y de orden $n$ tal que $P^tAP=D$ con $D=\textrm{diag}(a_1,\ldots,a_n)$ y $P^tBP=I$. Despejando las matrices $A$ y $B$ obtenemos $A=(P^t)^{-1}DP^{-1}$ y $B=(P^t)^{-1}IP^{-1}$. Entonces:

$\det(A-\lambda B)=\det\left((P^t)^{-1}(D-\lambda I)P^{-1}\right)=\dfrac{1}{\det (P^t)}\cdot \det (D-\lambda I)\cdot \dfrac{1}{\det P}=\\\dfrac{1}{(\det P)^2}\cdot \det(D-\lambda I)=0 \Leftrightarrow \det (D-\lambda I)=0 \Leftrightarrow (a_1-\lambda)\cdot \ldots \cdot (a_n-\lambda)=0.
$

Es decir, $a_1,\ldots,a_n $ son exactamente las raíces de $\det (A-\lambda B)=0$.

2. La matriz $A$ tiene determinante $-1$ que es igual al producto de sus valores propios. Uno ha de ser positivo y otro negativo, por tanto $q_1$ es indefinida. La matriz $B$ tiene todos sus menores principales mayores que $0$, por tanto $q_2$ es definida positiva. Ahora:

$\det (A-\lambda B)=\begin{vmatrix}{-2 \lambda}&{1- \lambda}\\{1- \lambda}&{-2 \lambda}\end{vmatrix}=0 \Leftrightarrow 3 \lambda^2+2 \lambda -1=0.$

Las soluciones de la anterior ecuación son $1/3$ y $-1$. De acuerdo con el apartado 1. existe un cambio de base de ecuación $X=PY$ de tal manera que:

$q_1(x)=\dfrac{1}{3}y_1^2-y_2^2\;,\quad q_2(x)=y_1^2+y_2^2.$

3. Llamemos $M=\max \{a_1,\ldots, a_n\}$. Usando el cambio $X=PY$ tenemos:

$\dfrac{X^tAX}{X^tBX}=\dfrac{(PY)^tA(PY)}{(PY)^tB(PY)}=\dfrac{Y^tP^tAPY}{Y^tP^tAPY}=\dfrac{Y^tDY}{Y^tIY}=\\\dfrac{a_1y_1^2+\ldots+a_ny_n^2}{y_1^2+\ldots+y_n^2}\leq \dfrac{My_1^2+\ldots+My_n^2}{y_1^2+\ldots+y_n^2}=\dfrac{M(y_1^2+\ldots+y_n^2)}{y_1^2+\ldots+y_n^2}=M.$

El razonamiento para $m=\min \{a_1,\ldots, a_n\}$ es totalmente simétrico. Podemos pues concluir que:

$m=\min \left\{{a_1,\ldots,a_n}\right\}\leq \dfrac{X^tAX}{X^tBX}\leq M=\max \left\{{a_1,\ldots, a_n}\right\}\;(\forall X\neq 0).$

Nótese que al ser $q_2$ definida positiva, si $X\neq 0$ entonces $X^tBX\neq 0$ es decir, el cociente anterior está bien definido.

Por lo demostrado anteriormente, $m\leq F\leq M$. Veamos que $F$ alcanza los valores $m$ y $M$. Supongamos sin pérdida de generalidad que $m=a_1$ y que $M=a_n$. Obsérvese que la condición $X^tBX=1$ equivale a $y_1^2+\ldots+y_n^2=1$. Si elegimos $X_1=PY_1$, y $X_n=PY_n$ con $Y_1=(1,0,\ldots,0)^t$, $Y_n=(0,0,\ldots,1)^t$ tenemos $X_1^tAX_1=a_1=m$ y $X_n^tAX_n=a_n=M$. Es decir, el máximo para $F$ es $M$ y el mínimo $m$.

4. De $P^tAP=D$ se deduce $AP=(P^t)^{-1}D$ y de $P^tBP=I$, que $BP=(P^t)^{-1}$. Por tanto $AP=BPD$. Tenemos:

$AP=BPD \Rightarrow A \begin{bmatrix}v_1,\ldots,v_n\end{bmatrix}=B \begin{bmatrix}a_1v_1,\ldots,a_nv_n\end{bmatrix}\Rightarrow\\
\begin{bmatrix}Av_1,\ldots,Av_n\end{bmatrix}=\begin{bmatrix}a_1Bv_1,\ldots,a_nBv_n\end{bmatrix}\Rightarrow Av_i=a_iBv_i\;(i=1,\ldots,n).$

Por otra parte:

$P^tBP=I \Leftrightarrow \begin{bmatrix}v_1^t\\v_2^t\\ \vdots\\{v_n^t}\end{bmatrix}B\begin{bmatrix}v_1,v_2,\ldots,v_n\end{bmatrix}=\begin{bmatrix}v_1^t\\v_2^t\\ \vdots\\{v_n^t}\end{bmatrix}\begin{bmatrix}Bv_1,Bv_2,\ldots,Bv_n\end{bmatrix}\\
=\begin{bmatrix} v_1^tBv_1 & v_1^tBv_2 & \ldots & v_1^tBv_n\\ v_2^tBv_1 &v_2^tBv_2 & \ldots & v_2^tBv_n \\ \vdots&&&\vdots \\ v_n^tBv_1 & v_n^tBv_2 &\ldots & v_n^tBv_n\end{bmatrix}=I \Leftrightarrow v_i^tBv_j=\delta_{ij}\;(i,j=1,2,\ldots,n).
$

En donde $\delta_{ij}$ son las deltas de Kronecker. Quedan pues demostradas las condiciones pedidas.

5. Llamando $v_1=(x,y)^t,\;v_2=(z,u)^t$ e imponiendo las condiciones (i) obtenemos:

$\begin{bmatrix}{0}&{1}\\{1}&{0}\end{bmatrix}\begin{bmatrix}{x}\\{y}\end{bmatrix}=\dfrac{1}{3}\begin{bmatrix}{2}&{1}\\{1}&{2}\end{bmatrix}\begin{bmatrix}{x}\\{y}\end{bmatrix} \Leftrightarrow \ldots \Leftrightarrow (x,y)=(\alpha,\alpha)\;(\alpha \in{\mathbb{R}}),\\
\begin{bmatrix}{0}&{1}\\{1}&{0}\end{bmatrix}\begin{bmatrix}{z}\\{u}\end{bmatrix}=(-1)\begin{bmatrix}{2}&{1}\\{1}&{2}\end{bmatrix}\begin{bmatrix}{z}\\{u}\end{bmatrix} \Leftrightarrow \ldots \Leftrightarrow (z,u)=( -\beta, \beta)\;( \beta \in{\mathbb{R}}).
$

Obligando a que $v_i^tBv_i=1\;(i=1,2)$ :

$(\alpha,\alpha)\begin{pmatrix}{2}&{1}\\{1}&{2}\end{pmatrix}\begin{pmatrix}{\alpha }\\{\alpha }\end{pmatrix}=1\Leftrightarrow \alpha= \pm \; \sqrt[]{6}/6,\\(-\beta,\beta)\begin{pmatrix}{2}&{1}\\{1}&{2}\end{pmatrix}\begin{pmatrix}{-\beta }\\{\beta }\end{pmatrix}=1\Leftrightarrow \beta= \pm \;\sqrt[]{2}/2.$

Por otra parte, para todo $\alpha,\beta \in\mathbb{R}$ se verifica:

$(\alpha,\alpha)\begin{pmatrix}{2}&{1}\\{1}&{2}\end{pmatrix}\begin{pmatrix}{- \beta }\\{ \beta }\end{pmatrix}=0.$

por tanto, eligiendo $\alpha=\sqrt{6}/6$ y $\beta=\sqrt{2}/2$ obtenemos la matriz $P$ :

$$P=\begin{bmatrix}{\sqrt{6}/6}&{-\sqrt{2}/2}\\{\sqrt{6}/6}&{\;\;\;\sqrt{2}/2}\end{bmatrix}.$$

Esta entrada fue publicada en Álgebra. Guarda el enlace permanente.