Projeção (álgebra linear)

Da Wikipédia, a enciclopédia livre
Ir para a navegação Saltar para pesquisar
A transformação P é a projeção ortogonal na linha m .

Em álgebra linear e análise funcional , uma projeção é uma transformação linear . de um espaço vetorial para si mesmo (um endomorfismo ) tal que. Ou seja, sempre queé aplicado duas vezes a qualquer vetor, dá o mesmo resultado como se fosse aplicado uma vez (ou seja,é idempotente ). Ele deixa sua imagem inalterada. [1] Esta definição de "projeção" formaliza e generaliza a ideia de projeção gráfica . Pode-se também considerar o efeito de uma projeção em um objeto geométrico examinando o efeito da projeção em pontos do objeto.

Definições

Uma projeção em um espaço vetorialé um operador linearde tal modo que.

Quandotem um produto interno e é completo (ou seja, quandoé um espaço de Hilbert ) o conceito de ortogonalidade pode ser usado. Uma projeçãoem um espaço de Hilberté chamada de projeção ortogonal se satisfazpara todos. Uma projeção em um espaço de Hilbert que não é ortogonal é chamada de projeção oblíqua .

Matriz de projeção

  • No caso de dimensão finita , uma matriz quadrada é chamada de matriz de projeção se for igual ao seu quadrado, ou seja, se. [2] : pág. 38 
  • Uma matriz quadradaé chamada de matriz de projeção ortogonal separa uma matriz real , e respectivamentepara uma matriz complexa , ondedenota a transposição deedenota a transposição adjunta ou hermitiana de. [2] : pág. 223 
  • Uma matriz de projeção que não é uma matriz de projeção ortogonal é chamada de matriz de projeção oblíqua .

Os autovalores de uma matriz de projeção devem ser 0 ou 1.

Exemplos

Projeção ortogonal

Por exemplo, a função que mapeia o pontono espaço tridimensionalao pontoé uma projeção ortogonal no plano xy . Esta função é representada pela matriz

A ação desta matriz em um vetor arbitrário é

Para ver issoé de fato uma projeção, ou seja,, calculamos

Observando quemostra que a projeção é uma projeção ortogonal.

Projeção oblíqua

Um exemplo simples de uma projeção não ortogonal (oblíqua) é

Através da multiplicação de matrizes , vê-se que

mostrando queé de fato uma projeção.

A projeçãoé ortogonal se e somente se porque só então

Propriedades e classificação

A transformação T é a projeção ao longo de k em m . O intervalo de T é me o espaço nulo é k .

Idempotência

Por definição, uma projeçãoé idempotente (ou seja,).

Complementaridade de imagem e kernel

Deixarseja um espaço vetorial de dimensão finita eser uma projeção sobre. Suponha que os subespaços esão a imagem e o núcleo derespectivamente. Entãotem as seguintes propriedades:

  1. é o operador identidade em
    .
  2. Temos uma soma direta . Cada vetorpode ser decomposto exclusivamente comocome, e onde

A imagem e o núcleo de uma projeção são complementares , assim comoe. O operadoré também uma projeção como imagem e núcleo detornar-se o núcleo e a imagem dee vice versa. Nós dizemosé uma projeção ao longopara(kernel/imagem) eé uma projeção ao longopara.

Espectro

Em espaços vetoriais de dimensão infinita, o espectro de uma projeção está contido emComo

Apenas 0 ou 1 pode ser um autovalor de uma projeção. Isso implica que uma projeção ortogonalé sempre uma matriz positiva semidefinida . Em geral, os autoespaços correspondentes são (respectivamente) o kernel e o alcance da projeção. A decomposição de um espaço vetorial em somas diretas não é única. Portanto, dado um subespaço, pode haver muitas projeções cujo alcance (ou kernel) é.

Se uma projeção não é trivial, ela tem polinômio mínimo , que fatora em fatores lineares distintos e, portanto,é diagonalizável .

Produto de projeções

O produto das projeções não é em geral uma projeção, mesmo que sejam ortogonais. Se duas projeções comutam , seu produto é uma projeção, mas o inverso é falso: o produto de duas projeções não comutantes pode ser uma projeção.

Se duas projeções ortogonais comutam, seu produto é uma projeção ortogonal. Se o produto de duas projeções ortogonais é uma projeção ortogonal, então as duas projeções ortogonais comutam (mais geralmente: dois endomorfismos autoadjuntos comutam se e somente se seu produto for autoadjunto).

Projeções ortogonais

Quando o espaço vetorialtem um produto interno e é completo (é um espaço de Hilbert ) o conceito de ortogonalidade pode ser usado. Uma projeção ortogonal é uma projeção para a qual o alcancee o espaço nulosão subespaços ortogonais . Assim, para cadaedentro,. Equivalentemente:

Uma projeção é ortogonal se e somente se for auto-adjunta . Usando as propriedades auto-adjuntas e idempotentes de, para qualqueredentrotemos,, e

Ondeé o produto interno associado a. Portanto,esão projeções ortogonais. [3] A outra direção, a saber, que seé ortogonal então é auto-adjunto, segue de

para cadaedentro; portanto.

Propriedades e casos especiais

Uma projeção ortogonal é um operador limitado . Isso porque para cadano espaço vetorial temos, pela desigualdade de Cauchy–Schwarz :

portanto.

Para espaços vetoriais complexos ou reais de dimensão finita, o produto interno padrão pode ser substituído por.

Fórmulas

Um caso simples ocorre quando a projeção ortogonal é sobre uma linha. Seé um vetor unitário na linha, então a projeção é dada pelo produto externo

(Seé de valor complexo, a transposta na equação acima é substituída por uma transposta Hermitiana). Este operador deixa u invariante e aniquila todos os vetores ortogonais a, provando que é de fato a projeção ortogonal sobre a linha que contém u . [4] Uma maneira simples de ver isso é considerar um vetor arbitráriocomo a soma de um componente na linha (ou seja, o vetor projetado que buscamos) e outro perpendicular a ele,. Aplicando a projeção, obtemos

pelas propriedades do produto escalar de vetores paralelos e perpendiculares.

Esta fórmula pode ser generalizada para projeções ortogonais em um subespaço de dimensão arbitrária . Deixarseja uma base ortonormal do subespaço, e deixardenotar omatriz cujas colunas são, ou seja. Então a projeção é dada por: [5]

que pode ser reescrita como

O Matrixé a isometria parcial que se anula no complemento ortogonal deeé a isometria que incorporano espaço vetorial subjacente. O alcance deé, portanto, o espaço final de. Também é claro queé o operador identidade em.

A condição de ortonormalidade também pode ser descartada. Seé uma base (não necessariamente ortonormal) , eé a matriz com esses vetores como colunas, então a projeção é: [6] [7]

O Matrixainda incorporano espaço vetorial subjacente, mas não é mais uma isometria em geral. O Matrixé um "fator normalizador" que recupera a norma. Por exemplo, o operador de classificação -1não é uma projeção seApós dividir porobtemos a projeçãopara o subespaço compreendido por.

No caso geral, podemos ter uma matriz definida positiva arbitráriadefinindo um produto interno, e a projeçãoÉ dado por. Então

Quando o espaço de alcance da projeção é gerado por um quadro (ou seja, o número de geradores é maior que sua dimensão), a fórmula para a projeção assume a forma:. Aquisignifica o pseudoinverso de Moore-Penrose . Esta é apenas uma das muitas maneiras de construir o operador de projeção.

Seé uma matriz não singular e(ou seja,é a matriz de espaço nulo de), [8] vale o seguinte:

Se a condição ortogonal for aumentada paracomnão singular, vale o seguinte:

Todas essas fórmulas também valem para espaços de produtos internos complexos, desde que a transposição conjugada seja usada em vez da transposta. Mais detalhes sobre somas de projetores podem ser encontrados em Banerjee e Roy (2014). [9] Ver também Banerjee (2004) [10] para aplicação de somas de projetores em trigonometria esférica básica .

Projeções oblíquas

O termo projeções oblíquas às vezes é usado para se referir a projeções não ortogonais. Essas projeções também são usadas para representar figuras espaciais em desenhos bidimensionais (ver projeção oblíqua ), embora não com tanta frequência quanto as projeções ortogonais. Enquanto o cálculo do valor ajustado de uma regressão de mínimos quadrados comuns requer uma projeção ortogonal, o cálculo do valor ajustado de uma regressão de variáveis ​​instrumentais requer uma projeção oblíqua.

As projeções são definidas pelo seu espaço nulo e pelos vetores base usados ​​para caracterizar seu alcance (que é o complemento do espaço nulo). Quando esses vetores de base são ortogonais ao espaço nulo, então a projeção é uma projeção ortogonal. Quando esses vetores de base não são ortogonais ao espaço nulo, a projeção é uma projeção oblíqua. Deixe os vetoresformar uma base para o alcance da projeção, e montar esses vetores namatriz. O intervalo e o espaço nulo são espaços complementares, então o espaço nulo tem dimensão. Segue que o complemento ortogonal do espaço nulo tem dimensão. Deixarformar uma base para o complemento ortogonal do espaço nulo da projeção e montar esses vetores na matriz. Então a projeção é definida por

Esta expressão generaliza a fórmula para projeções ortogonais dada acima. [11] [12]

Encontrando a projeção com um produto interno

Deixarser um espaço vetorial (neste caso um plano) gerado por vetores ortogonais. Deixarseja um vetor. Pode-se definir uma projeção deparaComo

onde os índices repetidos são somados ( notação de soma de Einstein ). O vetorpode ser escrito como uma soma ortogonal tal que.às vezes é indicado como. Existe um teorema em álgebra linear que afirma que esteé a menor distância deparae é comumente usado em áreas como aprendizado de máquina .

y está sendo projetado no espaço vetorial V .

Formas canônicas

Qualquer projeçãoem um espaço vetorial de dimensãosobre um corpo é uma matriz diagonalizável , pois seu polinômio mínimo divide, que se divide em fatores lineares distintos. Assim, existe uma base na qualtem a forma

Ondeé a classificação de. Aquié a matriz identidade de tamanho, eé a matriz zero de tamanho. Se o espaço vetorial é complexo e equipado com um produto interno , então existe uma base ortonnormal na qual a matriz de P é [13]

Onde. Os inteiros e os números reaissão determinados de forma única. Observe que. O fatorcorresponde ao subespaço invariante máximo no qualatua como uma projeção ortogonal (de modo que P é ortogonal se e somente se) e o-blocos correspondem aos componentes oblíquos .

Projeções em espaços vetoriais normados

Quando o espaço vetorial subjacenteé um espaço vetorial normado (não necessariamente de dimensão finita) , questões analíticas, irrelevantes no caso de dimensão finita, precisam ser consideradas. Assumir agoraé um espaço de Banach .

Muitos dos resultados algébricos discutidos acima sobrevivem à passagem para este contexto. Uma dada decomposição de soma direta deem subespaços complementares ainda especifica uma projeção, e vice-versa. Seé a soma direta, então o operador definido porainda é uma projeção com alcancee núcleo. Também é claro que. Inversamente, seé projeção em, ou seja, então é facilmente verificado que. Em outras palavras,também é uma projeção. A relaçãoimplicaeé a soma direta.

No entanto, em contraste com o caso de dimensão finita, as projeções não precisam ser contínuas em geral. Se um subespaçodonão é fechado na topologia da norma, então a projeção sobrenão é contínuo. Em outras palavras, o alcance de uma projeção contínuadeve ser um subespaço fechado. Além disso, o núcleo de uma projeção contínua (na verdade, um operador linear contínuo em geral) é fechado. Assim, uma projeção contínuadá uma decomposição deem dois subespaços fechados complementares:.

O inverso também vale, com uma suposição adicional. Suponhaé um subespaço fechado de. Se existe um subespaço fechadotal que X = UV , então a projeçãocom alcancee núcleoé contínuo. Isto segue do teorema do grafo fechado . Suponha que x nx e Px ny . É preciso mostrar que. Desdeé fechado e { Px n } ⊂ U , y está em, ou seja, Py = y . Além disso, x nPx n = ( IP ) x nxy . Porqueé fechado e {( IP ) x n } ⊂ V , temos, ou seja, o que comprova a afirmação.

O argumento acima faz uso da suposição de que amboseestão fechados. Em geral, dado um subespaço fechado, não precisa existir um subespaço fechado complementar, embora para espaços de Hilbert isso sempre possa ser feito tomando o complemento ortogonal . Para espaços de Banach, um subespaço unidimensional sempre tem um subespaço complementar fechado. Esta é uma consequência imediata do teorema de Hahn-Banach . Deixarseja o intervalo linear de. Por Hahn-Banach, existe um funcional linear limitado tal que φ ( u ) = 1 . O operadorsatisfaz, ou seja, é uma projeção. Limite deimplica a continuidade dee, portanto,é um subespaço complementar fechado de.

Aplicações e outras considerações

Projeções (ortogonais e outras) desempenham um papel importante em algoritmos para certos problemas de álgebra linear:

Como dito acima, as projeções são um caso especial de idempotentes. Analiticamente, projeções ortogonais são generalizações não comutativas de funções características . Idempotentes são usados ​​para classificar, por exemplo, álgebras semisimples , enquanto a teoria da medida começa considerando funções características de conjuntos mensuráveis . Portanto, como se pode imaginar, projeções são muitas vezes encontradas no contexto de álgebras de operadores . Em particular, uma álgebra de von Neumann é gerada por sua rede completa de projeções.

Generalizações

De forma mais geral, dado um mapa entre espaços vetoriais normalizadospode-se analogamente pedir que este mapa seja uma isometria no complemento ortogonal do kernel: queseja uma isometria (compare isometria parcial ); em particular, deve estar em . O caso de uma projeção ortogonal é quando W é um subespaço de V. Na geometria Riemanniana , isso é usado na definição de uma submersão Riemanniana .

Veja também

Notas

  1. ^ Meyer, pp 386+387
  2. ^ a b Chifre, Roger A.; Johnson, Charles R. (2013). Análise Matricial, segunda edição . Cambridge University Press. ISBN 9780521839402.
  3. ^ Meyer, pág. 433
  4. ^ Meyer, pág. 431
  5. ^ Meyer, equação (5.13.4)
  6. ^ Banerjee, Sudipto; Roy, Anindya (2014), álgebra linear e análise matricial para estatística , textos em ciência estatística (1ª ed.), Chapman e Hall/CRC, ISBN 978-1420095388
  7. ^ Meyer, equação (5.13.3)
  8. ^ Veja também Mínimos quadrados lineares (matemática) § Propriedades dos estimadores de mínimos quadrados .
  9. ^ Banerjee, Sudipto; Roy, Anindya (2014), álgebra linear e análise matricial para estatística , textos em ciência estatística (1ª ed.), Chapman e Hall/CRC, ISBN 978-1420095388
  10. Banerjee, Sudipto (2004), "Revisitando Trigonometria Esférica com Projetores Ortogonais", The College Mathematics Journal , 35 (5): 375–381, doi : 10.1080/07468342.2004.11922099 , S2CID 122277398 
  11. ^ Banerjee, Sudipto; Roy, Anindya (2014), álgebra linear e análise matricial para estatística , textos em ciência estatística (1ª ed.), Chapman e Hall/CRC, ISBN 978-1420095388
  12. ^ Meyer, equação (7.10.39)
  13. ^ Dokovic, D. Ž. (agosto de 1991). "Semelhança unitária de projetores". Aequationes Mathematicae . 42 (1): 220–224. doi : 10.1007/BF01818492 . S2CID 122704926 . 

Referências

Links externos