A essência do problema de estimação espectral pode ser resumida pela seguinte frase: “A partir de uma gravação finita de uma seqüência de dados estacionários, estimar como a potência total está distribuída no domínio da freqüência” [16].
Dentre as diversas aplicações da estimação espectral nos mais variados campos das ciências (Economia, Meteorologia, Astronomia, Sismologia, Medicina, etc), destaca-se para o contexto deste trabalho a aplicação para sistemas de radar e sonar, de determinação da direção das fontes, recentemente estendida para aplicações com arranjos de antenas em sistemas rádio-móveis.
Há duas macro abordagens para o problema da análise espectral. Uma delas tem por idéia básica aplicar um filtro passa-banda de faixa estreita ao sinal estudado, varrendo toda a faixa de freqüências de interesse. A potência de saída do filtro dividida pela largura de faixa do filtro é usada como uma medida do conteúdo espectral do sinal original. Este procedimento corresponde essencialmente ao que os chamados métodos “clássicos” (ou “não-paramétricos”) de análise espectral fazem. A outra abordagem, conhecida como “paramétrica”, postula um modelo para os dados, o que provê uma forma de parametrizar o espectro, conseqüentemente reduzindo o problema a se estimar os parâmetros para o modelo assumido.
Os métodos paramétricos podem oferecer estimativas espectrais mais precisas que os não-paramétricos nos casos onde os dados de fato satisfazem o modelo assumido. Entretanto, no caso mais provável em que os dados não satisfaçam aos modelos assumidos, os métodos clássicos podem atuar melhor que os paramétricos devido à sensibilidade destes últimos a desvios do sinal realista com relação ao modelo. Tal observação tem motivado um interesse renovado na abordagem não-paramétrica para estimação espectral.
Este capítulo apresenta resumidamente os principais fundamentos da teoria de estimação espectral, em particular no que se refere a sinais aleatórios, que
representam melhor o comportamento dos sinais na prática. Inicialmente a densidade espectral de potência, função essencial para a análise espectral, é apresentada. Em seguida, os métodos clássicos e os paramétricos são discutidos, sendo que para estes últimos apenas os que produzem estimativas de espectro de linha são abordados, pois esta é a situação de interesse para a tese. Por fim, os princípios previamente apresentados são adaptados para a aplicação específica de interesse, que é a estimação do espectro espacial.
3.1.
Densidade espectral de potência de um sinal aleatório
Seja uma seqüência de variáveis aleatórias {y(t); t = 0, ±1, ±2,...} representando um sinal discreto no tempo. Duas hipóteses sobre o sinal são assumidas para definir-se sua densidade espectral de potência (PSD – Power
Spectral Density):
- média zero, ou seja, E{y(t)} = 0 para todo t;
- covariância r(k) = E{y(t) y*(t – k)} dependente apenas do retardo k
entre as duas amostras tomadas.
Em outras palavras, assume-se que {y(t)} é uma seqüência estacionária no sentido amplo. Outra definição importante é a de matriz covariância de {y(t)}, dada por: (3.1)
( )
( )
(
) (
)
( )
( )
(
)
(
)
(
)
( )
( )
− − − − − = 0 1 2 1 2 0 1 1 2 1 0 * * * * r r m r m r m r r r m r m r r r L M O O O M M O O O M O O L RA PSD pode ser definida como a transformada de Fourier discreta no tempo (DTFT – Discrete-Time Fourier Transform) da covariância, ou seja:
(3.2)
( )
∑
∞( )
∞ == − = k k i e k r ϖ ω φUma segunda definição de PSD é dada por:
( )
∑
= − ∞ → 2 1 1lim
N t t i N e t y N E ω (3.3)que é equivalente à definição anterior de PSD quando a seqüência covariância {r(k)} decai suficientemente rápido, de modo que:
( )
∑
− = ∞ → = N N k N k r k N 0 1lim
(3.4)Observa-se que a PSD é periódica com período igual a 2π. Com isso, a freqüência angular ω ∈ [-π, π], ou alternativamente a freqüência f =ω/2π ∈ [-½, ½]. A associação com a freqüência original do sinal contínuo associado (F) é dada por: F = f ⋅ FS, onde FS é a freqüência de amostragem, que segundo o critério de
Nyquist deve ser ≥ 2 ⋅ F0 (componente frequencial mais alta do espectro contínuo
original) para evitar o efeito de aliasing.
Dadas as definições de PSD, pode-se formalizar um pouco mais a definição do problema de estimação espectral dada no início do capítulo para: “A partir de um conjunto finito de amostras {y(1), ..., y(N)} de um processo estacionário no sentido amplo, determinar uma estimativa φ de sua PSD φ ,para ω ∈ [-π, π]. A grande limitação da qualidade da estimativa está associada normalmente ao pequeno número N de amostras disponíveis para o processamento. Em diversas aplicações, como o custo de se obter grandes seqüências de dados é muito grande,
N é feito pequeno.
( )
ωˆ
( )
ω3.2.
Métodos não-paramétricos
Os métodos não-paramétricos se baseiam inteiramente nas definições da PSD das eqs. (3.2) e (3.3) para prover estimativas espectrais. Tais métodos se constituem nas formas clássicas de estimativa espectral.
Inicialmente serão apresentados dois estimadores, o “periodograma” e o “correlograma”, derivados das eqs. (3.3) e (3.2) respectivamente. Pode-se provar que tais métodos são equivalentes sob circunstâncias relaxadas. Tais métodos provêm alta resolução para larguras dos dados longas o suficiente, mas
se que eles são estimadores pobres, pois sua variância é alta e não decresce com um maior número de amostras dos dados.
A variância elevada do periodograma e do correlograma motivaram o desenvolvimento de métodos modificados que apresentam menor variância, às custas de uma menor resolução. Dada a relativa equivalência de suas propriedades e de seus desempenhos, apenas alguns deles serão detalhados neste texto.
3.2.1.
Periodograma e correlograma
O periodograma se baseia na definição da PSD dada pela eq. (3.3), e sua fórmula é dada por:
( )
( )
2 1 1 ˆ∑
= − = N t t i p y t e N ω ω φ (3.5)O correlograma, por sua vez, baseia-se na definição da eq. (3.2) da PSD, com formulação dada por:
(3.6)
( )
( )
( )∑
− − − = − = 1 1 ˆ ˆ N N k k i c r k e ω ω φA covariância (ou autocovariância) r(k) pode ser estimada de duas formas distintas:
( )
1( ) (
)
, 0 1 * − ≥ − =∑
+ = k k t y t y k N k r N k t ) (3.7)( )
1( ) (
)
, 0 1 * − ≥ =∑
+ = k k t y t y N k r N k t ) (3.8)A estimativa de r(k) dada pela eq. (3.7) é dita “não-polarizada”, e a da eq. (3.8) é “polarizada”. Pode-se provar que a versão polarizada do correlograma coincide com a definição de periodograma.
Prova-se ainda que ambas estimativas são assintoticamente não-polarizadas, mas apresentam variância alta, mesmo para um número de amostras N elevado.
Esta variância alta é a responsável pelo desempenho considerado pobre do periodograma e do correlograma como estimadores.
A análise da polarização (bias – valor esperado) do periodograma leva naturalmente ao surgimento de um termo na equação associada que pode ser interpretado como um filtro ou uma janela triangular. Esta janela é ainda conhecida como janela de Bartlett. No domínio espectral, a janela triangular (ilustrada na Figura 2) é equacionada por:
( )
(
( )
)
2 2 2 1 = ω ω ω sen N sen N WB (3.9)Figura 2 Janela de Bartlett (triangular).
Observa-se a presença marcante de um lobo principal, e diversos lóbulos laterais. O efeito mais marcante do lobo principal é o de espalhar o espectro (smearing). A Figura 3 ilustra este efeito, que acaba por limitar a resolução da estimativa. Para a janela de Bartlett, este limite é aproximadamente 1/N.
Figura 3 Efeito de suavização ou espalhamento (smearing) causado pela largura do lobo principal da janela.
O efeito principal dos lóbulos laterais é a transferência de potência das bandas que concentram a maior parte do sinal para bandas que contém menos ou nenhuma potência. Tal efeito é chamado de “vazamento” espectral (spectral
leakage), e está ilustrado na Figura 4.
Figura 4 Efeito de “vazamento” espectral (spectral leakage) causado pela presença dos lóbulos laterais da janela.
3.2.2.
Métodos baseados no periodograma
Considerando-se a diminuição da variância uma forma de melhoria da estimativa espectral, ainda que ao preço da redução da resolução, existem diversos procedimentos baseados nas estimativas básicas do periodograma ou do correlograma. Dentre eles, dois se destacam: Blackman-Tukey (janelamento e suavização); e Bartlett (média).
Uma das possibilidades de se melhorar a estimativa espectral é aplicando uma janela à função de covariância estimada. Este método, conhecido como procedimento de Blackman-Tukey, resulta numa suavização da estimativa espectral pela convolução desta com a janela (exemplificada na Figura 5), e a estimativa toma a forma:
(3.10)
( )
( ) ( )
( )∑
− − − = − = 1 1 ˆ ˆ M M k k i BT w k r k e ω ω φFigura 5 Janela utilizada no procedimento de Blackman-Tukey.
A eficiência deste procedimento depende do projeto da janela. Quanto maior a largura M da janela, menor a polarização da estimativa, porém maior a variância. E a escolha do formato da janela estabelece um compromisso entre espalhamento (resolução) e vazamento espectral.
O procedimento de Bartlett também reduz a variância do periodograma. Já que as propriedades estatísticas do periodograma não melhoram com larguras maiores dos dados, Bartlett sugeriu uma forma mais eficiente de usar um segmento longo de dados específico: partindo este segmento em pedaços menores e tomando a média dos periodogramas resultantes, como ilustrado na Figura 6. A estimativa Bartlett é calculada como:
( )
∑
( )
= = L j j B L 1 ˆ 1 ˆ ω φ ω φ (3.11)A estimativa de Bartlett na verdade pode ser interpretada como similar à de Blackman-Tukey com janela retangular. Esta estimativa apresenta alta resolução, mas com grande vazamento espectral e variância também relativamente grande.
Figura 6 Procedimento de Bartlett: segmentação dos dados e média dos sub-blocos resultantes.
3.3.
Métodos paramétricos para espectros de linha
Para os métodos não-paramétricos apresentados anteriormente, nenhuma hipótese a respeito do sinal estudado precisou ser estabelecida, à exceção da estacionaridade. Os métodos “paramétricos” ou “baseados em modelagem” assumem que o sinal satisfaz a um modelo gerador com forma funcional conhecida, e então o processo continua estimando-se os parâmetros para o modelo assumido, como ilustrado na Figura 7. Nos casos em que o modelo assumido é uma boa aproximação da realidade, é de se esperar que os métodos paramétricos gerem estimativas espectrais melhores que as técnicas não-paramétricas. Deve-se lembrar sempre, entretanto, que esta última abordagem permanece útil para as aplicações onde há pouca ou nenhuma informação sobre o sinal em questão.
Figura 7 Diagrama de blocos ilustrando o processo de estimativa espectral paramétrica.
Ao se estudar os métodos paramétricos, costuma-se distinguir entre os voltados para espectros “racionais” ou para os espectros “de linha”. Para o primeiro, o espectro é modelado como uma função racional de e-iω, como na equação a seguir:
( )
∑
∑
≤ − ≤ − = n k k i k m k k i k e e ω ω ρ γ ω φ (3.12)O teorema de Weierstrass (do Cálculo) postula que qualquer PSD contínua pode ser aproximada por uma PSD racional na forma acima, com a condição que os índices m e n sejam escolhidos “grandes o suficiente”. Isto na verdade representa um dos problemas: a escolha dos índices não é uma tarefa simples. Mais ainda: nem sempre a PSD é contínua.
A PSD racional pode ser fatorada como a seguir:
( )
( )
( )
( )
( )
m m n n z b z b z B z a z a z A A B − − − − + + + = + + + = = L L 1 1 1 1 2 2 1 1 σ ω ω ω φ (3.13)onde σ2 é um escalar positivo. A PSD racional pode ser associada com um sinal obtido à saída de um filtro cuja função de transferência é B(ω)/A(ω), alimentado em sua entrada por um sinal de ruído branco com potência igual a σ2. Ou seja, o problema da estimação espectral é reduzido para um problema de modelagem de sinal. Um sinal que apresente m e n ≠ 0 é chamado de “auto-regressivo de média móvel” (ARMA – Auto-Regressive Moving Average). Quando m = 0 o sinal é dito “auto-regressivo” (AR – Auto-Regressive) e quando n = 0 o sinal é dito “de média móvel” (MA – Moving Average).
Quando o sinal pode ser descrito essencialmente por um modelo senoidal, como na eq. (3.14), o espectro pode ser tomado como de linha ao invés de racional. Este é o caso dos sinais encontrados em diversas aplicações, inclusive na de sondagem de AOA e TOA em sistemas rádio-móveis.
(3.14)
( ) ( ) ( )
( )
∑
( )
∑
( = + = = = = + = n k t i k n k k k k e t x t x t t e t x t y 1 1 , 2 , 1 φ ω α K )No modelo acima, x(t) representa o sinal senoidal complexo sem ruído; {αk}, {ωk}, e {φk} são respectivamente suas amplitudes, freqüências (angulares) e
fases iniciais; e(t) é um ruído aditivo. Embora na prática a maioria dos sinais encontrados seja real, em aplicações de comunicações é sempre possível transmitir-se componentes em fase e em quadratura, a partir das quais reconstrói-se a envoltória complexa do sinal.
O ruído {e(t)} é usualmente assumido como branco circular. Tal hipótese, embora nem sempre corresponda à realidade, também não pode ser considerada
restritiva. Em particular, se a forma do espectro de ruído é conhecida, é possível aplicar um filtro para tornar o ruído branco.
Quando o ruído não é branco e possui forma espectral desconhecida, ainda assim é possível se obter estimativas espectrais precisas através do método não-linear por mínimos quadrados (NLS – Nonnão-linear Least Squares). As propriedades das estimativas NLS quando o ruído é colorido ou de forma desconhecida são bem parecidas com as encontradas para o caso de ruído branco, apenas com as amplitudes dos sinais senoidais “ajustadas” para as correspondentes relações sinal-ruído locais (em cada freqüência ωk). Outros métodos, entretanto, como os
baseados em sub-espaço, dependem fortemente da hipótese que o ruído seja branco.
Algumas hipóteses adicionais ainda são necessárias para prosseguir com a estimativa da PSD espectral discreta (de linha). As amplitudes αk > 0 e as
freqüências ωk ∈ [-π, π]. As fases iniciais são consideradas como variáveis
aleatórias independentes de distribuição uniforme sobre [-π, π]. Com estas hipóteses, é possível calcular a covariância r(k) do sinal y(t), e aplicando uma DTFT a ela, obtém-se a PSD φ(ω), cujas equações seguem abaixo.
(3.15)
( )
{
( ) (
)
}
,0 2 1 2 * k n p k i p p e k t y t y E k r = − =∑
=α ω +σ δ (3.16)( )
(
)
2 1 2 2π α δ ω ω σ ω φ =∑
− = n p p p +Nas eqs. (3.15 - 3.16) acima, δ(ω - ωp) é a função delta de Dirac. Um
exemplo de PSD conforme o equacionamento acima está ilustrado na Figura 8. Fica óbvio o porquê do espectro ser chamado de linha ou discreto.
Figura 8 Exemplo de espectro de linha: sinal com 3 componentes harmônicas contaminado por ruído branco.
A discussão prévia evidencia que a análise espectral baseada no modelo paramétrico de PSD da eq. (3.16) reduz o problema a estimar os parâmetros do sinal y(t) da eq. (3.14). Na maioria das aplicações, incluindo a aplicação foco deste texto, os parâmetros de maior interesse são as localizações das linhas espectrais, ou seja, as freqüências senoidais ωk. O foco passa a ser então o de
estimação frequencial, ou seja, determinar {ωk}k=1..n a partir de um conjunto de
observações {y(t)}t=1..N. Uma vez tendo sido determinadas as freqüências, a
estimação dos demais parâmetros se torna um simples problema de regressão linear. Mais precisamente, para um conjunto dado {ωk} as observações y(t) podem
ser descritas como uma função de regressão linear cujos coeficientes são iguais aos remanescentes desconhecidos
{
i k}
ke k β α φ ≡ , como na eq. (3.17). ) (3.17) ( ) ( 1 t e e t y n k t i k k + =
∑
= ω βUma forma de se obter {βk}, se desejado, é através de um método por
mínimos quadrados (LS – Least Squares). Alternativamente, as potências {αk2} -
para um dado conjunto {ωk} - podem ser determinadas a partir da versão amostral
da eq. (3.15), dada por:
(3.18)
( )
k e resíduos r n p k i p p + =∑
=1 2 ˆ α ωonde os resíduos surgem pela limitação do número de amostras coletadas (finito). A eq. (3.18) também representa um problema de regressão linear, com os coeficientes desconhecidos dados por {αp2}.
Alguns dos principais métodos paramétricos descritos a seguir são conhecidos como “métodos de alta-resolução”. Tal denominação se deve a sua habilidade em resolver componentes discretas espectrais separadas em freqüência (f = ω/2π) por menos que 1/N ciclos por intervalo amostral, que é o limite para os métodos clássicos. Entretanto, deve-se destacar que a comparação entre os métodos de alta-resolução e os clássicos chega a ser injusta partindo-se do princípio que estes últimos nada assumem quanto aos dados analisados, enquanto
que os de alta-resolução exploram uma descrição exata do sinal estudado. Devido à essa informação adicional assumida, é esperado que um método paramétrico ofereça melhor resolução que um não-paramétrico. Por outro lado, quando não há componentes espectrais com separação menor que o limite 1/N, o periodograma convencional é um bom estimador espectral, podendo apresentar desempenho equivalente ao dos métodos de alta-resolução. Em particular, o periodograma convencional foi evidenciado, pois ele é o estimador não-paramétrico de melhor resolução, já que ele pode ser entendido como um estimador de Blackman-Tuckey com janela retangular, que é a janela que permite a maior resolução.
Assume-se, na descrição dos métodos a seguir, que o número de componentes senoidais n é conhecido. Na prática, entretanto, determinar este número corresponde a mais um problema de estimação a partir dos dados disponíveis.
3.3.1.
Método não-linear por mínimos quadrados
Uma abordagem intuitiva para a análise espectral, baseada no modelo de regressão não-linear da eq. (3.14), consiste em determinar os parâmetros desconhecidos como aqueles que minimizam a seguinte função:
(
)
( )
( ) 2 1 1 , ,∑
∑
= = + − = N t n k t i ke k k t y F ω α ϕ α ω ϕ (3.19)onde ω é o vetor que contém as freqüências ωk, e analogamente para α e ϕ. O
modelo senoidal determinado acima apresenta a menor distância (quadrática) para os dados observados . Uma vez que a função F acima é não-linear com relação a seus argumentos {ω, α, ϕ}, o método que obtém estimativas destes parâmetros, segundo a minimização acima, é chamado não linear por mínimos quadrados (NLS – Nonlinear Least Squares). E quando o ruído e(t) é gaussiano e branco, a minimização acima pode ser interpretada ainda como o método de máxima verossimilhança (ML – Maximum Likelihood). Neste caso, pode-se provar que a estimativa dada pela minimização previamente citada produz os valores mais prováveis para “explicar” a seqüência de dados observada.
( )
{ }
Nt
t y =1
O critério na eq. (3.19) depende tanto de {αk}, quanto de {ϕk}, bem como
de {ωk}. Entretanto, ele pode ser “concentrado com relação aos parâmetros de
perturbação” {αk, ϕk}, conforme explicado a seguir. Utilizando a notação:
(3.20) k i k k e ϕ α β = (3.21)
[
T n β β β = 1 L]
]
)
]
(3.22)( )
( )
[
T N y y Y = 1 L (3.23) = n n iN iN i i e e e e B ω ω ω ω L M M L 1 1a função F da eq. (3.19) pode ser reescrita como:
(3.24)
(
Y Bβ) (
Y BβF = − * −
A matriz de Vandermonde1 B na eq. (3.23) apresenta posto de coluna completo igual a n sob a condição que N ≥ n; neste caso, (B*B)-1 existe. A função
F pode ser então reescrita de forma mais conveniente como a seguir:
( )
[
B B B Y]
[ ]
B B[
( )
B B B Y]
Y Y Y B( )
B B B YF = β − * −1 * * * β − * −1 * + * − * * −1 * (3.24)
Para qualquer escolha de ω em B (que seja tal que
para k ≠ p), pode-se escolher B para tornar o gradiente de F em (3.24) igual a um vetor nulo. Com isso, os vetores β e ω que minimizam F são:
[
T n ω ω1,K, = p k ω ω ≠1 Uma matriz A ∈ Cmxn é dita de Vandermonde se apresenta a seguinte estrutura:
, onde zk∈ C e são normalmente assumidos distintos.
= − −1 1 1 1 1 1 m n m n z z z z A L M M L
( )
ω ω βˆ * 1 * ˆ = − = B B B Y (3.25) (3.26)( )
B B B Y B Y* * 1 * max arg ˆ = − ω ωA estimativa de ω converge à medida que N → ∞ (ela é dita “consistente”), e pode-se provar que, quando o ruído é gaussiano e branco, a matriz covariância dos erros tende assintoticamente para a matriz limitante de Cramér-Rao. Ou seja, o método proporciona uma estimativa de excelente precisão.
Outra vantagem associada ao método NLS, particularmente quando comparado aos métodos sub-espaciais apresentados a seguir, é que o método não depende criticamente da hipótese de ruído branco. Mesmo quando o ruído não é branco, a estimativa NLS ainda permanece consistente. E mesmo quando o ruído é colorido, prova-se que a estimativa NLS permanece como o método mais preciso.
A grande desvantagem do método NLS se deve à forma multimodal complicada, com um máximo global para a eq. (3.26) muito agudo. Ou seja, encontrar ω com um algoritmo de busca requer uma inicialização muito precisa. E apesar de se encontrar na literatura diversos métodos de inicialização, nenhum efetivamente pode garantir convergência para o máximo global.
ˆ
3.3.2.
Método de Pisarenko e MUSIC
Os métodos de Pisarenko [17] e MUSIC (MUltiple SIgnal Classification – classificação de sinais múltiplos) [18] são derivados do chamado “modelo de matriz covariância”. Para descrever este modelo, sejam as seguintes matrizes:
(3.27)
( )
[
( )]
( )
( )
[
a a]
(
m n)
A e e a n T m i i × = = − − − ω ω ω ω ω K K 1 1 1onde m (número de amostras) é um inteiro positivo. A matriz A é uma matriz de Vandermonde, que goza da seguinte propriedade quanto a seu posto:
posto(A) = n (para m ≥ n) (3.28)
Dada a notação acima, e tomando o sinal y(t) da eq. (3.14), têm-se: (3.29)
( )
( )
( )
(
)
( ) ( )
t e t x A m t y t y t y t y ~ ~ 1 1 ~ = + + − − =∆ M (3.30)( )
[
( )
( )
]
( )
[
( )
(
)
]
T T n m t e t e t e t x t x t x 1 ~ ~ 1 + − = = K KA matriz covariância do vetor ~ ty( ) da eq. (3.29) é dada por:
(3.31)
( ) ( )
{
y t y t}
APA I ER=∆ ~ ~* = * +σ2
onde a matriz P é dada por:
(3.32)
( ) ( )
{
}
= = 2 2 1 * 0 0 ~ ~ n t x t x E P α α OAs equações acima constituem o modelo de matriz covariância dos dados analisados. A autoestrutura de R contém informação completa sobre as freqüências {ωk}, daí a utilidade da eq. (3.31).
Conforme previamente mencionado, os métodos de Pisarenko e MUSIC são derivados do modelo acima descrito, com m > n. Sejam λ1 ≥ λ2 ≥ ... ≥ λm os
autovalores de R na eq. (3.31), arrumados em ordem decrescente. Sejam {s1, ...,
sn} os autovetores ortonormais associados com {λ1, ..., λn}, e seja ainda {g1, ...,
gm-n} um conjunto de autovetores ortonormais correspondentes a {λn+1, ..., λm}.
Como o posto de APA* é igual a n, esta matriz apresenta n autovalores estritamente positivos, e os (m – n) restantes são todos nulos. Combinando esta
observação com o fato que λ , onde são os
autovalores de APA
(
k m)
k k 1, , ~ 2 K = + =λ σ{ }
λ~k mk=1* (arrumados em ordem decrescente), chega-se ao seguinte
resultado:
(3.33) + = = = > m n k para n k para k k , , 1 , , 1 2 2 K K σ λ σ λ
O conjunto de autovalores de R pode ser então dividido em dois sub-conjuntos. Os autovetores associados com cada um destes subconjuntos possuem propriedades interessantes que são utilizadas para a estimação frequencial. Sejam as matrizes:
[
]
(
)
[
g g]
(
m(
m n G n m s s S n m n − × = × = − K K 1 1))
(3.34)compostas pela justaposição dos autovetores dos dois subconjuntos em questão. A matriz covariância R da eq. (3.31) pode ser escrita em função de seus autovalores
como:
{ }
m k k =1 λ (3.35)[
]
= ** 1 G S G S R m λ λ ODas eqs. (3.31) e (3.33) tem-se:
(3.36) = = + = + m n G G G G APA RG λ λ σ σ 0 0 1 2 2 * O
Ou seja, na equação acima, percebe-se que APA*G é nula. Mais ainda, como AP tem posto completo, na verdade quem se anula é o termo A*G. Em outras
palavras, as colunas {gk} de G pertencem ao subespaço nulo de A*. Como o posto
de A é igual a n, a dimensão do subespaço nulo de A* é igual a (m – n) que também é a dimensão do subespaço de G. Com isso, pode-se afirmar que o subespaço de G é igual ao subespaço nulo de A*, ou seja, que os vetores {gk}
geram ambos os subespaços. Analogamente, prova-se que o subespaço de S é
igual ao subespaço de A. Os subespaços de S e de G são usualmente chamados de “subespaço de sinal” e “subespaço de ruído”, respectivamente.
Da discussão prévia, chega-se à conclusão chave que os valores originais de freqüência
{ }
n são as únicas soluções da equação:k k =1 ω (3.37)
( )
GG a( )
para qualquerm n a* ω * ω = 0 >O algoritmo MUSIC utiliza o resultado chave acima para calcular estimativas frequenciais, de acordo com o seguinte roteiro. Inicialmente, calcula-se a matriz covariância amostral:
∑
= = N m t t y t y N Rˆ 1 ~( )~*( ) (3.38)e sua autodecomposição. Analogamente, sejam e G as matrizes correspondentes a S e G respectivamente, mas construídas a partir dos autovetores
e
{
de . O segundo passo é determinar as estimativas frequenciais como as localizações dos n picos mais altos da função:Sˆ ˆ
{
sˆ1,K,sˆn}
gˆ1,K,gˆm−n}
Rˆ( )
ω ˆ ˆ( )
ω , ω[
π,π 1 * * GG a ∈− a]
(3.39)que é chamada algumas vezes de “pseudo-espectro”, já que ele indica a presença das componentes senoidais no sinal estudado, mas não é uma PSD verdadeira. Por causa desta característica, este procedimento é conhecido como “MUSIC espectral”.
Para m = n + 1 (valor mínimo possível), o algoritmo MUSIC se reduz ao chamado método de Pisarenko, que foi a primeira proposta de estimação frequencial sub-espacial. Computacionalmente, este método é a versão mais simples possível do MUSIC, com o benefício adicional de não haver a necessidade de separar os autovalores de sinal dos de ruído (é simplesmente o menor valor). Entretanto, a precisão do MUSIC cresce significativamente com m,
e, portanto, o preço pago pela simplicidade computacional do método de Pisarenko pode ser uma precisão estatística relativamente pobre.
3.3.3. ESPRIT Sejam: (3.40)
[
I]
A m n A1 = m−1 0 ( −1)× (3.41)[
I]
A m n A2 = 0 m−1 ( −1)×onde A é definida como na eq. (3.27), Im-1 é a matriz identidade de dimensão
(m-1)×(m-1) e as matrizes
[
]
e são (m-1)×m. É facilmente verificável que: 0 1 − m I[
0 Im−1]
]
]
(3.42) D A A2 = 1onde a matriz D é dada por:
(3.43) = − − n i i e e D ω ω 0 0 1 O
Uma vez que D é uma matriz unitária2 a transformação na eq. (3.42) é uma rotação. O método ESPRIT (Estimation of Signal Parameters by Rotational
Invariance Techniques – estimação de parâmetros de sinal por técnicas de
invariância rotacional) [19] baseia-se na transformação expressa na eq. (3.42) como detalhado a seguir. A exemplo das eqs. (3.40) e (3.41), sejam:
(3.44)
[
I S S1 = m−1 0 (3.45)[
I S S2 = 0 m 1−2 Dada uma matriz quadrada A, a matriz composta pela justaposição de vetores coluna que
são os autovetores de A é dita “unitária”.
onde S é definida como na eq. (3.34). Ainda se referindo à descrição do MUSIC, como o subespaço de S e A são os mesmos, tem-se que:
(3.46)
AC S =
onde C é a matriz não-singular n×n (uma vez que tanto S quanto A têm posto de coluna completo) dada por:
(3.47)
1 * Λ−
=PA S C
com a matriz Λ definida por:
(3.48) − − = Λ 2 2 1 0 0 σ λ σ λ n O
Utilizando as eqs. (3.40) a (3.42) e (3.46) pode-se escrever:
(3.49) Φ = = = = − 1 1 1 1 2 2 AC ADC S C DC S S onde (3.50) DC C−1 = Φ
Devido à estrutura de Vandermonde de A, as matrizes A1 e A2 apresentam posto de coluna completo (igual a n). Com a eq. (3.46) em vista, S1 e S2 também devem apresentar posto de coluna completo. Com isso, da eq. (3.49) a matriz Φ é dada exclusivamente por:
(3.51)
( )
2 * 1 1 1 * 1S S S S − = ΦA fórmula acima expressa Φ como uma função de algumas grandezas que podem ser estimadas a partir das amostras disponíveis. A importância de se poder estimar Φ reside no fato de que Φ e D apresentam os mesmos autovalores. A eq. (3.50) é dita uma “transformação de similaridade” entre Φ e D.
Do exposto, o método ESPRIT estima as freqüências
{ }
como , onde{ }
são os autovalores da seguinte estimativa da matriz Φ:n k k =1 ω
(
νˆk arg −)
n k k 1 ˆ = ν (3.52)( )
1* 2 1 1 * 1 ˆ S S − S S = ΦDeve-se ressaltar que a estimativa de Φ dada pela equação acima é obtida implicitamente pela solução do seguinte sistema linear de equações:
(3.53)
2
1ˆ ˆ
ˆ S
S Φ≅
por um método LS. Na prática, foi constatado empiricamente que uma maior precisão pode ser obtida se a eq. (3.53) for resolvida por um método LS “total” (o erro quadrático é tomado separadamente nos dois lados da equação).
A precisão estatística do ESPRIT é similar à dos demais métodos sub-espaciais. Na verdade, na maioria dos casos o ESPRIT pode produzir estimativas um pouco mais precisas que os demais métodos, a um custo computacional similar. Mais ainda, no ESPRIT não há o problema da separação das “raízes” (autovalores) de sinal das “raízes” de ruído, como observado na eq. (3.52). Em função destes pontos positivos, o ESPRIT é usualmente o método recomendado como a primeira escolha em aplicações de estimação frequencial.
3.4.
Métodos espaciais
O problema de localizar n fontes radiantes usando-se um arranjo de m sensores passivos, como ilustrado na Figura 9, é abordado aqui. A energia irradiada pelas fontes pode ser acústica, eletromagnética, mecânica, etc e os sensores podem ser quaisquer transdutores que convertam a energia recebida em sinais elétricos. No caso em evidência desta tese, os sensores são antenas que captam a energia eletromagnética irradiada por outras antenas de um sistema de
comunicações. O problema consiste essencialmente em determinar como a energia está distribuída pelo espaço (no caso, ar), com as posições das fontes representando pontos no espaço com alta concentração de energia. Daí a denominação do problema como de “estimação espectral espacial”. Mais ainda, o problema em questão apresenta forte ligação com o problema da estimação espectral temporal, abordado nas seções anteriores deste texto, e que são a base das soluções adotadas para o problema da localização de fontes.
Figura 9 Ilustração do problema da localização de fontes.
As fontes da Figura 9 geram um campo ondulatório que viaja através do espaço e é amostrado, tanto no espaço quanto no tempo, pelo arranjo de sensores. Analogamente à amostragem temporal, a amostragem espacial provê mais informação sobre as ondas que chegam, à medida que a abertura do arranjo aumenta. Uma definição simplificada para abertura é o espaço ocupado pelo arranjo em unidades de comprimento de onda do sinal. Não é surpresa, portanto, que um arranjo de sensores seja capaz de prover desempenho bem superior que uma antena isolada, em aplicações como antenas inteligentes e sistemas de localização.
O desenvolvimento do modelo de arranjo (array model) é baseado em algumas hipóteses simplificadoras. Para começar, as fontes atendem à condição de campo distante do arranjo. Para a abordagem nesta seção, assume-se ainda um problema bidimensional (2D), ou seja, as fontes e os sensores ocupam um mesmo plano no espaço. As fontes são consideradas emissores pontuais. O meio de propagação é homogêneo, e as ondas ao chegarem nos sensores são planas. Sob estas hipóteses, o único parâmetro que caracteriza as posições das fontes é o chamado ângulo de chegada (AOA) ou direção de chegada (DOA).
Outra hipótese assumida no desenvolvimento do modelo de arranjo é que o número de fontes n é conhecido. Na prática, entretanto, a estimação de n é um problema de importância significativa, normalmente referido como “problema de detecção”. E por fim, assume-se que os sensores no arranjo podem ser modelados como sistemas lineares invariantes no tempo, com funções de transferência e localizações conhecidas. Em suma, assume-se que o arranjo está “calibrado”.
3.4.1.
Modelo de arranjo
Inicialmente será considerado o caso de um único emissor. Estabelecido o modelo para este caso, o modelo geral para um número qualquer de fontes é obtido simplesmente pelo princípio da superposição.
Seja uma onda incidente em um arranjo e seja x(t) o valor do sinal medido em um ponto de referência, no instante t. O “ponto de referência” pode ser um dos sensores do arranjo (mais comum), ou qualquer outro ponto próximo o suficiente do arranjo para que as hipóteses assumidas para o problema se mantenham. Os sinais recebidos pelos elementos do arranjo são ondas contínuas e, portanto, t é uma variável contínua por enquanto.
Seja τk o tempo necessário para que a onda viaje do ponto de referência ao
sensor k (k = 1, ..., m). A saída do sensor k pode ser escrita como:
( )
t h( ) (
t xt)
e( )
tyk = k ∗ −τk + k (3.54)
onde hk
( )
t é a resposta ao impulso do k-ésimo sensor, “*” denota a operação de convolução, e ek( )
t é um ruído aditivo. Na eq. (3.54), hk( )
t é assumido conhecido e o sinal de entrada x(t), assim como o retardo τk são desconhecidos. Osparâmetros que caracterizam a localização da fonte entram na eq. (3.54) através de {τk}. Portanto, o problema de localização da fonte é basicamente o de se estimar o
tempo de retardo para a entrada desconhecida.
A transformada de Fourier do sinal de saída do sensor k pode ser escrita como:
( )
ω( ) ( )
ω ω ωτ( )
ω k i k k H X e E Y = − k + (3.55)Como o problema em questão envolve sinais de comunicações, assume-se que o sinal x(t) é um sinal modulado real, ou seja, um sinal passa-banda. Para fins de processamento de sinal, é mais conveniente trabalhar-se com o sinal em banda básica original s(t). Sendo ωc a freqüência da portadora, no domínio da freqüência
têm-se as seguintes relações entre x(t) e s(t), que também é chamada de envoltória complexa de x(t): (3.56)
( ) (
S c)
S(
(
c)
X ω = ω −ω + ∗ − ω+ω)
( )
t( )
t ei ( )t s =α ϕ (3.57)( )
t[
s( )
t e]
( )
t(
t( )
t x =2Re iωct =2α cosωc +ϕ)
(3.58)Substituindo a eq. (3.56) na eq. (3.55), tem-se:
( )
ω( ) (
ω[
ω ω)
(
ω ω)
]
ωτ( )
ω k i c c k k H S S e E Y = − + ∗ − − − k + (3.59)Seja o sinal demodulado do sensor k e Y sua transformada de Fourier:
( )
t yk ~( )
ω k ~( )
( )
i t k k t y t e c y = −ω ~ (3.60)( )
(
) ( )
[
(
)
]
( )(
c k i c c k k H S S e E Y~ ω = ω +ω ω + ∗ −ω −2ω − ω+ωc τk + ω +ω)
(3.61)Utilizando um filtro passa-baixas para eliminar a componente em torno de 2ωc, tem-se:
( )
(
) ( )
( )(
c k i c k k H S e E Y ω = ω +ω ω − ω+ωcτk + ω+ω)
)
(3.62)onde Hk
(
ω +ωc)
e Ek(
ω +ωc são as parcelas filtradas de Hk(
ω +ωc)
e(
ω +ωc)
k
E , respectivamente.
Adota-se agora a chamada hipótese faixa-estreita, na qual |S(ω)| decresce rapidamente com o aumento de |ω|. Com isso, a eq. (3.62) pode ser aproximada para: (3.63)
( )
( ) ( )
k(
c)
i c k k H S e E Y ω = ω ω −ωcτk + ω+ω (3.64)( )
t H( )
e s( )
t e( )
t y i k c k k = c k + −ωτ ωonde ek(t) é na verdade a transformada inversa de Ek(ω + ωc).
A implementação em hardware requerida para se obter {yk(t)} está ilustrada
na Figura 10. No esquema desta figura, amostras das componentes real e imaginária do sinal analógico em banda básica yk(t) são geradas, e em seguida
digitalizadas. A taxa de amostragem tende a ser baixa, pois está associada à largura do sinal em banda básica, aplicando-se o critério de Nyquist. Esta versão amostrada digitalmente de {yk(t)} é utilizada por um “processador digital” para
estimar a DOA. A forma digital de {yk(t)} satisfaz a uma equação análoga à eq.
(3.64). Para não haver confusão de notação entre as versões analógica e digital de {yk(t)}, a partir daqui a variável temporal t assumirá o domínio discreto, tomando
os valores t = 1, ..., N.
Figura 10 Diagrama em blocos simplificado do processamento analógico em um elemento (sensor) receptor de um arranjo.
O conceito de “vetor diretor” ou “vetor de transferência do arranjo” (direction vector ou array transfer vector, respectivamente [22-24]) assume a forma de:
(3.65)
( )
[
( )
( )
i T c m i c e c H e c m H aθ = ω −ωτ ω −ωτ K 1 1]
]
]
}
]
onde θ denota a DOA da fonte, que é o parâmetro de interesse no problema em questão. Uma vez que se assume o conhecimento prévio das funções de transferência e das posições dos sensores no arranjo, o vetor na eq. (3.65) é função unicamente de θ, como indicado pela notação usada. A partir das eqs. (3.65) e (3.64), tem-se: (3.66)
( ) ( ) ( ) ( )
t a s t et y = θ + onde (3.67)( )
[
( )
( )
T m t y t y t y = 1 K (3.68)( )
[
( )
( )
T m t e t e t e = 1 Ksão os vetores de saída do arranjo e de ruído aditivo, respectivamente. Cabe salientar que θ entra na eq. (3.65) não só através de {τk}, mas também através de
{Hk(ωc)}. Em alguns casos, os sensores são considerados onidirecionais sobre o
domínio DOA de interesse, e então
{
são independentes de θ. Mais ainda, em certos casos os sensores são assumidos idênticos. Nesta situação, se o sinal H(ω( )
m k c k H ω =1c)s(t) for redefinido como s(t) e o primeiro sensor for selecionado como
o ponto de referência, a eq. (3.65) pode ser simplificada para:
(3.69)
( )
[
i i T m c c e e aθ = −ωτ −ωτ K 2 1A extensão da eq. (3.66) para o caso de fontes múltiplas é direta, dada a hipótese que os elementos do arranjo são lineares. O princípio da superposição leva ao seguinte modelo de arranjo:
(3.70)
( )
[
( )
( )
]
( )
( )
t e( )
t As( ) ( )
t et s t s a a t y n n + ≡ + = K M 1 1 θ θonde θk é a DOA da k-ésima fonte e s(t) o sinal correspondente à k-ésima fonte. A
matriz A é usualmente chamada de array manifold. É interessante salientar que o modelo acima se baseia principalmente na hipótese faixa-estreita. A hipótese de onda plana ainda não foi usada até aqui. Esta hipótese é utilizada para derivar a dependência explícita de {τk} como função de θ. Para exemplificar esta
dependência, uma geometria especial para o arranjo será abordada: a uniforme linear.
A Figura 11 ilustra um arranjo com m sensores idênticos uniformemente separados ao longo de uma linha. Tal arranjo é comumente referido como um arranjo linear uniforme (ULA – Uniform Linear Array). Seja d a distância entre dois sensores consecutivos, e θ a DOA do sinal iluminando o arranjo, medida no sentido anti-horário com relação à normal à linha dos sensores. Então, sob a hipótese de ondas planas e que o primeiro elemento é escolhido como o ponto de referência, tem-se:
(
−)
( )
∈[
− ° ° = 1 senθ , θ 90 ,90 τ para c d k k]
]
(3.71)onde c é a velocidade de propagação da onda incidente (velocidade da luz no caso de ondas eletromagnéticas). Inserindo a eq. (3.71) na eq. (3.69) tem-se:
(3.72)
( )
[
i d c i(m ) d c T c c e e aθ = 1 −ω senθ/ − −1ω senθ/ KFigura 11 Exemplo de arranjo linear uniforme (ULA).
A restrição de θ para pertencer ao intervalo [-90o, 90o] é uma limitação de ULAs: duas fontes em localizações simétricas com relação à linha do arranjo compreendem conjuntos idênticos de retardos {τk}, não podendo ser distinguidas
uma da outra. Na prática, esta ambigüidade é eliminada usando-se sensores que recebam sinais apenas dentro do intervalo permitido.
Sendo λ o comprimento de onda do sinal, define-se:
λ θ θ sen sen d c d f fs = c = (3.73)
Com a notação acima, o vetor de transferência do arranjo descrito pela eq. (3.72) pode ser reescrito como:
(3.74)
( )
[
i s i(m ) s T e e aθ = 1 −ω − −1ω K]
que é um vetor de Vandermonde completamente análogo ao vetor composto pelas amostras uniformes de um sinal senoidal
{ }
e−iωst .Explorando a analogia acima, inicialmente chama-se fs (ωs = 2πfs) de
“freqüência espacial”. Em segundo lugar, recordando o teorema da amostragem de Nyquist, se um sinal senoidal contínuo no tempo com freqüência fc deve ser
amostrado de modo a não produzir efeitos de aliasing, a taxa amostral deve satisfazer a f0 ≥ 2fc. No caso da ULA em questão, verifica-se que o vetor na eq.
(3.74) é definido unicamente (ou seja, sem aliasing espacial) se e somente se |ωs|
≤ π. Ou equivalentemente: 2 2 1 ⇔ senθ ≤λ ≤ d fs (3.75)
que é satisfeito se d ≤ λ/2. Uma vez que a ULA pode ser interpretada como um amostrador espacial uniforme da onda incidente, este último critério simplesmente diz que o período amostral (espacial) d deve ser menor que metade do
comprimento de onda do sinal. Por analogia, este resultado é usualmente interprestado como teorema amostral de Nyquist espacial.
Com o modelo de arranjo da eq. (3.70), o problema de se encontrar DOAs pode ser reduzido ao de estimação dos parâmetros {θk} naquela equação. Como
há uma analogia direta entre a eq. (3.70) e o modelo para sinais senoidais ruidosos da eq. (3.29), é de se esperar que a maioria dos métodos disponíveis para a estimativa espectral temporal também possam ser utilizados para o problema da estimação de DOA.
3.4.2.
Métodos não-paramétricos
Os métodos aqui descritos não fazem nenhuma hipótese inicial sobre a estrutura de covariância dos dados. Como tais, eles são ditos “não paramétricos”. Entretanto, nesses métodos o arranjo precisa estar calibrado, é necessário o conhecimento prévio do vetor de transferência a(θ) associado ao arranjo.
A Figura 12 faz uma analogia entre uma filtragem temporal FIR (Finite
Impulse Response – resposta ao impulso finita) e uma filtragem espacial usando
um arranjo de sensores. No caso temporal discreto, um filtro FIR é definido por:
(3.76)
( )
∑
−(
)
( )
= ∗ ≡ − = 1 0 m k k F t h u t k h yt yonde {hk} são os pesos dos filtros, u(t) é o sinal na entrada do filtro e:
(3.77)
[
∗ − = h0 hm 1 h K]
]
(3.78)( )
t[
u( )
t u(
t m)
T y = K − +1De forma análoga, as amostras espaciais
{
obtidas com um arranjo de sensores podem ser usadas para definir um filtro espacial:( )}
m k k t y =1 (3.79)( )
t h y( )
t yF = ∗Figura 12 Analogia entre amostragem/filtragem temporal e as correspondentes operações espaciais desempenhadas por um arranjo de sensores.
A saída (sem ruído) filtrada espacialmente de um arranjo iluminado por uma frente de onda faixa-estreita com envoltória complexa s(t) e DOA igual a θ é dada por:
( )
t[
h a( )
]
s( )
tyF = ∗ θ (3.80)
Esta equação mostra claramente que o filtro espacial pode ser selecionado para amplificar (atenuar) os sinais chegando de uma dada direção θ, fazendo h*a(θ) na
eq. (3.80) grande (pequeno). A abordagem aqui apresentada é conhecida como “por banco de filtros”, e consiste resumidamente no seguinte. Se um filtro h é projetado tal que deixe passar sem distorção os sinais com uma dada DOA θ e atenue todas as outras DOAs diferentes de θ o máximo possível, então a potência do sinal filtrado espacialmente na eq. (3.79), que é dada por:
( )
{
y t}
h Rh R E{
y( ) ( )
t y tE F 2 = ∗ , = ∗
}
(3.81)deve apresentar uma boa indicação da quantidade de energia chegando na direção θ. Portanto, h*Rh deve apresentar picos nas DOAs das fontes localizadas no
campo de visão do arranjo quando avaliadas sobre o domínio de DOAs de interesse. Este fato é explorado para fins de estimação de DOA, como nos métodos de “conformação de feixe” (beamforming) [20] e de Capon [21].
No método por conformação de feixe, o filtro associado deve atender à seguinte condição:
(3.82)
( )
1minh∗h sujeitoa h∗aθ =
h
A solução para o problema acima é dada por:
(3.83)
( ) ( ) ( )
θ a θ aθa h= / ∗
Quando os sensores são idênticos, tem-se que:
(3.84)
( ) ( )
a m a∗ θ θ =o que reduz a eq. (3.83) a:
(3.85)
( )
ma h= θ /
que inserida na eq. (3.81) resulta em:
( )
{
y t 2}
a( ) ( )
Ra / m2E F = ∗ θ θ (3.86)
Como a matriz covariância teórica não pode ser determinada de maneira exata a partir do conjunto finito de amostras disponíveis, em seu lugar toma-se sua estimativa:
( ) ( )
∑
= ∗ = N t t y t y N R 1 1 ˆ (3.87)Desta forma e omitindo o termo 1/m2 em (3.86), que não traz influencia alguma à estimação de DOA, obtém-se o método por conformação de feixe que determina as DOAs como os n picos mais altos da função:
(3.88)
( ) ( )
θ aR θa∗ ˆ
A expressão acima é análoga à encontrada para o periodograma de Blackman-Tukey (BT) com janela de Bartlett de largura 2m + 1. Ou seja, o método por conformação de feixe é uma extensão espacial direta do periodograma. De fato, a função na eq. (3.88) pode ser entendida como tendo sido obtida pela média dos “periodogramas espaciais” sobre o conjunto de snapshots3 disponíveis (t = 1, ..., N):
( ) ( )
2t y
a∗ θ (3.89)
A conexão supracitada entre a conformação de feixe e o periodograma BT inclui as propriedades de resolução de ambos os métodos. Prova-se que a largura de feixe do filtro espacial usado na conformação de feixe é aproximadamente igual ao inverso da abertura do arranjo (em unidades de comprimentos de onda).
A analogia entre o periodograma BT e a conformação de feixe apresenta alguns pontos de divergência. Por exemplo, a consistência da estimativa não apresenta analogia total. Prova-se que a estimativa de DOA é consistente apenas quando existe uma única direção de origem (n = 1). No caso geral de múltiplas fontes, a estimativa é inconsistente.
Outra divergência na analogia supracitada, ainda que aparentemente pequena, diz respeito à escolha da largura da janela (m). Para o periodograma BT, a largura da janela de Bartlett é escolhida de acordo com a conveniência do usuário, enquanto que na conformação de feixe m é fixo. Embora aparentemente irrelevante, esta diferença tem grande impacto nas supracitadas propriedades de consistência da conformação de feixe. Mais precisamente, prova-se que as estimativas espectrais temporais por periodogramas com janela de Bartlett são consistentes se m cresce sem limites à medida que o número de amostras N tende a infinito. Para a conformação de feixe, por outro lado, o valor de m é limitado por considerações físicas. Isto impede que a conformação de feixe apresente estimativas consistentes no caso de fontes múltiplas. Uma dificuldade adicional no caso espacial é que os sinais podem estar correlacionados um com o outro, enquanto que no caso da estimação frequencial temporal os sinais são sempre descorrelatados.
3Uma snapshot é o vetor y(t) obtido da amostragem no instante de tempo t.
Resumindo, para que se obtenha uma estimativa de DOA razoavelmente precisa por conformação de feixe no caso geral (múltiplas fontes), é preciso inicialmente que o modelo de arranjo da eq. (3.70) se aplique ao problema. Neste caso, é preciso ainda que a separação mínima entre as DOAs seja maior que a largura de feixe do arranjo (o que implica em m grande), que os sinais estejam descorrelacionados, e que o ruído seja espacialmente branco. Quando estas condições são obtidas, o problema geral se “desacopla” aproximadamente em n espectros de fonte única, resultando em uma estimativa confiável.
O projeto de filtro espacial associado ao método de Capon é dado por:
(3.90)
( )
1minh∗Rh sujeitoa h∗aθ =
h
A garantia que o sinal não seja distorcido para uma dada DOA é a mesma da abordagem por conformação de feixe: . A outra condição associada ao projeto do filtro é que distingue os dois métodos. Para atenuar as demais DOAs que não a(s) desejada(s), no método de Capon a formulação é “dependente dos dados” (aqui representados pela matriz covariância R), enquanto que na conformação de feixe ela era independente. Conseqüentemente, o objetivo do filtro de Capon apontado para uma certa DOA θ é atenuar qualquer outro sinal que realmente incida sobre o arranjo vindo de uma DOA ≠ θ, enquanto que o filtro de conformação de feixe distribui igualmente seu esforço para todas as outras DOAs ≠ θ, mesmo que não haja sinal em várias destas DOAs.
( )
=1∗aθ
h
A solução para a eq. (3.90) é dada por:
( )
( )
θ( )
θ θ a R a a R h 1 1 − ∗ − = (3.91)e quando inserida na eq. (3.81), que expressa a potência de saída, resulta em:
( )
{
}
( )
θ( )
θ a R a t y E F 2 = ∗ 1−1 (3.92)Mais uma vez, como não é possível obter a matriz covariância R exata, usa-se uma estimativa na equação acima. Com isso, as estimativas de DOA pelo método de Capon são dadas pelos n picos mais altos da função:
( )
θ R a( )
θa ˆ 1
1
−
∗ (3.93)
Há uma hipótese implícita na equação acima que a matriz exista. Isto pode ser garantido sob condições não muito restritivas; em particular, existe com probabilidade 1 se N ≥ m e se o termo de ruído apresenta uma matriz covariância espacial positivo-definida.
1 ˆ− R 1 ˆ− R
Verifica-se empiricamente que a estimação de DOA pelo método de Capon apresenta desempenho superior ao da conformação de feixe. A vantagem comum aos dois métodos não paramétricos é que nada se assume quanto às propriedades estatísticas dos dados, sendo apropriados portanto, às situações nas quais não se disponha daquelas informações. Entretanto, quando tais informações são disponíveis, por exemplo na forma de um modelo de covariância dos dados, o desempenho dos métodos não paramétricos não se iguala ao da abordagem baseada em modelos (paramétrica).
3.4.3.
Métodos paramétricos
O modelo de arranjo da eq. (3.70) será utilizado aqui. Mais ainda, assume-se que o ruído é espacialmente branco, com componentes apresentando variância idêntica de modo que:
( ) ( )
{
et e t}
IE ∗ =σ2 (3.94)
Por sua vez, a matriz covariância do sinal:
( ) ( )
{
s t s t}
E
P= ∗ (3.95)
é assumida não-singular (embora não necessariamente diagonal). Portanto os sinais podem estar parcialmente correlacionados. Quando os sinais estão
totalmente correlacionados, de modo que P seja singular, diz-se que eles são “coerentes”. Por fim, assume-se que os sinais e o ruído são descorrelatados um do outro.
Sob as hipóteses anteriores, a matriz covariância teórica do vetor de saída do arranjo é dada por:
( ) ( )
{
y t y t}
APA I ER= ∗ = ∗ +σ2 (3.96)
Há uma analogia direta entre o modelo de arranjo da eq. (3.70) com as hipóteses acima expressas pelas eqs. (3.94) a (3.96) e com o modelo correspondente para a estimativa espectral temporal do sub-capítulo 3.3. Mais especificamente, o modelo de “regressão não linear” do arranjo expresso pela eq. (3.70) é análogo à eq. (3.29), e o modelo de covariância do arranjo da eq. (3.96) é praticamente o mesmo que o da eq. (3.31). Como conseqüência dessas analogias, todos os métodos introduzidos no sub-capítulo 3.3 para estimação frequencial podem ser usados também para estimação de DOA sem qualquer modificação essencial. Os principais métodos daquele sub-capítulo serão revistos aqui, destacando as diferenças entre as duas aplicações (estimação frequencial × DOA).
Um dos métodos paramétricos que merece destaque é o método NLS (Nonlinear Least Squares- não linear por mínimos quadrados), que determina as DOAs desconhecidas como sendo os elementos que minimizam a seguinte função:
( )
( )
∑
= − = N t t As t y N f 1 2 1 (3.97)A minimização com relação a {s(t)} resulta em:
(3.98)
( )
t( )
A A A y( )
t t N s = ∗ −1 ∗ =1,K,Após alguma manipulação algébrica das equações acima, prova-se que as estimativas NLS de DOA são dadas por:
4
{ }
{ }k tr[
A( )
A A A R]
k argmax ˆ ˆ ∗ −1 ∗ = θ θ (3.99)Pode-se provar que a conformação de feixe apresenta uma solução aproximada para o problema NLS acima, sempre que se saiba de antemão que as DOAs estejam bem separadas umas das outras. Para compreender de modo simplificado esta possibilidade, suponha-se que a busca pelos argumentos que maximizam a eq. (3.99) seja restringida a um conjunto de DOAs bem afastadas umas das outras (de acordo com a informação a priori de que as DOAs verdadeiras pertencem a este conjunto). Num conjunto como este, sob condições fracas, e portanto a função na eq. (3.99) pode ser aproximada para:
mI A A∗ ≅
( )
[
]
( ) (
k n k k Ra a m R A A A A tr∑
θ θ = ∗ ∗ − ∗ ≅ 1 1 ˆ 1 ˆ)
(3.100)A função argumento do somatório no lado direito da equação acima é igual à função determinada no método por conformação de feixe da eq. (3.88). Este somatório é maximizado justamente com as estimativas de DOA obtidas por conformação de feixe, que são os picos da eq. (3.88), dentro do conjunto considerado.
Uma diferença entre a eq. (3.99) e o problema de otimização correspondente na aplicação de estimação frequencial reside no fato de que, neste último, apenas uma snapshot de dados está disponível, em contraste com as N snapshots disponíveis na aplicação de estimação de DOA. Outra diferença ainda mais importante é que para os casos não ULA, a matriz A na eq. (3.99) não apresenta a estrutura de Vandermonde da matriz correspondente na eq. (3.25) da aplicação frequencial. Conseqüentemente, diversos algoritmos utilizados para resolver (aproximadamente) o problema de estimação frequencial não mais se aplicam à solução da eq. (3.99), a menos que o arranjo seja ULA.
O algoritmo MUSIC desenvolvido no sub-capítulo 3.3 para aplicação de estimação frequencial, pode ser utilizado sem modificação para estimação de
4O traço de uma matriz A∈Cm×m é definido como tr
( )
∑
= ≡ m i ii A A 1
DOA. Há apenas algumas pequenas diferenças entre as aplicações frequencial e espacial, conforme enunciadas a seguir.
Inicialmente, na aplicação espacial a geometria ULA admite a flexibilidade de escolha quanto ao tipo de estimação MUSIC: a espectral da eq. (3.39); ou a
Root MUSIC, que busca as raízes da eq. (3.37). Para a maioria das outras
geometrias, apenas o MUSIC espectral se aplica.
Em segundo lugar, o algoritmo MUSIC padrão da eq. (3.39) falha no caso de sinais coerentes, pois nesta situação a condição de posto assumida não mais se mantém – o posto de APA* = n na eq. (3.31). Entretanto, para arranjos ULA é possível utilizar-se o chamado algoritmo MUSIC “modificado” (próprio para sinais coerentes).
O algoritmo ESPRIT [25] por sua vez, pode ser utilizado para estimação de DOA exatamente como é feito para estimação frequencial. No caso não ULA, o ESPRIT pode ser utilizado apenas em certas situações. Mais precisamente, o ESPRIT pode ser usado para estimação de DOA somente se o arranjo utilizado contiver dois sub-arranjos idênticos deslocados um do outro por um vetor deslocamento conhecido, como ilustrado na Figura 13. Matematicamente, esta condição pode ser formulada da seguinte forma. Seja m o número de sensores nos dois sub-arranjos gêmeos, e sejam A1 e A2 as sub-matrizes de A correspondentes a estes sub-arranjos. Uma vez que os sensores no arranjo são numerados arbitrariamente, não há restrição quanto a assumir que A1 é composto pelas primeiras m linhas em A e A2 das últimas m , ou seja:
[
I]
A(
m nA1 = m 0 ×
)
(3.101)[
I]
A(
m nA2 = 0 m ×
)
(3.102)onde I denota a matriz identidade m m×m. Observa-se que os dois sub-arranjos se sobrepõem se m >m/2; caso contrário, elas podem não se sobrepor. Se o arranjo for construído propositalmente para atender à condição de sub-arranjos do ESPRIT, então normalmente m =m/2 e os dois sub-arranjos não se sobrepõem.