Procurar por funções de verossimilhanças em modelos estatístico é só uma decomposição para voltar a algo que já estava ali?

Função de verossimilhança é a função dos parâmetros condicionada aos dados observados. Para um modelo com parâmetro \theta e amostra x, define-se L(\theta\mid x)=p(x\mid \theta), tratada como função de \theta.

A operação central é a troca de papéis. Em p(xθ)p(x\mid \theta), x é variável aleatória e \theta é fixo. Na verossimilhança, x é fixado pelos dados e \theta varia. A mudança permite inferência sobre \theta.

Se X1,,XnX_1,\dots,X_n são independentes, então

L(θx) = i=1n p(xiθ) L(\theta\mid x)=\prod_{i=1}^n p(x_i\mid \theta)

Aplicar log transforma produto em soma e reduz o custo de otimização. A fatoração não altera a informação. Apenas reorganiza a expressão.

Pelo teorema de fatoração de Ronald Fisher,

L(θx) = g(T(x),θ) h(x) L(\theta\mid x)=g(T(x),\theta)h(x)

onde T(x) é estatística suficiente. Toda a informação sobre θ contida em x está em T(x). Há redução de dimensão sem perda de informação.

Exemplo. Para X_i \sim \mathcal{N}(μ,σ^2) com σ^2 conhecido, a log-verossimilhança depende de \sum x_i. A média amostral \bar{x} é suficiente para μ. O estimador de máxima verossimilhança é

μ^=xˉ \hat{\mu}=\bar{x}

A verossimilhança não é densidade em θ. Não integra 1 no espaço paramétrico. Interpreta-se como medida de plausibilidade relativa entre valores de θ, dados os dados fixados.

A escrita em produto ocorre sob independência. Não é requisito geral. Em séries temporais, dados espaciais e modelos hierárquicos, a verossimilhança pode não fatorar em forma simples.

Conclusão. A verossimilhança não adiciona dados nem recupera conteúdo oculto. Ela fixa os dados e reexpressa o modelo como função dos parâmetros. Isso permite estimação, comparação de modelos e testes baseados em razão de verossimilhança.

Comentários

Postagens mais visitadas deste blog

5 ferramentas online de IA que você pode usar em 2023

O que é clusterização e como ela pode ser utilizada