Aluisio Barros: Estatística 4 - aula 1 - modelos lineares generalizados

Aluisio Barros: Estatística 4 - aula 1 - modelos lineares generalizados

Início do Curso de Estatística 4

Visão Geral da Seção: O instrutor introduz o curso de Estatística 4, destacando a flexibilidade das aulas virtuais gravadas e o objetivo de formalizar modelos discutidos anteriormente.

Retomada e Formalização de Modelos

  • O curso visa organizar e formalizar modelos estatísticos para uso efetivo, abordando aspectos como distribuições associadas e interpretação dos resultados.
  • No modelo de regressão linear, a equação é escrita em função dos preditores x, com o índice dependendo desses preditores na forma da equação linear.
  • A média do desfecho é expressa como uma combinação linear dos preditores, evidenciando a dependência na forma da equação linear.

Modelo de Regressão Linear - Parte 1

Visão Geral da Seção: Exploração detalhada do modelo de regressão linear, enfocando a relação entre desfecho e preditores, bem como as suposições subjacentes.

Equação Linear no Modelo

  • Cada observação é representada pela equação linear entre o desfecho e os preditores.
  • Ao considerar a média do desfecho em relação aos preditores x, o erro é minimizado nesse modelo.

Suposições Importantes

  • Os resíduos no modelo seguem uma distribuição normal com média zero e variância sigma² estimada pelo modelo.
  • A relação entre desfecho e preditor é assumida como linear, com resíduos não correlacionados e variância constante.

Limitações do Modelo de Regressão Linear

Visão Geral da Seção: Discussão sobre as limitações do modelo de regressão linear na epidemiologia, especialmente em relação à natureza das variáveis estudadas.

Desafios na Aplicabilidade Epidemiológica

  • A maioria dos desfechos epidemiológicos não são contínuos, apresentando dicotomias que divergem da premissa contínua do modelo.

Evolução e Aplicação dos Modelos Lineares Generalizados

Visão Geral da Seção: Nesta seção, são abordados os desfechos com distribuição próxima da norma e a importância dos modelos lineares generalizados na epidemiologia.

Desfechos e Ferramentas de Trabalho

  • Existem desfechos com distribuição próxima da norma, sendo comuns os ligados à avaliação nutricional ou antropometria.
  • Os modelos lineares generalizados oferecem uma abordagem unificada para lidar com diferentes desfechos, proporcionando uma estratégia consistente.

Teoria Estatística e Modelos Lineares Generalizados

  • A teoria dos modelos lineares generalizados permite trabalhar com desfechos que seguem distribuições da família exponencial, como normal, binomial e gama.
  • A evolução da estatística levou ao desenvolvimento dos modelos lineares generalizados como uma extensão importante para a regressão linear.

Desenvolvimento Histórico e Importância dos Modelos Lineares Generalizados

Visão Geral da Seção: Nesta parte, é explorada a evolução histórica da estatística em relação aos modelos lineares generalizados.

Evolução da Estatística

  • A disciplina estatística ganhou destaque no final do século 19, com o entendimento e teoria para a regressão linear.
  • No início do século 20 surgiram conceitos como teste qui-quadrado, valor p, variância e verossimilhança que impulsionaram o desenvolvimento teórico.

Marco dos Modelos Lineares Generalizados

  • Em 1972, os estatísticos conseguiram unificar a teoria dos modelos lineares generalizados, ampliando significativamente a família de modelos disponíveis.

Utilização Atual e Avanços Tecnológicos nos Modelos Epidemiológicos

Visão Geral da Seção: Aqui são discutidos os avanços tecnológicos que impactaram a análise epidemiológica atualmente.

Avanços Tecnológicos

  • Nos anos 70 e 80, a análise epidemiológica era desafiadora pela falta de ferramentas computacionais adequadas.
  • Atualmente, o poder computacional aumentou significativamente com softwares como STAT, SPS e R facilitando análises complexas.

Impacto na Análise Epidemiológica

  • A rapidez computacional atual permite ajustar modelos rapidamente; no entanto, é essencial dedicar tempo à interpretação cuidadosa dos resultados.

O que é uma Variável Aleatória?

Visão Geral da Seção: Nesta seção, são abordados conceitos fundamentais sobre variáveis aleatórias e distribuições de probabilidade.

Conceitos Chave

  • Uma variável aleatória é definida como o número de caras ao lançar uma moeda 10 vezes, seguindo uma distribuição binomial.
  • O componente sistemático de um modelo consiste na equação com os betas e x, sendo linear e essencial para a compreensão do modelo.
  • A função de ligação conecta o componente aleatório e sistemático do modelo, transformando o desfecho para tornar o modelo significativo.

Distribuições Binomiais e Função de Probabilidades

Visão Geral da Seção: Aqui são exploradas as distribuições binomiais, probabilidades em experimentos binomiais e a simetria dessas distribuições.

Principais Pontos

  • Desfechos binomiais envolvem respostas binais com parâmetros como a probabilidade de sucesso, calculada através da função de probabilidades da distribuição binomial.
  • A simetria da distribuição binomial é evidente quando a probabilidade se aproxima de 50%, assemelhando-se à distribuição normal nesse cenário.

Distribuições Poisson e Normais

Visão Geral da Seção: Aborda-se a aplicação das distribuições Poisson e normais em diferentes contextos estatísticos.

Insights Importantes

  • Distribuições Poisson são utilizadas para modelar contagens como eventos em um período específico, enquanto as distribuições normais representam valores numéricos contínuos.
  • A intensidade do processo (lambda), multiplicada pelo tempo elevado ao número de ocorrências desejadas, permite calcular probabilidades em situações poissonianas.

Características das Distribuições Contínuas

Visão Geral da Seção: Explora-se a natureza contínua das distribuições normais e suas implicações na probabilidade pontual.

Pontos Relevantes

  • As distribuições normais são contínuas, diferenciando-se das discretas pela presença de valores reais infinitos entre quaisquer dois pontos.

Distribuição e Modelos de Regressão

Visão Geral da Seção: Nesta seção, são discutidos diferentes modelos de regressão em relação às funções de ligação e distribuições associadas.

Funções de Ligação e Distribuições

  • Ao trabalhar com contagens em distribuições, a função de ligação usada é geralmente a função log.
  • Em um modelo linear generalizado, ao modelar diretamente a média do evento de interesse, a função identidade é utilizada como função de ligação.
  • Para um desfecho dicotômico onde interessa a probabilidade do evento ocorrer, a função de ligação logito (logit) é empregada.
  • No modelo Poisson para contagens, a função de ligação é o logaritmo natural (log), sendo essencial para expressar o modelo na forma do log da intensidade do processo.

Importância dos Modelos Básicos

Visão Geral da Seção: A importância dos modelos básicos na compreensão e aplicação posterior de outros modelos dentro da mesma família é destacada.

Relevância dos Modelos Básicos

  • Os modelos básicos abrem caminho para compreender e aplicar outros modelos relacionados dentro da mesma família com facilidade.
Video description

Introdução aos modelos lineares generalizados - conceitos básicos, distribuições, função de ligação, modelos mais comuns em epidemiologia