Aluisio Barros: Estatística 4 - aula 1 - modelos lineares generalizados
Início do Curso de Estatística 4
Visão Geral da Seção: O instrutor introduz o curso de Estatística 4, destacando a flexibilidade das aulas virtuais gravadas e o objetivo de formalizar modelos discutidos anteriormente.
Retomada e Formalização de Modelos
- O curso visa organizar e formalizar modelos estatísticos para uso efetivo, abordando aspectos como distribuições associadas e interpretação dos resultados.
- No modelo de regressão linear, a equação é escrita em função dos preditores x, com o índice dependendo desses preditores na forma da equação linear.
- A média do desfecho é expressa como uma combinação linear dos preditores, evidenciando a dependência na forma da equação linear.
Modelo de Regressão Linear - Parte 1
Visão Geral da Seção: Exploração detalhada do modelo de regressão linear, enfocando a relação entre desfecho e preditores, bem como as suposições subjacentes.
Equação Linear no Modelo
- Cada observação é representada pela equação linear entre o desfecho e os preditores.
- Ao considerar a média do desfecho em relação aos preditores x, o erro é minimizado nesse modelo.
Suposições Importantes
- Os resíduos no modelo seguem uma distribuição normal com média zero e variância sigma² estimada pelo modelo.
- A relação entre desfecho e preditor é assumida como linear, com resíduos não correlacionados e variância constante.
Limitações do Modelo de Regressão Linear
Visão Geral da Seção: Discussão sobre as limitações do modelo de regressão linear na epidemiologia, especialmente em relação à natureza das variáveis estudadas.
Desafios na Aplicabilidade Epidemiológica
- A maioria dos desfechos epidemiológicos não são contínuos, apresentando dicotomias que divergem da premissa contínua do modelo.
Evolução e Aplicação dos Modelos Lineares Generalizados
Visão Geral da Seção: Nesta seção, são abordados os desfechos com distribuição próxima da norma e a importância dos modelos lineares generalizados na epidemiologia.
Desfechos e Ferramentas de Trabalho
- Existem desfechos com distribuição próxima da norma, sendo comuns os ligados à avaliação nutricional ou antropometria.
- Os modelos lineares generalizados oferecem uma abordagem unificada para lidar com diferentes desfechos, proporcionando uma estratégia consistente.
Teoria Estatística e Modelos Lineares Generalizados
- A teoria dos modelos lineares generalizados permite trabalhar com desfechos que seguem distribuições da família exponencial, como normal, binomial e gama.
- A evolução da estatística levou ao desenvolvimento dos modelos lineares generalizados como uma extensão importante para a regressão linear.
Desenvolvimento Histórico e Importância dos Modelos Lineares Generalizados
Visão Geral da Seção: Nesta parte, é explorada a evolução histórica da estatística em relação aos modelos lineares generalizados.
Evolução da Estatística
- A disciplina estatística ganhou destaque no final do século 19, com o entendimento e teoria para a regressão linear.
- No início do século 20 surgiram conceitos como teste qui-quadrado, valor p, variância e verossimilhança que impulsionaram o desenvolvimento teórico.
Marco dos Modelos Lineares Generalizados
- Em 1972, os estatísticos conseguiram unificar a teoria dos modelos lineares generalizados, ampliando significativamente a família de modelos disponíveis.
Utilização Atual e Avanços Tecnológicos nos Modelos Epidemiológicos
Visão Geral da Seção: Aqui são discutidos os avanços tecnológicos que impactaram a análise epidemiológica atualmente.
Avanços Tecnológicos
- Nos anos 70 e 80, a análise epidemiológica era desafiadora pela falta de ferramentas computacionais adequadas.
- Atualmente, o poder computacional aumentou significativamente com softwares como STAT, SPS e R facilitando análises complexas.
Impacto na Análise Epidemiológica
- A rapidez computacional atual permite ajustar modelos rapidamente; no entanto, é essencial dedicar tempo à interpretação cuidadosa dos resultados.
O que é uma Variável Aleatória?
Visão Geral da Seção: Nesta seção, são abordados conceitos fundamentais sobre variáveis aleatórias e distribuições de probabilidade.
Conceitos Chave
- Uma variável aleatória é definida como o número de caras ao lançar uma moeda 10 vezes, seguindo uma distribuição binomial.
- O componente sistemático de um modelo consiste na equação com os betas e x, sendo linear e essencial para a compreensão do modelo.
- A função de ligação conecta o componente aleatório e sistemático do modelo, transformando o desfecho para tornar o modelo significativo.
Distribuições Binomiais e Função de Probabilidades
Visão Geral da Seção: Aqui são exploradas as distribuições binomiais, probabilidades em experimentos binomiais e a simetria dessas distribuições.
Principais Pontos
- Desfechos binomiais envolvem respostas binais com parâmetros como a probabilidade de sucesso, calculada através da função de probabilidades da distribuição binomial.
- A simetria da distribuição binomial é evidente quando a probabilidade se aproxima de 50%, assemelhando-se à distribuição normal nesse cenário.
Distribuições Poisson e Normais
Visão Geral da Seção: Aborda-se a aplicação das distribuições Poisson e normais em diferentes contextos estatísticos.
Insights Importantes
- Distribuições Poisson são utilizadas para modelar contagens como eventos em um período específico, enquanto as distribuições normais representam valores numéricos contínuos.
- A intensidade do processo (lambda), multiplicada pelo tempo elevado ao número de ocorrências desejadas, permite calcular probabilidades em situações poissonianas.
Características das Distribuições Contínuas
Visão Geral da Seção: Explora-se a natureza contínua das distribuições normais e suas implicações na probabilidade pontual.
Pontos Relevantes
- As distribuições normais são contínuas, diferenciando-se das discretas pela presença de valores reais infinitos entre quaisquer dois pontos.
Distribuição e Modelos de Regressão
Visão Geral da Seção: Nesta seção, são discutidos diferentes modelos de regressão em relação às funções de ligação e distribuições associadas.
Funções de Ligação e Distribuições
- Ao trabalhar com contagens em distribuições, a função de ligação usada é geralmente a função log.
- Em um modelo linear generalizado, ao modelar diretamente a média do evento de interesse, a função identidade é utilizada como função de ligação.
- Para um desfecho dicotômico onde interessa a probabilidade do evento ocorrer, a função de ligação logito (logit) é empregada.
- No modelo Poisson para contagens, a função de ligação é o logaritmo natural (log), sendo essencial para expressar o modelo na forma do log da intensidade do processo.
Importância dos Modelos Básicos
Visão Geral da Seção: A importância dos modelos básicos na compreensão e aplicação posterior de outros modelos dentro da mesma família é destacada.
Relevância dos Modelos Básicos
- Os modelos básicos abrem caminho para compreender e aplicar outros modelos relacionados dentro da mesma família com facilidade.