Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ferramentas de Análise de Stata Menos Menos Esquemas de Regressão de Quadrados NOTA: Este comentário foi feito com o autor do autor. Não sugerimos a sua utilização e não é mais suportado. Os mínimos quadrados ponderados fornecem um método para lidar com a heterocedasticidade. O comando wls0 pode ser usado para calcular várias soluções WLS. Você pode baixar wls0 pela internet, digitando findit wls0 (veja Como posso usar o comando findit para procurar programas e obter ajuda adicional para obter mais informações sobre como usar findit). Permite usar um exemplo de conjunto de dados que exiba heteroscedasticidade, hetdata. O gráfico residual versus renda mostra evidências claras de heteroscedasticidade. Vamos tentar uma ponderação WLS proporcional à renda. O tipo WLS, abse. Usa o valor absoluto dos resíduos e, neste caso, não há constante. O lote residual é melhor. Podemos tentar outras possibilidades, tais como, ponderação proporcional a renda e renda ao quadrado. Finalmente, vamos tentar mais uma variação. Desta vez, vamos fazer o ajuste proporcional ao log de resíduos quadrados. Além dos tipos de peso abse e loge2 há resíduos quadrados (e2) e valores ajustados ao quadrado (xb2). Encontrar a solução WLS ideal para usar envolve conhecimento detalhado de seus dados e tentando diferentes combinações de variáveis e tipos de ponderação. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.13.1 - Menos Quadrados Ponderados O método dos mínimos quadrados comuns assume que existe uma variação constante nos erros (Que se chama homoscedasticidade). O método dos mínimos quadrados ponderados pode ser usado quando a suposição de mínimos quadrados ordinários de variância constante nos erros é violada (que se chama heteroscedasticidade). O modelo em consideração é onde agora (epsilon) é assumido como sendo (multivariante) normalmente distribuído com vetor médio 0 e matriz de covariância variância não constante começam a esquerda (início sigma amp 0 ampères ldots amp 0 0 amp sigma amp ldots amp 0 vdots amp vdots Amp ddx ampères vdots 0 amp 0 amp ldots amp sigma end right). Se definimos o recíproco de cada variância, (sigma), como o peso, (wi 1sigma), então deixe a matriz W ser uma matriz diagonal que contenha esses pesos: comece o texto a esquerda (comece com ampères de 0 ampères amp 0 0amp w amp Ldots amp 0 vdots amp vdots amp ddots amp vdots 0amp 0 amp ldots amp w fim direito). Final A estimativa ponderada dos mínimos quadrados é então Com esta configuração, podemos fazer algumas observações: uma vez que cada peso é inversamente proporcional à variação de erro, reflete a informação nessa observação. Assim, uma observação com pequena variação de erro tem um grande peso, uma vez que contém relativamente mais informações do que uma observação com grande variação de erro (peso pequeno). Os pesos devem ser conhecidos (ou mais geralmente estimados) até uma constante de proporcionalidade. Para ilustrar, considere o famoso conjunto de dados de galaton. txt de 1877, consistindo de 7 medidas de cada X Parent (diâmetro da ervilha em polegadas da planta parental) e Y Progeny (diâmetro médio da ervilha em polegadas de até 10 plantas cultivadas a partir de sementes da planta-mãe ). Também estão incluídos no conjunto de dados desvios padrão, SD. Das ervilhas descendentes de cada pai. Esses desvios padrão refletem a informação nos valores de resposta Y (lembre-se de que estas são médias) e, portanto, ao estimar um modelo de regressão, devemos enfraquecer as observações com um grande desvio padrão e aumentar as observações com um pequeno desvio padrão. Em outras palavras, devemos usar os mínimos quadrados ponderados com pesos iguais a 1 SD 2. A equação ajustada resultante do Minitab para este modelo é: Progênie 0.12796 0.2048 Pai Compara isso com a equação ajustada para o modelo dos mínimos quadrados comuns: Progênie 0.12703 0.2100 Pai As equações não são muito diferentes, mas podemos ganhar alguma intuição nos efeitos do uso de mínimos quadrados ponderados, observando um diagrama de dispersão dos dados com as duas linhas de regressão sobrepostas: a linha preta representa o ajuste OLS, enquanto a linha vermelha representa o ajuste WLS. Os desvios-padrão tendem a aumentar à medida que o valor dos pais aumenta, de modo que os pesos tendem a diminuir à medida que o valor dos pais aumenta. Assim, à esquerda do gráfico onde as observações são ponderadas, a linha ajustada vermelha é ligeiramente mais próxima dos pontos de dados, enquanto à direita do gráfico onde as observações são avaliadas, a linha ajustada vermelha está ligeiramente mais longe dos pontos de dados. Para este exemplo, os pesos eram conhecidos. Existem outras circunstâncias em que os pesos são conhecidos: na prática, para outros tipos de conjuntos de dados, a estrutura de W é geralmente desconhecida, então devemos realizar uma regressão de mínimos quadrados ordinários (OLS) primeiro. Desde que a função de regressão seja apropriada, o i-ésimo resíduo quadrado do ajuste OLS é uma estimativa de (sigmai2) eo i-ésimo resíduo absoluto é uma estimativa de (sigmai) (que tende a ser um estimador mais útil na presença De outliers). Os resíduos são muito variáveis para serem usados diretamente na estimativa dos pesos, (wi), então, em vez disso, usamos os resíduos quadrados para estimar uma função de variância ou os resíduos absolutos para estimar uma função de desvio padrão. Em seguida, usamos essa variância ou função de desvio padrão para estimar os pesos. Algumas possíveis estimativas de variância e desvio padrão incluem: Se uma trama residual contra um preditor exibir uma forma de megafone, então regredir os valores absolutos dos resíduos contra esse preditor. Os valores ajustados resultantes desta regressão são estimativas de (sigma). (E lembre-se (wi 1sigma)). Se um gráfico residual contra os valores ajustados exibir uma forma de megafone, então regredir os valores absolutos dos resíduos contra os valores ajustados. Os valores ajustados resultantes desta regressão são estimativas de (sigma). Se um gráfico residual dos resíduos quadrados contra um preditor exibir uma tendência ascendente, então regredir os resíduos quadrados contra esse preditor. Os valores ajustados resultantes desta regressão são estimativas de (sigma 2). Se uma parcela residual dos resíduos quadrados contra os valores ajustados exibir uma tendência ascendente, então regredir os resíduos quadrados contra os valores ajustados. Os valores ajustados resultantes desta regressão são estimativas de (sigma 2). Depois de usar um desses métodos para estimar os pesos, (wi), usamos esses pesos na estimativa de um modelo de regressão de mínimos quadrados ponderado. Consideramos alguns exemplos desta abordagem na próxima seção. Alguns pontos-chave sobre os mínimos quadrados ponderados são: A dificuldade, na prática, é determinar as estimativas das variações de erro (ou desvios padrão). As estimativas ponderadas dos mínimos quadrados dos coeficientes geralmente serão quase as mesmas que as estimativas ordinárias não ponderadas. Nos casos em que eles diferem substancialmente, o procedimento pode ser iterado até que os coeficientes estimados se estabilizem (muitas vezes em não mais do que uma ou duas iterações), isto é chamado de mínimos quadrados repensados iterativamente. Em alguns casos, os valores dos pesos podem ser baseados em pesquisas teóricas ou anteriores. Em experimentos projetados com um grande número de repetições, os pesos podem ser estimados diretamente das variações da amostra da variável de resposta em cada combinação de variáveis preditoras. O uso de pesos afetará (de forma legítima) as larguras dos intervalos estatísticos. Navegação
No comments:
Post a Comment