Introdução


Última atualização: 26 de janeiro de 2019.

Em todos os problemas de inferência estatística considerados, assumimos que a distribuição da variável aleatória que está sendo amostrada seja conhecida a menos, talvez, para alguns parámetros. Na prática, entretanto, a forma funcional da distribuição é raramente ou nunca conhecida. Por conseguinte, é desejável conceber alguns procedimentos que estejam livres desta hipótese relativa à distribuição.

Para entender a ideia de estatística não-paramétrica, este termo foi usado pela primeira vez por Jacob Wolfowitz em 1942, primeiro requeremos uma compreensão de conceitos da estatística básica paramétrica. Conceitos elementares introduzem o conceito de teste de significância estatística com base na distribuição amostral de uma estatística particular. Em resumo, se tivermos um conhecimento básico da distribuição subjacente de uma variável, poderemos fazer previsões sobre como, em amostras repetidas de tamanho igual, essa estatística específica se comportará, isto é, como será distribuída.

Estudamos aqui alguns procedimentos que são comumente referidos como métodos sem distribuição ou não paramétricos. O termo livre de distribuição refere-se ao fato de que nenhuma suposição é feita sobre a distribuição subjacente, exceto que a função de distribuição sendo amostrada seja absolutamente contínua ou puramente discreta. O termo não paramétrico refere-se ao fato de não haver parâmetros envolvidos no sentido tradicional do termo parâmetro utilizado até o momento.

Nos dois exemplos seguintes mostramos distribuições conhecidas que são livres de parâmetros.
Exemplo. Seja \(X\sim t(n)\), ou seja, seja \(X\) uma variável aleatória com distribuição t-Student com \(n\) graus de liberdade. Isto significa que \(X\) tem por função de densidade \begin{equation} f(x)=\dfrac{\Gamma\big(\frac{n+1}{2}\big)}{\Gamma\big(\frac{n}{2}\big)\sqrt{n\pi}}\Big( 1+\frac{x^2}{n} \Big)^{-\frac{n+1}{2}}, \end{equation} para \(x\in (-\infty,\infty)\). Mostramos a forma desta função de densidade, quando \(n=3\), na figura abaixo à esquerda.
Exemplo. Seja \(X\sim \chi^2(n)\), ou seja, seja \(X\) uma variável aleatória com distribuição qui-quadraado com \(n\) graus de liberdade. Isto significa que \(X\) tem por função de densidade \begin{equation} f(x)=\dfrac{1}{\Gamma\big(\frac{n}{2}\big)2^{n/2}} e^{-x/2} x^{n/2-1}, \end{equation} para \(x\in (0,\infty)\). Mostramos a forma desta função de densidade, quando \(n=3\), na figura acima à direita.

Grosseiramente falando, um procedimento não-paramétrico é um procedimento estatístico que possui certas propriedades desejáveis que mantêm suposições relativamente leves em relação às populações subjacentes das quais os dados são obtidos. O desenvolvimento repetido e contínuo de procedimentos estatísticos não paramétricos nas últimas décadas deve-se às seguintes vantagens de técnicas não paramétricas:

A Parte I é dedicada ao problema da estimação não-paramétrica e estimação da função de densidade. A Parte II trata de alguns problemas comuns de teste de hipóteses para uma única amostra, dentre eles a verificação da normalidade dos resíduos. Na Parte III consideramos testes de hipóteses para o caso de duas ou mais amostras.

Como suporte computacional utilizamos a linguagem de programação e ambiente de desenvolvimento integrado para cálculos estatísticos e gráficos R, última versão 3.5.2, Eggshell Igloo de 20 de dezembro de 2018.