1.1 Estatísticas e coleta de dados


A estatística é definida como a ciência de coletar, analisar e tirar conclusões a partir de dados. Os dados geralmente são coletados por meio de pesquisas amostrais, estudos observacionais ou experimentos. Os inquéritos por amostragem são normalmente utilizados quando o objectivo da recolha de dados é estimar alguma propriedade de uma população finita sem realizar um censo completo de cada item da população. Por exemplo, se houvesse interesse em descobrir a proporção de eleitores registados num determinado distrito eleitoral que são a favor de uma proposta, esta proporção poderia ser estimada através da sondagem de uma amostra aleatória de eleitores em vez de questionar todos os eleitores registados no distrito eleitoral.

Estudos e experimentos observacionais, por outro lado, são normalmente usados para determinar a relação entre duas ou mais quantidades medidas em uma população conceitual. Uma população conceitual, diferentemente de uma população finita, só pode existir em nossas mentes. Por exemplo, se houvesse interesse na relação entre as futuras emissões de gases com efeito de estufa e a futura temperatura média global, a população, ao contrário dos eleitores registados num distrito eleitoral, não pode ser amostrada porque ainda não existe.

Parafraseando o falecido W. Edwards Deming, o valor dos métodos estatísticos é fazer previsões que possam constituir a base para a acção. Para fazer previsões futuras precisas sobre o que acontecerá quando o ambiente for controlado, devem ser assumidas relações de causa e efeito. Por exemplo, para prever a temperatura global média futura, dado que as emissões de gases com efeito de estufa serão controladas a um determinado nível, devemos assumir que a relação entre as emissões de gases com efeito de estufa e a temperatura global é de causa e efeito.

Aqui reside a principal diferença em estudos e experimentos observacionais. Num estudo observacional, os dados são observados no seu ambiente natural, mas numa experiência o ambiente é controlado. Em estudos observacionais não se pode comprovar que as relações detectadas sejam de causa e efeito. Correlações podem ser encontradas entre duas variáveis observadas porque ambas são afetadas por mudanças em uma terceira variável que não foi observada ou registrada, e por quaisquer previsões futuras feitas com base nas relações encontradas em um estudo observacional. o estudo deve assumir que as mesmas inter-relações entre variáveis que existiram no passado existirão no futuro. Em um experimento, por outro lado, algumas variáveis são alteradas propositalmente enquanto outras são mantidas constantes. Dessa forma, o efeito causado pela alteração na variável propositalmente variada pode ser diretamente observado e podem ser feitas previsões sobre o resultado de futuras alterações na variável propositalmente variada.


1.2 Início de experimentos estatisticamente planejados


Existem muitos propósitos para experimentação. Alguns exemplos incluem: determinar a causa da variação nas respostas medidas observadas no passado; encontrar condições que dêem origem à resposta máxima ou mínima; comparar a resposta entre diferentes configurações de variáveis controláveis; e obtenção de um modelo matemático para prever valores de resposta futuros.

Atualmente, os experimentos planejados são usados em diversos campos de aplicação, tais como: projeto de engenharia, melhoria da qualidade, pesquisa industrial e manufatura, pesquisa básica em ciências físicas e biológicas, pesquisa em ciências sociais, psicologia, gestão empresarial e pesquisa de marketing, e muito mais. No entanto, as raízes dos métodos modernos de projeto experimental derivam do trabalho de R. A. Fisher em experimentação agrícola na Estação Experimental de Rothamsted, perto de Harpenden, Inglaterra.

Fisher era um matemático talentoso cujo primeiro trabalho na graduação na Universidade de Cambridge introduziu a teoria da probabilidade. Mais tarde, foi-lhe oferecido um cargo no University College, mas recusou-o para se juntar à equipe de Rothamsted em 1919. Lá, inspirado pelo contato diário com a pesquisa agrícola, ele não apenas contribuiu para estudos experimentais em áreas como rendimento de colheitas, ensaios de campo e genética, mas também desenvolveu estatísticas teóricas a um ritmo surpreendente.

Ele também apresentou ideias para planejamento e análise de experimentos que têm sido usados como base para inferências e previsões válidas em vários campos de aplicação até hoje. Fisher (1926) publicou pela primeira vez suas ideias sobre o planejamento de experimentos em seu artigo “The arrangement of field experiments”. 9 anos depois publicou a primeira edição de seu livro The Design of Experiments, Fisher (1935).

Os desafios que Fisher enfrentou foram a grande variação nas experiências agrícolas e biológicas, que muitas vezes confundiam os resultados e o fato das experiências serem demoradas e dispendiosas de realizar. Isso o motivou a encontrar técnicas experimentais que pudessem:

  1. eliminar o máximo possível da variação natural

  2. evitar que a variação não removida confunda ou distorça os efeitos que estão sendo testado

  3. detectar causa e efeito com o mínimo de esforço experimental necessário.


1.3 Definições e preliminares


Antes de iniciar uma discussão extensa sobre projetos experimentais e planejamento de experimentos, começaremos definindo os termos que serão usados com frequência.

Experimento Também chamado de corrida é uma ação onde o experimentador altera pelo menos uma das variáveis que estão sendo estudadas e então observa o efeito de sua(s) ação(ões). Observe que a coleta passiva de dados observacionais não é experimentação.

Unidade Experimental É o item em estudo no qual algo muda. Podem ser matérias-primas, seres humanos ou apenas um momento no tempo.

Subamostra Subunidade ou unidade observacional. Quando a unidade experimental é dividida, após a ação ter sido tomada sobre ela, isso é chamado de subamostra ou subunidade. Às vezes só é possível medir uma característica separadamente para cada subunidade; por esse motivo, são frequentemente chamadas de unidades observacionais. As medições em subamostras, ou subunidades da mesma unidade experimental, são geralmente correlacionadas e devem ser calculadas a média antes da análise dos dados, em vez de serem tratadas como resultados independentes. Quando as subunidades podem ser considerado independente e há interesse em determinar a variância nas medições das subamostras, embora não confunda os testes \(F\) nos fatores de tratamento, o modelo misto descrito na Seção 5.8 deve ser usado em vez de simplesmente calcular a média das subamostras.

Variável Independente Fator ou fator de tratamento é uma das variáveis ​​em estudo que está sendo controlada em ou próximo de algum valor alvo, ou nível, durante qualquer experimento. O nível está sendo alterado de forma sistemática de execução para execução, a fim de determinar que efeito ele tem na(s) resposta(s).

Variável de fundo Também chamada de variável oculta é uma variável que o experimentador desconhece ou não pode controlar e que pode afetar o resultado do experimento. Num desenho experimental bem planeado, o efeito destas variáveis ocultas deve equilibrar-se para não alterar a conclusão de um estudo.

Variável dependente Também chamada de resposta, denotada por \(Y\), é a característica da unidade experimental que é medida após cada experimento ou execução. A magnitude da resposta depende das configurações das variáveis ou fatores independentes e das variáveis ocultas.

Efeito É a mudança na resposta causada por uma mudança em um fator ou variável independente. Após a realização das execuções em um projeto experimental, o efeito pode ser estimado calculando-o a partir dos dados de resposta observados. Essa estimativa é chamada de efeito calculado. Antes mesmo dos experimentos serem conduzidos, o pesquisador pode saber quão grande o efeito deve ser para ter importância prática. Isso é chamado de efeito prático ou tamanho de efeito prático.

Execuções Replicadas são dois ou mais experimentos conduzidos com as mesmas configurações dos fatores ou variáveis independentes, mas usando unidades experimentais diferentes. A variável dependente medida pode diferir entre as repetições devido a mudanças nas variáveis ocultas e diferenças inerentes nas unidades experimentais.

Duplicatas Referem-se a medições duplicadas da mesma unidade experimental de uma execução ou experimento. A variável dependente medida pode variar entre duplicatas devido a erros de medição, mas na análise dos dados essas medições duplicadas devem ser calculadas em média e não tratadas como respostas separadas.

Projeto experimental É uma coleção de experimentos ou execuções planejadas antes da execução real. As execuções específicas selecionadas em um projeto experimental dependerão do propósito do projeto.

Fatores de confusão Surgem quando cada alteração que um experimentador faz em um fator, entre execuções, é associada a uma alteração idêntica em outro fator. Nesta situação é impossível determinar qual fator causa quaisquer alterações observadas na resposta ou variável dependente.

Fator tendencioso Resulta quando um experimentador faz alterações em uma variável independente no momento preciso em que ocorrem alterações nas variáveis de fundo ou ocultas. Quando um fator é tendencioso, é impossível determinar se as alterações resultantes na resposta foram causadas por alterações no fator ou por alterações em outras variáveis de fundo ou ocultas.

Erro Experimental É a diferença entre a resposta observada para um experimento específico e a média de longo prazo de todos os experimentos conduzidos nas mesmas configurações das variáveis ou fatores independentes. O fato de ser chamado de “erro” não deve levar ninguém a supor que se trata de um erro ou erro crasso. Os erros experimentais não são todos iguais a zero porque as variáveis de fundo ou ocultas fazem com que eles mudem de execução para execução. Os erros experimentais podem ser amplamente classificados em dois tipos: erro de polarização e erro aleatório. O erro de polarização tende a permanecer constante ou a mudar em um padrão consistente ao longo das execuções em um projeto experimental, enquanto o erro aleatório muda de um experimento para outro de maneira imprevisível e a média é zero. A variância de erros experimentais aleatórios pode ser obtida incluindo execuções replicadas em um projeto experimental.

Com estas definições em mente, a diferença entre estudos observacionais e experimentos pode ser explicada mais claramente. Num estudo observacional, as variáveis (independentes e dependentes) são observadas sem qualquer tentativa de alterar ou controlar o valor dos fatores independentes. Portanto, quaisquer alterações observadas na resposta ou variável dependente, não podem necessariamente ser atribuídas a alterações observadas nas variáveis independentes porque variáveis de fundo ou ocultas podem ser a causa. Num experimento, entretanto, as variáveis independentes são variadas propositalmente e as execuções são conduzidas de forma a equilibrar o efeito de quaisquer variáveis de fundo que mudem. Desta forma, a mudança média na resposta pode ser atribuída às mudanças feitas nas variáveis independentes.


1.4 Objetivos do planejamento experimental


O uso de planejamentos experimentais é uma receita para a aplicação bem-sucedida do método científico. O método científico consiste na aplicação iterativa das seguintes etapas:

  1. observação do estado da natureza,

  2. conjecturar ou formular hipóteses sobre o mecanismo do que foi observado, depois

  3. coletar dados e

  4. analisar os dados. para confirmar ou rejeitar a conjectura.

Os planejamentos experimentais estatísticos fornecem um plano para a coleta de dados de forma que possam ser analisados estatisticamente para corroborar a conjectura em questão. Quando um planejamento experimental é usado, a conjectura deve ser declarada claramente e uma lista de experimentos proposta antecipadamente para fornecer os dados para testar a hipótese.

Esta é uma abordagem organizada que ajuda a evitar falsos começos e respostas incompletas às questões de investigação. Outra vantagem de usar a abordagem de planejamento experimental é a capacidade de evitar efeitos de fatores de confusão. Quando a hipótese de pesquisa não é claramente declarada e não é construído um plano para investigá-la, os pesquisadores tendem a uma abordagem de tentativa e erro, em que muitas variáveis são alteradas simultaneamente na tentativa de atingir algum objetivo. Quando esta é a abordagem, o objectivo pode por vezes ser alcançado, mas não pode ser repetido porque não se sabe quais as mudanças que realmente causaram a melhoria.

Uma das primeiras contribuições de Fisher para o planejamento de experimentos foi a popularização de uma técnica chamada randomização, que ajuda a evitar confusões ou preconceitos devido a mudanças nos antecedentes ou em variáveis ocultas. Um exemplo do que entendemos por preconceito é “A maior experiência de saúde de sempre”, Meier (1972), em que um ensaio de uma vacina contra a poliomielite foi testado em mais de 1,8 milhões de crianças. Foi proposto um plano inicial para oferecer vacinas a todas as crianças do segundo ano nas escolas participantes e para acompanhar a experiência da poliomielite dos alunos do primeiro ao terceiro ano.

O grupo da primeira e terceira série serviria como grupo de “controle”. Este plano foi rejeitado, no entanto, porque os médicos sabiam que a vacina só era oferecida aos alunos do segundo ano. Existem imprecisões no diagnóstico da maioria dos casos de poliomielite e os sintomas da poliomielite, como febre e fraqueza, são comuns a muitas outras doenças. O diagnóstico de um médico pode ser indevidamente influenciado pelo seu conhecimento sobre se um paciente foi ou não vacinado. Neste plano, o fator variado propositalmente, vacinado ou não, foi influenciado pela variável oculta do conhecimento dos médicos sobre o tratamento.

Ao realizar experimentos físicos, a resposta normalmente variará ao longo das repetições devido unicamente ao fato das unidades experimentais serem diferentes. Isso é o que definimos como erro experimental na última seção.

Um dos principais objetivos dos planejamentos experimentais é minimizar o efeito do erro experimental. Aspectos de projetos que fazem isso, como randomização, replicação e bloqueio, são chamados de métodos de controle de erros. Métodos estatísticos são usados para julgar o efeito médio de vários fatores experimentais contra a possibilidade de que possam ser totalmente devidos a erros experimentais. Outro propósito dos planejamentos experimentais é acentuar os efeitos dos fatores (ou sinal). Os aspectos dos experimentos que fazem isso, como a escolha do número e espaçamento dos níveis dos fatores e dos planos fatoriais, são chamados de métodos de planejamento de tratamento. Como isso é feito será explicado nos capítulos seguintes.


1.5 Tipos de planejamentos experimentais


Existem muitos tipos de planejamentos experimentais. O apropriado a ser usado depende dos objetivos da experimentação. Podemos classificar os objetivos em duas categorias principais. A primeira categoria é estudar as fontes de variabilidade e a segunda é estabelecer relações de causa e efeito. Quando a variabilidade é observada em uma variável medida, um objetivo da experimentação pode ser determinar a causa dessa variação. Mas antes que as relações de causa e efeito possam ser estudadas, uma lista de variáveis independentes deve ser determinada. Ao compreender a fonte da variabilidade, os pesquisadores são frequentemente levados a formular hipóteses sobre quais variáveis ou fatores independentes estudar.

Assim, experimentos para estudar a fonte da variabilidade são frequentemente um ponto de partida para muitos programas de pesquisa. O tipo de planejamento experimental utilizado para classificar as fontes de variação dependerá do número de fontes em estudo. Essas alternativas serão apresentadas no Capítulo 5.

O desenho experimental apropriado que deve ser usado para estudar as relações de causa e efeito dependerá de uma série de coisas. Ao longo do livro, os vários desenhos são descritos em relação ao propósito da experimentação, ao tipo e número de fatores de tratamento, ao grau de homogeneidade das unidades experimentais, à facilidade de randomização e à capacidade de bloquear unidades experimentais em grupos mais homogêneos. Depois de apresentados todos os designs, o Capítulo 13 descreve como eles podem ser usados em estratégias de experimentação sequencial onde o conhecimento é aumentado através de diferentes estágios de experimentação.

Os estágios iniciais envolvem descobrir quais são os fatores importantes do tratamento. Posteriormente, os efeitos da mudança dos fatores de tratamento são quantificados e, nos estágios finais, as condições operacionais ideais podem ser determinadas. Diferentes tipos de projetos experimentais são apropriados para cada uma dessas fases.

Experimentos de triagem são usados quando o pesquisador tem pouco conhecimento das relações de causa e efeito, e muitas variáveis independentes potenciais estão em estudo. Este tipo de experimentação geralmente é conduzido no início de um programa de pesquisa para identificar os fatores importantes. Este é um passo crítico e, se for ignorado, as fases posteriores de muitos programas de investigação ficam descontroladas. porque as variáveis importantes não estão sendo controladas ou registradas.

Depois de identificar os fatores mais importantes numa fase de triagem, o próximo objetivo do pesquisador seria escolher entre otimização restrita ou otimização irrestrita (ver Lawson, 2003). Na otimização restrita, geralmente há seis ou menos fatores em estudo e o objetivo é quantificar os efeitos dos fatores, a interação ou os efeitos conjuntos dos fatores, e identificar condições ótimas entre as combinações de fatores realmente testadas.

Quando apenas alguns factores quantitativos estão em estudo e são possíveis relações curvilíneas com a resposta, pode ser possível identificar melhores condições de funcionamento através da interpolação dentro dos níveis dos factores efectivamente testados. Se esse for o objetivo, o objetivo da experimentação é chamado de otimização irrestrita. Com um objetivo de otimização irrestrito, o pesquisador normalmente tenta mapear a relação entre uma ou mais respostas e cinco ou menos fatores quantitativos.

Planos de projeto experimental específicos para cada um dos estágios de experimentação serão apresentados à medida que avançamos no livro. A Figura 1.1 mostra a relação entre os objetivos da experimentação, o desenho do experimento e as conclusões que podem ser tiradas.

O objetivo de um programa de pesquisa determina que tipo de projeto experimental deve ser utilizado. O plano de projeto experimental, por sua vez, especifica como os dados devem ser coletados e qual modelo matemático deve ser ajustado para analisar e interpretar os dados. Finalmente, o tipo de dados e o modelo matemático determinarão quais possíveis conclusões podem ser tiradas do experimento. Essas etapas são inseparáveis e dependentes umas das outras. Muitos erros são cometidos na pesquisa ao tentar dissecar essas etapas.

Uma análise adequada dos dados não pode ser concluída sem o conhecimento de qual desenho experimental foi utilizado e como os dados foram coletados, e as conclusões não são confiáveis se não forem justificadas pela modelagem e análise adequadas dos dados.

Figura 1.1: Objetivos, planejamento e conclusões da experimentação.


1.6 Planejando experimentos


Um plano de projeto experimental eficaz deve incluir os seguintes itens:

  1. uma descrição clara dos objetivos,

  2. um plano de projeto apropriado que garanta efeitos de fatores não confundidos e efeitos de fatores livres de vieses,

  3. uma provisão para coleta de dados que permitirá estimar a variância do erro experimental, e

  4. uma estipulação para coletar dados suficientes para satisfazer os objetivos.

Bisgaard (1999) recomenda uma proposta formal para garantir que um plano inclua todos estes elementos. A proposta deverá incluir uma lista de verificação para o planejamento dos experimentos. Abaixo está uma lista de verificação semelhante à de Bisgaard. Exemplos de algumas das etapas desta lista de verificação serão ilustrados na discussão de um experimento simples na próxima seção.

1. Defina objetivos. Defina os objetivos do estudo. Primeiro, esta afirmação deve responder à questão de por que o experimento deve ser realizado. Segundo, determine se o experimento é conduzido para classificar fontes de variabilidade ou se seu objetivo é estudar relações de causa e efeito. Se for o último, determine se é um experimento de triagem ou otimização. Para estudos de relações de causa e efeito, decida quão grande deve ser um efeito para que seja significativo detectá-lo.

2. Identifique as unidades experimentais. Declare o item no qual algo será alterado. É um sujeito animal ou humano, matéria-prima para alguma operação de processamento ou simplesmente as condições que existem num determinado momento ou ensaio? A identificação das unidades experimentais ajudará na compreensão do erro experimental e da variância do erro experimental.

3. Defina uma resposta ou variável dependente relevante e mensurável. Defina quais características das unidades experimentais podem ser medidas e registradas após cada execução. Esta característica deve representar melhor as diferenças esperadas causadas por mudanças nos fatores.

4. Liste as variáveis independentes e ocultas. Declare quais variáveis independentes você deseja estudar. Os Diagramas de Causa e Efeito de Ishikawa (ver Wikipedia: Ishikawa diagram) são frequentemente úteis nesta etapa para ajudar a organizar variáveis que se acredita afetarem o resultado experimental. Certifique-se de que as variáveis independentes escolhidas para estudar possam ser controladas durante uma única corrida e variadas de corrida para corrida. Se houver interesse em uma variável, mas ela não puder ser controlada ou variada, ela não poderá ser incluída como fator. Variáveis que hipoteticamente afetam a resposta, mas não podem ser controladas, são variáveis ocultas. O plano do planejamento experimental adequado deve evitar que mudanças incontroláveis nessas variáveis enviesem os efeitos dos fatores em estudo.

5. Execute testes piloto. Faça alguns testes piloto para ter certeza de que você pode controlar e variar os fatores que foram selecionados, que a resposta pode ser medida e que as medições replicadas das mesmas unidades experimentais ou similares são consistentes. A incapacidade de medir a resposta com precisão ou de controlar os níveis dos fatores são as principais razões pelas quais os experimentos não conseguem produzir os resultados desejados. Se os testes piloto falharem, volte para as etapas 2, 3 e 4. Se esses testes forem bem-sucedidos, as medições da resposta para alguns testes replicados com os mesmos níveis dos fatores em estudo produzirão dados que podem ser usados para obter uma estimativa preliminar da variância do erro experimental.

6. Faça um diagrama de fluxo do procedimento experimental para cada execução. Isso garantirá que o procedimento a ser seguido seja compreendido e padronizado para todas as execuções do projeto.

7. Escolha o projeto experimental. Escolha um projeto experimental adequado aos objetivos de seu experimento específico. Isto incluirá uma descrição de quais níveis de fator serão estudados e determinará como as unidades experimentais serão atribuídas aos níveis de fator ou combinação de níveis de fator se houver mais de um fator. A escolha do desenho experimental também determinará qual modelo deverá ser utilizado para análise dos dados.

8. Determine o número de réplicas necessárias. Com base na variância esperada do erro experimental e no tamanho de uma diferença prática, o pesquisador deve determinar o número de execuções replicadas que dará uma alta probabilidade de detectar um efeito de importância prática.

9. Randomize as condições experimentais para unidades experimentais. De acordo com o projeto experimental específico utilizado, existe um método prescrito de atribuição aleatória de condições experimentais a unidades experimentais. Em alguns projetos, níveis de fatores ou combinações de níveis de fatores são atribuídos a unidades experimentais de forma completamente aleatória. Em outros projetos, a randomização dos níveis dos fatores é realizada separadamente dentro de grupos de unidades experimentais e pode ser feita de forma diferente para diferentes fatores. A forma como a randomização é feita afeta a forma como os dados devem ser analisados, sendo importante descrever e registrar exatamente o que foi feito. A melhor maneira de fazer isso é fornecer uma planilha de coleta de dados organizada na ordem aleatória em que os experimentos serão coletados. Para projetos experimentais mais complicados, Bisgaard (1999) recomenda uma folha de papel descrevendo as condições de cada corrida com espaços em branco para inserir os dados de resposta e registrar as observações sobre a corrida. Todas essas folhas devem então ser grampeadas em forma de livreto na ordem em que serão executadas.

10. Descreva um método para análise de dados. Este deve ser um esboço das etapas da análise. Uma análise real dos dados simulados é muitas vezes útil para verificar se o esquema proposto funcionará.

11. Cronograma e orçamento para recursos necessários para concluir os experimentos. A experimentação leva tempo e ter um cronograma a cumprir aumentará as chances de concluir a pesquisa no prazo. Bisgaard (1999) recomenda um Gráfico de Gantt (ver Wikipedia: Gantt chart), que é uma exibição gráfica simples que mostra as etapas do processo, bem como os tempos do calendário. Um orçamento deve ser delineado para despesas e recursos que serão necessários.


1.7 Realizando os experimentos


Na experimentação, o planejamento cuidadoso e a execução do plano são as etapas mais importantes. Como sabemos pela Lei de Murphy, se alguma coisa pode correr mal, correrá, e a análise dos dados nunca poderá compensar experiências mal sucedidas.

Para ilustrar os problemas potenciais que podem ocorrer, considere um experimento simples conduzido por um jardineiro amador descrito por Box et al. (1978). O objetivo era determinar se uma mudança na mistura de fertilizantes resultaria em uma mudança no rendimento de seus tomateiros. Foram plantados onze tomateiros em fileira única, variando-se o tipo de adubo A ou B. A unidade experimental deste experimento é o tomateiro mais o solo onde está plantado e o fator de tratamento é o tipo de fertilizante aplicado. Easterling (2004) discute algumas das nuances que devem ser consideradas ao planejar e realizar um experimento tão simples.

Ao definir os objectivos desta experiência, o experimentador precisa pensar antecipadamente nas possíveis implicações das conclusões que pode tirar. Neste caso, as conclusões possíveis são

  1. decidir que o fertilizante não tem efeito sobre o rendimento do tomate, ou

  2. concluir que um fertilizante produz um rendimento maior.

Se o jardineiro doméstico não encontrar diferença no rendimento, ele pode optar por usar o fertilizante mais barato. Se encontrar uma diferença, terá de decidir se o aumento no rendimento compensa qualquer aumento no custo do melhor fertilizante. Isso pode ajudá-lo a determinar quão grande é a diferença no rendimento que ele deve procurar e o número de tomateiros que ele deve incluir em seu estudo. A resposta a esta pergunta, que é crucial no planeamento da experiência, seria provavelmente muito diferente para um produtor comercial e para um entusiasta de quintal.

As unidades experimentais para este experimento foram definidas no parágrafo acima, mas ao identificá-las o experimentador deve considerar a semelhança ou homogeneidade das plantas e a distância entre as quais vai colocar os tomateiros no solo. Será suficientemente longe para que o fertilizante aplicado a uma planta não transborde e afecte as suas vizinhas?

Definir uma resposta significativa que possa ser medida pode ser complicado neste experimento. Nem todos os tomates de uma mesma planta amadurecem ao mesmo tempo. Assim, para medir o rendimento em termos de peso dos tomates, a lista de verificação e o diagrama de fluxo que descrevem como uma experiência é conduzida devem ser muito precisos.

É o peso de todos os tomates na planta em uma determinada data ou o peso acumulado dos tomates colhidos ao longo do tempo à medida que amadurecem? A precisão na definição da resposta e a consistência na adesão à definição ao fazer as medições são cruciais.

Existem muitas variáveis ocultas possíveis a serem consideradas neste experimento. Quaisquer diferenças na rega, remoção de ervas daninhas, tratamento de insectos, método e momento de aplicação de fertilizantes, e a quantidade de fertilizante aplicada podem certamente afectar o rendimento; portanto, o experimentador deve prestar muita atenção a essas variáveis para evitar vieses. Easterling (2004) também destacou que a posição da linha parece ter afetado também o rendimento, como pode ser visto na Figura 1.2.

A randomização dos fertilizantes para plantas e posições nas fileiras deve equalizar essas diferenças para os dois fertilizantes. Essa foi uma das coisas que Box et al. (1978) ilustraram com este exemplo. Se um método conveniente de aplicação dos fertilizantes, tal como A no início da linha seguido por B tivesse sido usado em vez da atribuição aleatória, o efeito da posição da linha poderia ter sido confundido com um efeito de tratamento. Se este efeito da posição da linha fosse conhecido antes do planejamento do experimento, os pares adjacentes de parcelas poderiam ter sido agrupados em pares e um fertilizante atribuído aleatoriamente a uma parcela-planta em cada par para evitar distorções do efeito da posição da linha. Essa técnica é chamada de bloqueio e será discutida no Capítulo 4.

Figura 1.2: Gráfico de rendimento por posição na linha - experimento com tomate.

Easterling (2004) também levantou a questão: por que apenas onze plantas foram utilizadas no estudo: cinco fertilizadas com fertilizante A e seis com fertilizante B? Normalmente, a quantidade de tomateiros comprados em um viveiro chega a doze. Alguma planta foi retirada do estudo porque parecia não ser saudável ou foi danificada durante o manuseio? O rendimento da planta na segunda linha (ver Figura 1.2) das 11 plantas utilizadas foi consideravelmente inferior ao das outras plantadas em linhas vizinhas com o mesmo fertilizante.

Esta planta também estava insalubre ou danificada? Quaisquer problemas que surjam durante a condução dos experimentos devem ser cuidadosamente observados, anotados e registrados como comentários no formulário de coleta de dados descrito no passo 9 da lista de verificação. Talvez se isto tivesse sido feito para a experiência do tomate, o baixo rendimento na posição dois da linha pudesse ser explicado.

Esta discussão de um experimento muito simples ajuda a enfatizar a importância de considerar cuidadosamente cada passo da lista de verificação apresentada na Seção 1.6 e a importância da adesão estrita a um fluxograma para a condução dos experimentos, descrito no passo 6 dessa lista de verificação. A falta de consideração de cada ponto da lista de verificação e a inconsistência na condução de experimentos e no registro de resultados podem levar ao fracasso de um projeto de pesquisa que de outra forma seria útil.


1.8 Exercícios


1- Uma série de ensaios foi realizada para determinar como a temperatura da água de lavagem e a concentração de detergente afetam a contagem bacteriana nas palmas dos indivíduos em um experimento de lavagem das mãos.

  1. Identifique a unidade experimental.

  2. Identifique os fatores.

  3. Identifique a resposta.

2- Explique a diferença entre uma unidade experimental e uma subamostra ou subunidade em relação aos experimentos descritos em 1.

3- Explique a diferença entre uma subamostra e uma duplicata em relação ao experimento descrito no exercício 1.

4- Descreva uma situação dentro da sua esfera de experiência (seu trabalho, seu hobby ou escola) onde você gostaria de prever o resultado de alguma ação futura. Explique como um desenho, plano ou planejamento experimental, em vez de um estudo observacional, pode melhorar a sua capacidade de fazer esta previsão.

5- Kerry e Bland (1998) descrevem a análise de estudos randomizados de agrupamento onde um grupo de indivíduos é randomizado para o mesmo tratamento. Por exemplo, quando às mulheres de alguns distritos seleccionados aleatoriamente é oferecido o rastreio do cancro da mama, enquanto às mulheres de outros distritos não é oferecido o rastreio ou quando acontece que alguns médicos clínicos gerais são aleatoriamente designados para receber um ou mais cursos de formação especial e a outros não é oferecido o treinamento. A resposta, alguma característica dos pacientes, nos ensaios de agrupamento deve ser medida em cada paciente e não no grupo como um todo. Qual é a unidade experimental neste tipo de estudo? Como você descreveria as medições individuais dos pacientes?