4.1 Introdução


Para eliminar ao máximo a variação natural e aumentar a sensibilidade dos experimentos, seria aconselhável escolher as unidades experimentais para um estudo o mais homogêneas possíveis. Em termos matemáticos, isso reduziria a variância \(\sigma^2\), do erro experimental e aumentaria o poder de detecção dos efeitos dos fatores de tratamento. Por outro lado, a maioria dos experimentadores gostaria que as conclusões do seu trabalho tivessem ampla aplicabilidade.

Considere o seguinte exemplo. Um experimentador gostaria de comparar vários métodos de exercício aeróbico para ver como eles afetam o nível de estresse e ansiedade dos sujeitos experimentais. Uma vez que existe uma grande variabilidade nos níveis de stress e ansiedade na população em geral, conforme medido por resultados de testes padronizados, seria difícil ver qualquer diferença entre os vários métodos de exercício, a menos que os indivíduos recrutados para o estudo fossem um grupo homogéneo, cada um semelhante nas suas características. nível de estresse.

No entanto, o experimentador gostaria de tirar conclusões gerais do seu estudo para pessoas de todos os níveis de estresse na população em geral. Se as unidades experimentais representam entidades físicas, o bloqueio ou agrupamento por características físicas semelhantes resulta frequentemente em grupos mais homogéneos.

Por exemplo, lotes de terreno em experiências agrícolas são normalmente bloqueados pela proximidade porque os lotes próximos normalmente têm características de solo semelhantes. Quando as unidades experimentais são animais, o agrupamento de animais geneticamente semelhantes, como irmãos de ninhada, muitas vezes reduz a variabilidade dentro dos grupos.

Quando as unidades experimentais são simplesmente ensaios, ou pontos no tempo onde os tratamentos serão aplicados, muitas vezes são bloqueadas pelo tempo, uma vez que muitas variáveis ocultas podem mudar ao longo do tempo e os ensaios em estreita proximidade temporal são mais parecidos.

Em um delineamento de blocos completos casualizados ou RCB, com um fator de tratamento, quando o fator tem \(t\) níveis, haverá \(b\) blocos ou subgrupos de unidades experimentais homogêneas, cada um contendo exatamente \(t\) unidades experimentais para um total de \(t\times b\) unidades experimentais. As \(t\) unidades experimentais dentro de cada bloco são tão semelhantes quanto possível e os grupos de unidades experimentais variam bastante de bloco a bloco para permitir tirar conclusões gerais.

A randomização das unidades experimentais para os níveis dos fatores de tratamento, descrita no Capítulo 2, é realizada dentro de cada bloco. R.A. Fisher propôs pela primeira vez projetos de blocos para experimentos agrícolas onde as unidades experimentais eram parcelas de terreno. Os blocos representavam parcelas compactas próximas e semelhantes. A variabilidade entre os blocos representou a gama de condições sobre as quais as conclusões seriam generalizadas.

Se houver mais de \(t\) unidades experimentais dentro de cada bloco, de modo que os níveis dos fatores de tratamento sejam replicados \(r\) vezes dentro de cada bloco, haverá um total de \(r\times t\times b\) unidades experimentais. Nesta situação chamamos o projeto de projeto geral de blocos completos. Normalmente, o RCB seria preferido ao projeto geral de blocos completos porque blocos menores de unidades experimentais permitem maior homogeneidade dentro dos blocos e, portanto, menores erros experimentais e testes e estimativas mais precisos.


4.2 Criando um delineamentos em blocos casualizados no R


A randomização de unidades experimentais para níveis de fator de tratamento em um desenho de blocos aleatórios pode ser realizada usando o código R base ou usando funções de pacotes. Para ilustrar como fazer isso usando código R base, considere a seguinte situação experimental.

Uma estudante queria investigar as histórias de uma velha senhora sobre métodos para prolongar a vida útil de flores cortadas. O fator de tratamento foi o líquido para encher o vaso. Os níveis foram:

  1. Água da torneira

  2. Água da torneira com uma colher de açúcar adicionada

  3. Água da torneira com um copo de água gaseificada

  4. Água da torneira com um copo de 7-up

As unidades experimentais foram de flores únicas e a resposta foi o tempo em dias até a flor murchar. A aluna queria que as conclusões de seu estudo se aplicassem a muitos tipos de flores, então ela usou um delineamentos em blocos casualizados (RCB). Os blocos foram:

  1. Rosa

  2. Cravo

  3. Margarida

  4. Tulipa

No código R abaixo, um vetor f, de níveis de fatores é criado para representar os quatro tratamentos. A seguir, a função sample é usada para criar uma ordenação aleatória dos níveis de tratamento.

Isto é repetido quatro vezes porque é necessária uma ordem aleatória diferente para cada um dos quatro blocos ou tipos de flores. Finalmente, esses vetores são empilhados, mesclados com os indicadores de bloco e guardados no conjunto de dados plan.

f = factor( c(1,2,3,4) )
b1t = sample(f,4)
b2t = sample(f,4)
b3t = sample(f,4)
b4t = sample(f,4)
t = c(b1t, b2t, b3t, b4t)
block = factor( rep(c("carnation", "daisy", "rose", "tulip"), each=4))
flnum = rep(f,4)
plan = data.frame(TypeFlower = block, FlowerNumber = flnum, treatment = t)
plan
##    TypeFlower FlowerNumber treatment
## 1   carnation            1         1
## 2   carnation            2         3
## 3   carnation            3         2
## 4   carnation            4         4
## 5       daisy            1         3
## 6       daisy            2         4
## 7       daisy            3         1
## 8       daisy            4         2
## 9        rose            1         4
## 10       rose            2         3
## 11       rose            3         1
## 12       rose            4         2
## 13      tulip            1         2
## 14      tulip            2         1
## 15      tulip            3         3
## 16      tulip            4         4


Este código produzirá uma lista aleatória diferente cada vez que for executado. Para utilizar a lista produzida, a aluna numeraria as flores de cada bloco de 1 a 4. Em seguida, utilizando a lista, o cravo número 1 seria colocado em um vaso com o nível do fator de tratamento que está indicado na primeira linha do formulário de coleta de dados. O cravo número 2 seria colocado em um vaso com o nível de tratamento que está indicado na segunda linha do formulário de coleta de dados e assim sucessivamente. Projetos RCB também podem ser criados usando pacotes R.

O código abaixo mostra um exemplo. Neste caso, é ilustrada a função design.rcbd do pacote agricolae (de Mendiburu, 2012b). Por padrão, esta função rotula as unidades experimentais como “plots” e usa números inteiros para os números dos blocos. A próxima instrução renomeia os níveis dos blocos. O argumento inicial na chamada da função é para a randomização e a execução do código com o mesmo seed (semente) permitirá ao usuário reproduzir a mesma lista aleatória várias vezes.

library(agricolae)
treat = c(1,2,3,4)
outdesign = design.rcbd(treat, 4, seed = 11)
rcb = outdesign$book
levels(rcb$block) = c("carnation", "daisy", "rose", "tulip")
rcb
##    plots     block treat
## 1    101 carnation     4
## 2    102 carnation     2
## 3    103 carnation     1
## 4    104 carnation     3
## 5    201     daisy     1
## 6    202     daisy     2
## 7    203     daisy     3
## 8    204     daisy     4
## 9    301      rose     2
## 10   302      rose     4
## 11   303      rose     1
## 12   304      rose     3
## 13   401     tulip     4
## 14   402     tulip     3
## 15   403     tulip     1
## 16   404     tulip     2



4.3 Modelo para um delineamento em blocos casualizados


O modelo para a análise de um delineamento em blocos casualizados é \[\begin{equation*} \tag{4.1} y_{ij}=\mu+b_1+\tau_j+\epsilon_{ij}, \end{equation*}\] onde \(b_i\) representa os efeitos do bloco e \(\tau_j\) representa os efeitos do tratamento.

As suposições usuais de normalidade do erro experimental e homogeneidade da variância do erro experimental entre os níveis dos fatores e blocos de tratamento são necessárias para este modelo. Estas suposições podem ser verificadas com gráficos de resíduos conforme mostrado na Seção 2.4.

Observe que este é um modelo aditivo que não inclui a interação entre bloco e tratamento. Como existem apenas \(t\times b\) unidades experimentais, haveria zero graus de liberdade para o termo de erro \(ssE\) se um termo de interação bloco por tratamento fosse incluído no modelo. No entanto, a interação bloco por tratamento é de fato o termo de erro correto para testar os efeitos do tratamento.

O experimentador deseja generalizar suas conclusões sobre os efeitos do tratamento para todas as unidades experimentais, de modo que os efeitos médios do tratamento devem ser maiores do que quaisquer diferenças nos efeitos do tratamento entre blocos de unidades experimentais.

A diferença nos efeitos do tratamento entre os blocos é exatamente o que a interação mede e é, portanto, o termo de erro correto. Ao deixar a interação fora do modelo, o \(ssE\) torna-se idêntico às somas dos quadrados da interação.

A tabela ANOVA para um delineamento em blocos casualizados é mostrada simbolicamente na Tabela 4.1. As representações das somas dos quadrados do tipo I para blocos e tratamentos são mostradas na tabela, semelhante ao que foi mostrado na Seção 3.5.1, mas serão idênticas às somas dos quadrados do tipo III para este projeto.

A soma dos erros dos quadrados é \[ ssE = \pmb{y}^\top\pmb{y}-\widehat{\beta}^\top\pmb{X}^\top\pmb{y}=\pmb{y}^\top\big(\pmb{I}-\pmb{X}(\pmb{X}^\top\pmb{X})^{-1}\pmb{X}^\top\big)\pmb{y}, \] onde \(\widehat{\beta}=(\pmb{X}^\top\pmb{X})^{-1}\pmb{X}^\top\pmb{y}\).

\[ \begin{array}{ccccc}\hline \mbox{Fonte} & \mbox{df} & \mbox{Somas de Quadrados} & \mbox{Quadrados Médios} & \mbox{teste} \, F \\\hline \mbox{Blocos} & b-1 & sSBlk = R(b \, | \, \mu) & ssBlk/(b-1) & \\ \mbox{Tratamentos} & t-1 & ssT = R(\tau \, | \, b,\mu) & ssT/(t-1) & msT/msE \\ \mbox{Erro} & (b-1)(t-1) & ssE & ssE/(b-1)(t-1) & \\\hline \end{array} \] Tabela 4.1: Tabela de Análise de Variância.

Os graus de liberdade para o erro \((b−1)(t−1)\) são menores do que seriam em um delineamento completamente casualizado com \(b\) réplicas de cada nível de tratamento; entretanto, se os grupos de unidades experimentais dentro dos blocos forem mais homogêneos, o \(msE\) deverá ser menor e o poder de detecção de diferenças entre os níveis de tratamento maior.

A estimativa da variância das unidades experimentais homogêneas dentro de cada bloco é dada por \[\begin{equation*} \tag{4.2} \widehat{\sigma}_{rcb}^2=\dfrac{ssE}{(b-1)(t-1)}\cdot \end{equation*}\]

Uma estimativa da variância de todo o grupo de unidades experimentais heterogêneas pode ser feita a partir dos quadrados médios na ANOVA de um delineamento em blocos casualizados. É dada pela fórmula \[\begin{equation*} \tag{4.3} \widehat{\sigma}_{crd}^2=\dfrac{ssBlk+ssE}{t(b-1)}, \end{equation*}\] que é uma média ponderada do quadrado médio para blocos e do quadrado médio para o erro.

Contudo, os pesos não são simplesmente os graus de liberdade para cada quadrado médio. Se o \(msBlk\) for zero, pode-se ver que \(\widehat{\sigma}^2_{crd} < \widehat{\sigma}^2_{rcb}\). A proporção de \(\widehat{\sigma}^2_{crd}\) e \(\widehat{\sigma}^2_{rcb}\) é uma medida da eficácia do bloqueio.

Os graus de liberdade de erro para o RCB são \(\nu_{rcb} = (b−1)(t−1)\), e os graus de liberdade de erro para um delineamento completamente casualizado (CRD) com o mesmo número de unidades experimentais seriam \(\nu_{crd} = t (b − 1)\). A eficiência relativa do RCB é então dada pela fórmula: \[\begin{equation*} \tag{4.4} RE=\dfrac{(\nu_{rcb}+1)(\nu_{crd}+3)\widehat{\sigma}_{crd}^2}{(\nu_{rcb}+3)(\nu_{crd}+1)\widehat{\sigma}_{rcb}^2}\cdot \end{equation*}\]

O RE pode ser utilizado para determinar o número de observações que seriam necessárias em um CRD, com unidades experimentais heterogêneas, para que as variâncias das médias de tratamento sejam equivalentes àquelas alcançadas com o RCB.

Se \(b\times t\) unidades experimentais fossem usadas no projeto RCB, então \(RE\times (b\times t)\) unidades experimentais seriam necessárias em um projeto CRD, sem bloqueio, para obter variâncias equivalentes das médias de tratamento.


4.4 Um exemplo de delineamento em blocos casualizados


Considere os dados da Tabela 4.2 de Lim and Wolfe (1997), parcialmente modificados de Heffner et al. (1974). O efeito da droga sulfato de d-anfetamina no comportamento de ratos foi o objeto do experimento.

O comportamento em estudo foi a taxa com que ratos privados de água pressionaram uma alavanca para obter água. A resposta foi a taxa de pressão na alavanca definida como o número de pressões na alavanca dividido pelo tempo decorrido da sessão.

Os níveis do fator de tratamento foram cinco dosagens diferentes do medicamento em miligramas por quilograma de peso corporal, incluindo uma dosagem de controle composta por solução salina. Um experimento ou corrida, consistia em injetar uma dosagem de droga em um rato e, após uma hora, começava uma sessão experimental em que um rato recebia água cada vez que uma segunda alavanca era pressionada.

\[ \begin{array}{ccccc}\hline \mbox{Rato} & 0.0 & 0.5 & 1.0 & 1.5 & 2.0 \\\hline 1 & 0.60 & 0.80 & 0.82 & 0.81 & 0.50 \\ 2 & 0.51 & 0.61 & 0.79 & 0.78 & 0.77 \\ 3 & 0.62 & 0.82 & 0.83 & 0.80 & 0.52 \\ 4 & 0.60 & 0.95 & 0.91 & 0.95 & 0.70 \\ 5 & 0.92 & 0.82 & 1.04 & 1.13 & 1.03 \\ 6 & 0.63 & 0.93 & 1.02 & 0.96 & 0.63 \\ 7 & 0.84 & 0.74 & 0.98 & 0.98 & 1.00 \\ 8 & 0.96 & 1.24 & 1.27 & 1.20 & 1.06 \\ 9 & 1.01 & 1.23 & 1.30 & 1.25 & 1.25 \\ 10 & 0.95 & 1.20 & 1.18 & 1.23 & 1.05 \\\hline \end{array} \] Tabela 4.2: Experiência de comportamento dos ratos.

A unidade experimental nestes experimentos não foi um rato, mas o estado de um único rato durante um experimento ou execução, uma vez que um rato individual poderia ser usado em muitos experimentos injetando-o repetidamente com diferentes doses da droga, após um período de lavagem apropriado e observando o comportamento de pressionar a alavanca.

Como houve grande variabilidade na taxa de pressão da alavanca entre ratos, foi utilizado um desenho RCB, e um rato representou o fator de bloqueio. Cada rato recebeu todas as cinco doses numa ordem aleatória, com um período de eliminação apropriado entre elas.

Neste caso, o rato é representado pelo termo \(b_i\) no modelo \[ y_{ij} = \mu + b_i + \tau_j + \epsilon_{ij}\cdot \] O erro experimental, representado por \(\epsilon_{ij}\), é o efeito do estado do rato \(i\) durante o ensaio em que recebeu a dose \(j\).

Se os dados forem apresentados sem descrever a unidade experimental e o processo de aleatorização, o modelo poderia ser facilmente mal especificado como \(y_{ij} = \mu + \tau_i +\epsilon_{ij}\), resultando numa análise e conclusões erradas e conclusões erradas.

Para utilizar a função aov do R para produzir a ANOVA utilizando o modelo modelo correto, são utilizados os seguintes comandos.

library(daewr)
mod1 = aov( rate ~ rat + dose, data = drug )
summary(mod1)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## rat          9 1.6685 0.18538   22.20 3.75e-12 ***
## dose         4 0.4602 0.11505   13.78 6.53e-07 ***
## Residuals   36 0.3006 0.00835                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


Na tabela ANOVA resultante acima, os testes \(F\) mostram que existe uma diferença significativa nos níveis dos factores de tratamento. Para interpretar as diferenças nos níveis dos factores de tratamento, devem ser feitas comparações de médias. Uma vez que os níveis dos factores são quantitativos, são úteis os contrastes polinomiais ortogonais descritos na Secção 2.8.

A função R contr.poly que foi introduzida na Secção 2.8 pode ser utilizada para calcular os contrastes linear, quadrático, cúbico e quártico para a dose. O código é mostrado a seguir. Neste caso, é utilizada a opção split no summary.aov em vez da função summary.lm que foi utilizada na Secção 2.8, uma vez que só precisamos ver a partição de grau único de liberdade para o fator dose no modelo.

contrasts(drug$dose) = contr.poly(5)
mod2 = aov( rate ~ rat + dose, data = drug)
summary.aov(mod2, split = list(dose = list("Linear" = 1, "Quadratic" = 2,"Cubic" = 3, "Quartic" = 4) ) )
##                   Df Sum Sq Mean Sq F value   Pr(>F)    
## rat                9 1.6685  0.1854  22.205 3.75e-12 ***
## dose               4 0.4602  0.1151  13.781 6.53e-07 ***
##   dose: Linear     1 0.0610  0.0610   7.308   0.0104 *  
##   dose: Quadratic  1 0.3943  0.3943  47.232 4.83e-08 ***
##   dose: Cubic      1 0.0041  0.0041   0.491   0.4882    
##   dose: Quartic    1 0.0008  0.0008   0.094   0.7613    
## Residuals         36 0.3006  0.0083                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


Os resultados mostram que existe uma tendência linear e quadrática significativa na taxa de pressão da alavanca ao longo da dose do medicamento.

As tendências lineares e quadráticas significativas ao longo da gama de doses podem ser visualizadas através da representação gráfica das médias em função da dose. O código R abaixo produz o gráfico da Figura 4.1.

A linha de tendência quadrática no gráfico ajusta-se bem às médias e mostra que a taxa de pressão da alavanca aumenta em função da dose até atingir um máximo em algum lugar entre 1.0 e 1.5 miligramas por quilograma de peso corporal.

R = do.call("cbind", split(drug$rate, drug$rat))
y = apply(R, 1, mean )
x = as.double( levels(drug$dose) )
par( mar = c(4,4,1,1), pch =19 )
plot( x, y, xlab = "dose", ylab = "average lever press rate" )
xx = seq( 0.0, 2.0, .1 )
rate.quad = lm( y ~ poly( x, 2) )
lines(xx, predict( rate.quad, data.frame( x = xx) ))
grid()

Figura 4.1: Médias da taxa de pressão da alavanca em função da dose do medicamento.

A variância estimada das unidades experimentais ou ensaios dentro de um bloco ou rato é o erro quadrático médio \(\widehat{\sigma}^2_{rcb}\)= 0.00834867, obtido como

summary(mod1)[[1]][["Mean Sq"]][3]
## [1] 0.008348667


A variância das unidades experimentais heterogéneas é dada por \[\begin{equation*} \tag{4.5} \widehat{\sigma}^2_{rcb} = \dfrac{ssBlk+ssE}{t(b-1)} = \dfrac{1.6685+0.3006}{(5)(10-1)} = 0.043758\cdot \end{equation*}\]

Este valor é aproximadamente cinco vezes maior do que a variância dentro de um rato e demonstra a eficácia do bloqueio por rato na experiência. A eficiência relativa é dada por \[\begin{equation*} \tag{4.6} RE=\dfrac{(\nu_{rcb}+1)(\nu_{crd}+3)\widehat{\sigma}^2_{crd}}{(\nu_{rcb}+3)(\nu_{crd}+1)\widehat{\sigma}^2_{rcb}} = \dfrac{(37)(48)0.043758}{(39)(46)0.0083487} = 5.2413\cdot \end{equation*}\]

Isto significa que o bloqueio reduziu a variância das unidades experimentais em cerca de 80%= 1-0.0083487/0.043758 e que seriam necessários cerca de cinco vezes mais ensaios para obter as variâncias equivalentes para as médias dos tratamentos se cada rato tivesse sido usado para apenas um ensaio num planejamento CRD, e a variabilidade de rato para rato não tivesse sido removida do termo de erro.


4.5 Determinando o do número de blocos


O teste \(F\) para efeito de tratamento ou dose no último exemplo foi altamente significativo, \(p\)-valor < .0001. Se a experiência fosse repetida numa situação em que a variabilidade da resposta, ou seja, na qual a taxa de pressão da alavanca num rato e as diferenças de tratamento permaneceriam aproximadamente as mesmas, seriam necessários menos blocos ou ratos para detetar diferenças significativas entre os tratamentos.

O parâmetro de não centralidade para o teste \(F\) de efeitos de tratamento no planejamento de blocos completos aleatórios é \[ \lambda = \big(b/\sigma^2\big)\sum_j \tau_j^2, \] e os graus de liberdade são \(\nu_1 = t-1\) e \(\nu_2 = (b-1)(t-1)\).

Assim, para calcular o número de blocos que resultará num poder entre 0.8 e 0.9 para detetar uma diferença nas médias dos tratamentos, o código R na Secção 3.5.2 pode ser modificado alterando alterando a fórmula dos graus de liberdade do denominador e o fator de não centralidade.

O código R abaixo pode ser usado para calcular o poder de um planejamento de blocos aleatórios em função do número de blocos. Utilizando os resultados do último experimento, a estimativa de \(\widehat{\sigma}^2_{rcb} = 0.00834867\) e \(css = \sum_j \tau_j^2\) pode ser estimada como sendo \[ (0.764-0.9142)^2+ \cdots +(0.850-0.9142)^2 = 0.460208\cdot \]

Utilizando estes dados como entradas para a função Fpower mais geral que recebe os graus de liberdade e o parâmetro de não centralidade como argumentos, são criados os resultados apresentados abaixo do código. Pode-se ver que uma potência superior a 0.99 pode ser alcançada com apenas $b = 2 blocos ou ratos na experiência.

library(daewr)
bmin = 2
bmax = 3
alpha = 0.05
sigma2 = 0.0083487
css = 0.460208
nu1 = 5-1
blocks = c(bmin:bmax)
nu2 = (blocks - 1) * 4
nc = (blocks * css) / sigma2
Power = Fpower( alpha, nu1, nu2, nc )
data.frame(blocks, nu1, nu2, nc, Power)
##   blocks nu1 nu2       nc     Power
## 1      2   4   4 110.2466 0.9966799
## 2      3   4   8 165.3699 1.0000000


Se a estimativa de \(\sigma^2_{crd}\) estivesse disponível em experimentos anteriores ou estudos piloto, Hinkelmann and Kempthorne (1994) mostraram que a eficiência relativa (RE) \(\sigma^2_{crd}\) também pode ser usada para obter uma estimativa aproximada do número de blocos necessários para um projeto RCB.

Por exemplo, suponha que \(\sigma^2_{crd}\) tenha sido estimado em 0.040865 em experimentos anteriores e o número de repetições de cada tratamento necessário para um projeto CRD atingir o poder adequado para detectar uma diferença prática nas médias foi \(r = 20\), determinado pelos métodos da Seção 3.5.2.

Se fosse esperado que o bloqueio reduzisse a variância em 90%, ou seja, \(\sigma^2_{rcb} = 0.10\times \sigma^2_{crd}\) ou \(RE = 10.0\). Então, o número de blocos necessários para atingir a mesma potência com um projeto RCB é \[ b = \dfrac{r}{RE} = \dfrac{10}{20}= 2\cdot \]


4.6 Planos factoriais em blocos


A blocagem é ainda mais eficaz quando combinada com um planejamento fatorial nos factores de tratamento. No caso de ser estudado mais do que um fator de tratamento, o número de unidades experimentais em cada bloco deve ser igual ao produto dos níveis de todos os factores.

Chama-se a isto um fatorial de blocos completos aleatorizados ou RCBF. Como exemplo de uma experiência fatorial bloqueada, considere os dados da Tabela 4.3. Esta experiência foi realizada por Festing (2003) para determinar se o BHA, um antioxidante comum utilizado em alimentos processados, induzia a atividade da enzima hepática EROD em ratos e se esta atividade dependia da variedade de ratos. Fazia parte de um estudo mais abrangente para determinar se os antioxidantes ajudam a proteger contra o câncer.

\[ \begin{array}{cccc}\hline & \mbox{Bloco 1} & & \mbox{Bloco 2} & \\ \mbox{Variedade} & \mbox{Tratados} & \mbox{Controle} & \mbox{Tratados} & \mbox{Controle} \\\hline \mbox{A/J} & 18.7 & 7.7 & 16.7 & 6.4 \\ \mbox{129/Ola} & 17.9 & 8.4 & 14.4 & 6.7 \\ \mbox{NH} & 19.2 & 9.8 & 12.0 & 8.1 \\ \mbox{BALB/c} & 26.3 & 9.7 & 19.8 & 6.0 \\\hline \end{array} \] Tabela 4.3: Atividade da enzima hepática EROD em camundongos controle e tratados com BHA.

Os factores nesta experiência foram A, se um rato foi tratado com BHA ou não, e B, a variedade do rato. Como não é possível atribuir a um camundongo específico uma determinada linhagem, a unidade experimental não é o camundongo, mas o ensaio ou as condições existentes no laboratório quando um experimento específico foi executado.

Uma corrida consistiu em selecionar um camundongo de uma cepa específica; então incorporar BHA na dieta (por um período de 3 semanas) ou não (dependendo do que foi especificado); e finalmente sacrificar humanamente o camundongo e realizar uma autópsia para determinar o nível de atividade da enzima EROD no fígado.

Como os resultados de experimentos in vivo como este podem variar substancialmente de tempos em tempos no mesmo laboratório devido a diferenças nos reagentes utilizados para a análise enzimática, calibração de instrumentos e fatores ambientais na criação de animais, os experimentos foram bloqueados no tempo.

Dois camundongos foram selecionados de cada uma das quatro linhagens, um foi escolhido aleatoriamente para receber BHA na dieta e oito ensaios ou corridas foram realizados simultaneamente. Isso representou um bloco. Três meses depois, todo o processo foi repetido para um segundo bloco de execuções. Como existem dois níveis do fator de tratamento (tratado ou controle com BHA) e quatro níveis do fator deformação, houve 2 × 4 = 8 unidades experimentais ou execuções por bloco.

O modelo para análise de um fatorial de dois fatores em delineamento em blocos casualizados, como o mostrado na Tabela 4.3, é \[\begin{equation*} \tag{4.7} y_{ijk} = \mu + b_i + \alpha_j + \beta_k + \alpha\beta_{jk} + \epsilon_{ijk}, \end{equation*}\] onde \(b_i\) representa o efeito de bloqueio, \(\alpha_j\) representa o efeito do fator de tratamento e \(\beta_k\) representa o efeito do fator de deformação. Este modelo é facilmente generalizado para experimentos fatoriais multifatoriais em blocos aleatórios.

Observe que no modelo (4.7) existe uma interação \(\alpha\betaα_{jk}\) entre os dois fatores fatoriais, mas não há interação entre o fator de bloco \(b_i\) e os fatores fatoriais, \(\alpha_j\) e \(\beta_k\). As interações com os blocos são o termo de erro para a análise e se forem incluídas no modelo haverá zero graus de liberdade para \(ssE\).

Os comandos do código R para realizar a análise são mostrados abaixo com a tabela ANOVA resultante. Aí pode-se observar que o tratamento, a tensão e a interação com BHA são significativos. A soma dos quadrados dos blocos também é grande, resultando em uma eficiência relativa \(RE = 2.11\). Isso significa que seriam necessários mais do que o dobro de ratos para ter a mesma potência ou sensibilidade se os experimentos não fossem bloqueados pelo tempo.

library(daewr)
mod3 = aov( y ~ block + strain * treat, data = bha)
summary(mod3)
##              Df Sum Sq Mean Sq F value   Pr(>F)    
## block         1   47.6    47.6  18.372  0.00363 ** 
## strain        3   33.0    11.0   4.240  0.05274 .  
## treat         1  422.3   422.3 162.961 4.19e-06 ***
## strain:treat  3   40.3    13.4   5.189  0.03368 *  
## Residuals     7   18.1     2.6                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


A Figura 4.2 abaixo auxilia na interpretação dos efeitos fatoriais e da interação. Pode-se observar que, em média, o BHA adicionado à dieta aumenta a atividade da enzima EROD no fígado do camundongo. No entanto, este aumento é quase duplicado para ratos da variedade BALB/c.

par(mar=c(4,4,1,1))
with(bha, (interaction.plot(treat, strain, y, type = "b",
                            pch = c(0,2,6,15), leg.bty = "o", main = "BHA Effect for Each Strain", 
                            xlab = "BHA Treated", ylab = "average EROD")))
## NULL
grid()

Figura 4.2: Efeito do BHA para cada variedade.


4.7 Delineamento em blocos completos generalizados


Quando as unidades experimentais representam entidades físicas, grupos ou blocos mais pequenos de unidades experimentais resultam normalmente numa maior homogeneidade. Quanto maior for o grupo, maior é a probabilidade de haver muitas unidades experimentais que são muito diferentes da norma ou da média.

Por essa razão, não é aconselhável ter planos em blocos com mais do que o mínimo \(t\), de unidades experimentais por bloco, em que \(t\) é o número de níveis ou de combinações de níveis dos factores de tratamento.

No entanto, em alguns casos em que as unidades experimentais representam ensaios em vez de entidades físicas e as execuções experimentais podem ser feitas rapidamente, blocos maiores podem não aumentar a variabilidade das unidades experimentais dentro de um bloco. Nesse caso, um projeto com réplicas de cada nível de tratamento dentro de um bloco, chamado projeto de bloco completo generalizado ou GCB, pode ser usado.

Considere o seguinte exemplo da Golf Magazine (Bastable, 2006, junho). Um experimento foi conduzido para determinar a altura ideal do tee para conduzir uma bola de golfe o mais longe possível. O objetivo era recomendar a todos os leitores do artigo qual altura do tee deveriam usar. O fator de tratamento foi a altura do tee conforme mostrado na Tabela 4.4.

\[ \begin{array}{cl} \mbox{Nível} & \mbox{Altura do tee} \\\hline 1 & \mbox{Bola inteira abaixo da coroa} \\ 2 & \mbox{Metade da bola acima da coroa} \\ 3 & \mbox{Parte inferior da bola no topo da face do taco} \end{array} \]

\[ \qquad \qquad \qquad \mbox{ID do jogador de golfe} \\ \begin{array}{cccccccccc}\hline \mbox{Altura do tee} & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 \\\hline 1 & 142.0 & 169.5 & 142.7 & 185.4 & 222.2 & 133.6 & 165.2 & 174.3 & 229.7 \\ 1 & 141.8 & 177.0 & 136.2 & 164.8 & 201.9 & 132.6 & 173.2 & 160.1 & 220.7 \\ 1 & 153.7 & 169.1 & 140.2 & 173.9 & 192.5 & 135.0 & 174.2 & 162.8 & 240.4 \\ 1 & 130.6 & 176.5 & 143.3 & 191.9 & 182.0 & 147.6 & 176.9 & 174.6 & 219.5 \\ 1 & 147.8 & 173.8 & 145.8 & 164.5 & 224.8 & 136.7 & 166.4 & 172.6 & 225.6 \\ 2 & 142.7 & 185.6 & 137.8 & 184.7 & 197.7 & 145.5 & 178.8 & 184.4 & 241.6 \\ 2 & 136.2 & 164.8 & 159.0 & 172.8 & 229.8 & 154.5 & 163.4 & 181.8 & 242.1 \\ 2 & 140.2 & 173.9 & 151.1 & 175.8 & 203.3 & 150.5 & 160.2 & 185.0 & 243.4 \\ 2 & 143.3 & 191.9 & 154.1 & 184.7 & 214.3 & 137.9 & 160.6 & 192.4 & 240.8 \\ 2 & 145.8 & 164.5 & 135.0 & 172.2 & 220.9 & 154.4 & 169.3 & 193.3 & 240.7 \\ 3 & 137.8 & 184.7 & 142.0 & 176.0 & 221.8 & 145.9 & 172.8 & 180.6 & 243.3 \\ 3 & 159.0 & 183.0 & 141.8 & 177.0 & 240.0 & 146.0 & 183.2 & 172.5 & 242.1 \\ 3 & 151.1 & 195,9 & 153.7 & 175.3 & 221.4 & 139.2 & 170.2 & 181.2 & 236.1 \\ 3 & 154.1 & 194.4 & 130.6 & 176.5 & 234.9 & 145.2 & 169.6 & 178.4 & 248.3 \\ 3 & 135.0 & 182.2 & 147.8 & 173.8 & 213.2 & 147.2 & 169.9 & 167.6 & 240.4 \\\hline \end{array} \] Tabela 4.4: Níveis de fatores de tratamento para experimentos de golfe e dados do experimento.

O experimento consistiu em um jogador de golfe acertar uma bola de golfe de uma altura específica e a resposta foi a distância que a bola percorreu. Para chegar a uma conclusão geral, foi necessário utilizar um grupo representativo de golfistas em vez de um único golfista.

Como a capacidade de conduzir a bola dos jogadores de golfe utilizados no estudo era diferente, fazia sentido agrupar ou bloquear as tentativas por jogador de golfe e randomizar a ordem em que cada jogador de golfe acertava a bola em cada uma das alturas do tee. No entanto, uma vez que acertar mais de três bolas de golfe provavelmente não cansaria um jogador de golfe e causaria mais variabilidade na distância percorrida, não havia necessidade de restringir um jogador de golfe a acertar apenas três bolas. Em vez disso, cada jogador de golfe acertou \(r = 5\) bolas de golfe em cada uma das \(t = 3\) alturas de tee.

Os resultados deste experimento são mostrados na Tabela 4.4. Nove jogadores de golfe foram utilizados nesta parte do estudo; cada jogador de golfe acertou cinco bolas de cada altura do tee, 15 bolas no total, em ordem aleatória. Como existem unidades experimentais replicadas para cada tratamento em cada bloco, é possível ajustar o modelo \[\begin{equation*} \tag{4.8} y_{ijk} = \mu+b_i+\tau_j+b\tau_{ij}+\epsilon_{ijk}\cdot \end{equation*}\]

No entanto, isso deixa um dilema. O \(msE\) na ANOVA tradicional e o denominador dos testes \(F\) para o efeito do tratamento e a interação bloco por tratamento baseiam-se na variabilidade das unidades experimentais dentro do mesmo tratamento e bloco, neste caso, jogador de golfe. Se a interação entre o bloco, jogador de golfe, e o fator de tratamento, altura do tee, fosse significativa, a sua interpretação implicaria que a altura ideal do tee poderia ser diferente para diferentes jogadores de golfe.

Os golfistas do estudo eram apenas uma amostra de golfistas, e se a altura ideal do tee fosse diferente para eles, não haveria forma de recomendar uma altura ideal do tee para todos os leitores do artigo da Golf Magazine.

Para fazer uma recomendação geral, o fator de tratamento deve ser testado usando o quadrado médio da interação bloco por tratamento como denominador do teste \(F\). Se o quadrado médio da altura do tee for significativamente maior do que o quadrado médio da interação entre o jogador de golfe e a altura do tee, seria justificativa para fazer uma recomendação geral para a altura ideal do tee, outra justificativa para usar a interação bloco por tratamento como denominador do teste \(F\) para tratamento será dado no Capítulo 5, Seção 5.8.

Um teste \(F\) para tratamentos construídos desta forma não é feito automaticamente pela função aov em R, mas pode ser especificado usando a opção Error(id/teehgt) na função aov conforme mostrado no código abaixo, onde id representa bloco ou golfista ID e teehgt representam o nível do fator de tratamento.

library(daewr)
data(rcb)
head(rcb)
##   id teehgt cdistance
## 1  1      1     142.0
## 2  1      1     141.8
## 3  1      1     153.7
## 4  1      1     130.6
## 5  1      1     147.8
## 6  1      2     142.7
attach(rcb)
mod4 = aov(cdistance ~ teehgt + Error(id/teehgt))
summary(mod4)
## 
## Error: id
##           Df Sum Sq Mean Sq F value Pr(>F)
## Residuals  8 124741   15593               
## 
## Error: id:teehgt
##           Df Sum Sq Mean Sq F value Pr(>F)  
## teehgt     2   1724   862.0   5.854 0.0124 *
## Residuals 16   2356   147.3                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Error: Within
##            Df Sum Sq Mean Sq F value Pr(>F)
## Residuals 108   7341   67.97


A soma dos quadrados e o quadrado médio para o bloco ou ID do jogador de golfe é mostrado na seção de saída chamada Erro: id e o teste para o efeito do tratamento ou altura do tee, é mostrado na seção de saída chamada Erro: id:teehgt.

Nessa seção, o que é rotulado como Resíduos é na verdade a soma dos quadrados da interação bloco por tratamento, e esse quadrado médio é usado no denominador do teste \(F\). A seção final da saída mostra a soma dos quadrados dos resíduos e o quadrado médio, que não é usado no teste.

Nos resultados pode-se observar que a altura do tee é significativa no nível \(\alpha = 0.0124\). Isso é muito diferente do \(p\)-valor incorreto (1.13e−05) que resultaria do comando:

mod4a = aov( cdistance ~ id*teehgt, data = rcb)
summary(mod4a)
##              Df Sum Sq Mean Sq F value   Pr(>F)    
## id            8 124741   15593 229.406  < 2e-16 ***
## teehgt        2   1724     862  12.682 1.13e-05 ***
## id:teehgt    16   2356     147   2.166   0.0102 *  
## Residuals   108   7341      68                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


Este modelo utiliza o quadrado médio dos resíduos com 108 graus de liberdade para o denominador do teste \(F\). Neste exemplo, qualquer forma de fazer o teste \(F\) para tratamento indica significância, mas em geral o teste \(F\) para tratamento pode às vezes ser significativo ao testar com o quadrado médio do erro como denominador do teste \(F\), enquanto não significativo ao testar com o quadrado médio do bloco por tratamento como denominador do teste \(F\).

Nesse caso, o resultado do teste \(F\) usando o quadrado médio da interação deve ser usado se você quiser generalizar as conclusões para todos os blocos potenciais. Uma maneira alternativa de realizar o teste correto é criar uma nova resposta calculando a média das respostas em cada bloco por combinação de tratamento e, em seguida, ajustando o modelo para delineamento de blocos completos casualizados (RCB) normal, conforme mostrado a continuação.

cellmeans = tapply( rcb$cdistance, list(rcb$id, rcb$teehgt), mean)
dim(cellmeans) = NULL
teehgt = factor( rep(c(1,2,3), each = 9) ) 
id = factor( rep(c(1,2,3,4,5,6,7,8,9), 3) )
mod5 = aov( cellmeans ~id + teehgt )
summary( mod5 )
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## id           8  24948  3118.5 105.888 2.19e-12 ***
## teehgt       2    345   172.4   5.854   0.0124 *  
## Residuals   16    471    29.5                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


O valor \(F\) para tratamento neste modelo será idêntico ao do modelo mod4 mostrado acima. O objeto aov mod5 também pode ser usado para auxiliar na interpretação do significado dos efeitos significativos do tratamento.

O erro correto para uso em comparações de médias pareadas de Tukey, como o exemplo mostrado na Seção 2.8.2, resultará ao usar este objeto. O código R abaixo calcula a distância média para cada nível de altura do tee.

model.tables( mod5, type = "means" )$tables$teehgt
## teehgt
##        1        2        3 
## 171.4578 177.8378 179.8378


Além disso, o código abaixo produz comparações HSD de Tukey das diferenças médias.

TukeyHSD( mod5, "teehgt" )
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = cellmeans ~ id + teehgt)
## 
## $teehgt
##     diff        lwr       upr     p adj
## 2-1 6.38 -0.2211713 12.981171 0.0589879
## 3-1 8.38  1.7788287 14.981171 0.0124851
## 3-2 2.00 -4.6011713  8.601171 0.7192035


As médias e as comparações de Tukey mostram que a distância média de condução para a altura do tee = 1, bola inteira abaixo da coroa, é de 171.45 jardas. É significativamente menor do que a distância média de condução 177.8 jardas, para a altura do tee = 3, ou seja, parte inferior da bola no topo da face do taco no nível \(\alpha = 0.0125\) e marginalmente significativamente menor do que a distância 179.8 jardas para o tee altura = 2, na qual, metade da bola acima da coroa.

As distâncias médias para as alturas 2 e 3 do tee não foram significativamente diferentes com \(\alpha = 0.7192\). Portanto, a recomendação aos leitores do artigo foi colocar a bola de golfe para cima, de modo que pelo menos metade da bola fique acima da coroa da face do taco do piloto, a fim de maximizar a distância de condução.

Às vezes, há um teste mais poderoso dos efeitos do tratamento do que pode ser obtido usando o termo de interação bloco por tratamento como denominador do teste \(F\). Se o próprio termo de interação bloco por tratamento for não significativo, o modelo aditivo \[ y_{ijk} = \mu + b_i + \tau_j + \epsilon_{ijk} \] pode ser ajustado aos dados e o denominador do teste \(F\) padrão para tratamentos usará o termo \(msE\) que é um conjunto ou média ponderada da interação e termo de erro do modelo (4.8).

Se a interação for não significativa, o quadrado médio da interação estima o mesmo erro experimental que o quadrado médio do erro. Nesse caso, agrupar estes dois quadrados médios aumenta os graus de liberdade para o termo de erro e aumenta o poder ou sensibilidade do teste \(F\) para efeitos de tratamento.

Normalmente, o teste \(F\) preliminar da interação, que é usado para decidir se o modelo aditivo deve ou não ser ajustado, é conduzido em um nível de significância mais alto, como \(\alpha = 0.25\). Se a interação for não significativa no nível \(\alpha = 0.25\), use o quadrado médio da interação como denominador do teste \(F\) apropriado para efeitos de tratamento.

Se a interação não for significativa em \(\alpha = 0.25\), ajuste o modelo aditivo e use o teste \(F\) padrão para tratamentos. Este procedimento é chamado de procedimento “Pool or not to Pool”. Para o experimento de golfe, a soma dos quadrados da interação é significativa no nível \(\alpha = 0.0102 < 0.25\) e, portanto, o modelo aditivo não deve ser ajustado e não há teste \(F\) mais poderoso para tratamentos do que o mostrado acima.


4.8 Planejamento de quadrado latino de dois fatores em bloco


Foi demonstrado pela primeira vez em experimentos agrícolas (Fisher, 1935) que o processo de agrupamento de parcelas experimentais em blocos homogêneos poderia ser duplicado com lucro. Por exemplo, no lado esquerdo da Figura 4.3 vemos uma representação de um RCB de blocos aleatórios disposto em um campo.

Neste projeto, um campo, de formato aproximadamente quadrado, é dividido em quatro blocos retangulares. Cada bloco é dividido em quatro parcelas e os níveis de tratamento (A, B, C, D) são atribuídos aleatoriamente a uma parcela dentro de cada bloco. Na figura a atribuição aleatória dentro do bloco é representada por cada letra aparecendo apenas uma vez em cada linha que representa um bloco.

Se houver um gradiente de fertilidade de cima para baixo neste campo, as parcelas dentro de um bloco serão mais semelhantes em fertilidade do que as parcelas em blocos ou linhas diferentes, e o desenho de blocos aleatórios funcionaria bem para reduzir a variância dos erros experimentais dentro um bloco.

Se não houvesse um gradiente claro no campo, mas as parcelas adjacentes tendessem a ser mais parecidas do que as parcelas em extremidades diferentes do mesmo bloco, um planejamento como o mostrado no lado direito da Figura 4.3 atribui cada nível de tratamento apenas uma vez a cada linha e uma vez para cada coluna. Dessa forma, a variabilidade de coluna para coluna também pode ser removida das somas dos quadrados dos erros, aumentando ainda mais a sensibilidade para detectar os efeitos do tratamento.

Figura 4.3: Comparação entre projetos de blocos completos casualizados (RCB) e quadrado latino (LSD).

O planejamento mostrado no lado direito da Figura 4.3 é chamado de desenho do quadrado latino ou LSD, e é bloqueado tanto horizontal quanto verticalmente. A restrição com um LSD é que o número de blocos de linhas seja igual ao número de blocos de colunas, que é igual ao número de níveis do fator de tratamento. Esta restrição será flexibilizada no Capítulo 7, onde serão discutidos esquemas mais gerais de bloqueio de linhas-colunas.

O modelo para um LSD está escrito \[\begin{equation*} \tag{4.9} y_{ijk} = \mu + r_i + c_j + \tau_k + \epsilon_{ijk}, \end{equation*}\] onde \(r_i\) representa o fator de bloqueio de linha, \(c_j\) representa o fator de bloqueio de coluna e \(\tau_k\) representa o fator de tratamento.

Tal como o modelo (4.1) para o projeto RCB, nenhuma interação é incluída no modelo, de modo que quaisquer diferenças nos níveis dos fatores de tratamento podem ser generalizadas em linhas e colunas.

Os delineamentos do quadrado latino podem ser usados sempre que houver dois fatores de bloqueio independentes que possam ser usados para agrupar unidades experimentais. Por exemplo, se um experimento estivesse sendo conduzido para determinar o efeito do desenho da banda de rodagem na vida útil dos pneus de automóveis, a unidade experimental seria uma roda de um carro e o fator de tratamento seria o desenho da banda de rodagem do pneu montado naquela roda.

Faria sentido bloquear as unidades experimentais por tipo de automóvel, uma vez que os pneus podem desgastar-se mais rapidamente em carros mais pesados do que em carros mais leves. Também faria sentido bloquear pela posição do pneu de um carro, uma vez que os pneus dianteiros direitos se desgastam a uma taxa diferente dos pneus traseiros esquerdos, e assim por diante.

Esses são fatores de bloqueio independentes porque todas as posições das quatro rodas existem em qualquer tipo de carro. Para usar um LSD, o número de tipos de banda de rodagem comparados e o número de tipos de carros usados no estudo devem ser quatro para igualar o número de posições das rodas de um carro. O fator de bloqueio de linha no quadrado latino representaria o tipo de carro, com quatro alternativas variando entre a classe de carros para a qual o experimentador gostaria de fazer inferência.

O fator de bloqueio da coluna representaria a posição de um pneu no carro (FL, FR, RL, RR), e o fator de tratamento representaria os quatro diferentes tipos de banda de rodagem que estão sendo testados.


4.8.1 Criação e aleatorizando projetos de quadrados latinos


Os delineamentos de quadrados latinos são fáceis de criar girando ciclicamente as letras ou símbolos usados para representar os níveis dos fatores de tratamento. Por exemplo, para um quadrado latino 5 × 5, consideremos que as letras A, B, C, D, E representarem os níveis do fator de um tratamento.

Então o design é criado como: \[ \begin{array}{ccccc} \mbox{A} & \mbox{B} & \mbox{C} & \mbox{D} & \mbox{E} \\ \mbox{B} & \mbox{C} & \mbox{D} & \mbox{E} & \mbox{A} \\ \mbox{C} & \mbox{D} & \mbox{E} & \mbox{A} & \mbox{B} \\ \mbox{D} & \mbox{E} & \mbox{A} & \mbox{B} & \mbox{C} \\ \mbox{E} & \mbox{A} & \mbox{B} & \mbox{C} & \mbox{D} \\ \end{array} \]

Para evitar vieses de variáveis ocultas desconhecidas, a randomização deve ser usada em projetos de quadrado latino(LSDs). Contudo, deve-se tomar cuidado para que, após a randomização, cada nível de tratamento ainda ocorra uma vez em cada linha e uma vez em cada coluna. Isso pode ser conseguido randomizando primeiro a ordem das linhas, mantendo as posições das colunas fixas em cada linha, depois randomizando as colunas mantendo as posições das linhas fixas dentro de cada coluna e, finalmente, randomizando a ordem dos rótulos de tratamento. Isso pode ser realizado com a função design.lsd no pacote R agricolae.

O código abaixo ilustra o uso da função design.lsd para criar e randomizar um plano para estudar o efeito do número de revestimentos nas prateleiras nas vendas de creme dental em drogarias. O fator de tratamento é o número de superfícies de prateleira (1-4), o fator de bloqueio de coluna é a loja, para contabilizar diferenças entre lojas, e o fator de bloqueio de linha é a semana do calendário, isto para contabilizar fatores sazonais.

A resposta seria as vendas semanais em dólares. As primeiras seis linhas do conjunto de dados aleatório lsd resultante são mostradas abaixo da chamada de função e podem ser usadas para criar um formulário eletrônico de coleta de dados, conforme mostrado nos capítulos anteriores.

library(agricolae)
tmts = c(1, 2, 3, 4)
outdesign = design.lsd( tmts, seed = 23)
lsd = outdesign$book
levels(lsd$row) = c("Week 1", "Week 2", "Week 3", "Week 4")
levels(lsd$col) = c("Store 1", "Store 2", "Store 3", "Store 4")
head(lsd)
##   plots    row     col tmts
## 1   101 Week 1 Store 1    3
## 2   102 Week 1 Store 2    1
## 3   103 Week 1 Store 3    2
## 4   104 Week 1 Store 4    4
## 5   201 Week 2 Store 1    2
## 6   202 Week 2 Store 2    4

4.8.2 Análise de um experimento de quadrado latino


Planejamentos de quadrados latinos são frequentemente usados em experimentos de alimentação de novilhos ou vacas leiteiras e em estudos de bioequivalência para comparar diferentes formulações de um medicamento em ensaios clínicos de fase II. Nestes estudos, o fator de bloqueio da coluna é o tempo e o fator de bloqueio da linha é um animal ou um ser humano. Em alguns casos, o tratamento administrado num período de tempo pode ter um efeito de transferência na resposta no período seguinte.

No entanto, se houver um período de lavagem suficiente entre os blocos de colunas, não haverá efeitos de transferência e os dados poderão ser analisados como um quadrado latino tradicional.

Para ilustrar a análise dos dados de um quadrado latino, considere o seguinte estudo de bioequivalência. Os dados são mostrados na Tabela 4.5, retirado de Selwyn and Hall (1984).

\[ \begin{array}{cccc}\hline \mbox{Sujeito} & \mbox{Período 1} & \mbox{Período 2} & \mbox{Período 3} \\\hline 1 & \mbox{A } 1186 & \mbox{B } 642 & \mbox{C } 1183 \\ 2 & \mbox{B } 984 & \mbox{C } 1135 & \mbox{A } 1305 \\ 3 & \mbox{C } 1426 & \mbox{A } 1540 & \mbox{B } 873 \\\hline \end{array} \]

O objetivo foi testar a bioequivalência de três formulações: A = solução, B = comprimido, C = cápsula, de um medicamento medida pela AUC ou área sob a curva, que relaciona a concentração do medicamento no sangue em função do tempo desde a dosagem. Três sujeitos voluntários tomaram cada formulação em sucessão com um período de lavagem suficiente entre elas.

Após a dosagem, foram obtidas amostras de sangue a cada meia hora durante quatro horas e analisadas quanto à concentração do medicamento. A AUC foi calculada com os dados resultantes. Uma vez que pode haver uma grande variação no metabolismo do fármaco de indivíduo para indivíduo, o indivíduo foi utilizado como factor bloqueador de linha. Como a absorção e o metabolismo de um medicamento variam de tempos em tempos para um indivíduo específico, o tempo foi utilizado como fator de bloqueio da coluna.

O código R para abrir o conjunto de dados e ajustar o modelo (4.9) é mostrado abaixo. A tabela ANOVA resultante, mostrada a continuação, indica que não há diferença nas três formulações.

library(daewr)
mod6 = aov( AUC ~ Subject + Period + Treat, data = bioeqv)
summary(mod6)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Subject      2 114264   57132   0.258  0.795
## Period       2  45196   22598   0.102  0.907
## Treat        2  15000    7500   0.034  0.967
## Residuals    2 442158  221079


Para fins ilustrativos, o código e os resultados abaixo mostram as médias dos três tratamentos e uma comparação múltipla de Tukey.

model.tables( mod6, type = "means" )$tables$Treat
## Treat
##        A        B        C 
## 1198.667 1105.667 1120.333
TukeyHSD( mod6, "Treat")
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = AUC ~ Subject + Period + Treat, data = bioeqv)
## 
## $Treat
##          diff       lwr      upr     p adj
## B-A -93.00000 -2354.511 2168.511 0.9686678
## C-A -78.33333 -2339.844 2183.178 0.9775653
## C-B  14.66667 -2246.844 2276.178 0.9991960



4.8.3 Determinando o número de réplicas


O número de réplicas de cada nível de fator de tratamento, em um Planejamento de quadrado latino com \(t\) linhas e \(t\) colunas deve ser igual a \(t\). A única maneira de aumentar o poder de detecção de diferenças nas médias de tratamento seria aumentando o número de linhas ou colunas. No último exemplo, o fator de bloqueio de linhas representou sujeitos e o fator de bloqueio de colunas representou períodos.

Uma forma de aumentar o poder de detecção de diferenças nas médias de tratamento seria aumentar o número de sujeitos. Se o número de sujeitos \(r\), fosse duplicado, ou seja, \(r = 2t\), seria essencialmente o mesmo que replicar o quadrado latino com \(t\) sujeitos adicionais.

Em geral, se considerarmos que um quadrado latino replicado tem \(r = nt\) linhas, onde \(n\) é um número inteiro, \(t\) colunas e \(t\) níveis do fator de tratamento, o modelo para os dados ainda será a Equação (4.9), mas os graus de liberdade para o termo de erro será \[ \nu_2 = (r-−2)(t-1)\cdot \] O fator de não centralidade para o teste \(F\) de ausência de efeitos de tratamento é \[ \lambda = nt\sum_k \tau_k^2/\sigma^2, \] onde \(n\) é o número de vezes que o quadrado foi repetido.

Portanto, para calcular o número de réplicas do quadrado \(n\), que resultará em um poder entre 0.8 e 0.9 para detectar uma diferença nas médias de tratamento, o código R na Seção 4.5 pode ser modificado alterando a fórmula do numerador e graus de liberdade do denominador e o fator de não centralidade.


4.9 Exercícios


esta informação deve ser usada na atribuição dos entrevistados aos quatro grupos? Por que ou por que não?

  1. Explique como você analisaria os dados resultantes. Qual modelo você usaria, qual é a distribuição da variável dependente, etc.?

5- Lew (2007) apresenta os dados de uma experiência para determinar se as células cultivadas respondem a dois medicamentos. O experimento foi conduzido utilizando uma linha celular estável plaqueada em placas de Petri, com cada execução experimental envolvendo ensaios de respostas em três placas de Petri: uma tratada com a droga 1, uma tratada com a droga 2 e uma não tratada servindo como controle. Os dados são mostrados na tabela abaixo:

\[ \begin{array}{c|ccc}\hline & \mbox{Controle} & \mbox{Droga 1} & \mbox{Droga 2} \\\hline \mbox{Experimento 1} & 1147 & 1169 & 1009 \\ \mbox{Experimento 2} & 1273 & 1323 & 1260 \\ \mbox{Experimento 3} & 1216 & 1276 & 1143 \\ \mbox{Experimento 4} & 1046 & 1240 & 1099 \\ \mbox{Experimento 5} & 1108 & 1432 & 1385 \\ \mbox{Experimento 6} & 1265 & 1562 & 1164 \\\hline \end{array} \]

  1. Analise os dados como se viessem de um delineamento inteiramente casualizado usando o modelo \(y_{ij} = \mu + \tau_i + \epsilon_{ij}\). Existe uma diferença significativa entre os grupos de tratamento?

  2. Analise os dados como um projeto RCB, onde o número do experimento representa um fator de bloqueio.

  3. Existe alguma diferença nos resultados obtidos em (a) e (b)? Em caso afirmativo, explique qual pode ser a causa da diferença nos resultados e qual método você recomendaria?

6- le Riche e Csima (1964) avaliaram quatro medicamentos hipnóticos e um placebo para determinar o seu efeito na qualidade do sono em pacientes idosos. Os níveis de tratamento foram rotulados: A = Placebo, B = Etclorvinol, C = Glutetimida, D = Hidrato de cloral e E = Secobarbitol sódico. Os pacientes idosos receberam uma das cápsulas durante cinco noites consecutivas e a sua qualidade de sono foi avaliada por uma enfermeira treinada numa escala de 4 pontos: 0 = fraco a 3 = excelente, todas as noites. Uma pontuação média foi calculada para cada paciente durante as cinco noites da semana. Cada paciente recebeu todos os cinco tratamentos em semanas sucessivas. Um desenho de quadrado latino foi usado para levar em conta as diferenças entre pacientes e os efeitos semanais. O planejamento e a resposta, classificação média da qualidade do sono, são mostrados na tabela abaixo.

  1. Qual é o modelo apropriado para esses dados?

  2. Complete a ANOVA e determine se há alguma diferença significativa entre os tratamentos.

  3. Utilizar um método apropriado para determinar se existe uma diferença significativa entre o placebo e a média dos outros medicamentos, e se existem diferenças significativas entre os quatro medicamentos.

  4. Use gráficos de resíduos para verificar as premissas do modelo que você ajusta.

\[ \begin{array}{cccccc} \mbox{Paciente} & \mbox{Semana 1} & \mbox{Semana 2} & \mbox{Semana 3} & \mbox{Semana 4} & \mbox{Semana 5} \\\hline 1 & \mbox{B }(2.92) & \mbox{E } (2.43) & \mbox{A } (2.19) & \mbox{C } (2.71) & \mbox{D } (2.71) \\ 2 & \mbox{D }(2.86) & \mbox{A } (1.64) & \mbox{E } (3.02) & \mbox{B } (3.03) & \mbox{C } (3.03) \\ 3 & \mbox{E }(1.97) & \mbox{B } (2.50) & \mbox{C } (2.47) & \mbox{D } (2.65) & \mbox{A } (1.89) \\ 4 & \mbox{A }(1.99) & \mbox{C } (2.39) & \mbox{D } (2.37) & \mbox{E } (2.33) & \mbox{B } (2.71) \\ 5 & \mbox{C }(2.64) & \mbox{D } (2.31) & \mbox{B } (2.44) & \mbox{A } (1.89) & \mbox{E } (2.78) \\\hline \end{array} \]

7- Woodward (1970) conduziu um experimento para determinar o caminho mais rápido para a segunda base no beisebol. Os três caminhos investigados foram o arredondamento (round out), o ângulo estreito (narrow angle) e o ângulo amplo (wide angle) mostrados na figura abaixo. O melhor caminho é definido como aquele que minimiza o tempo para chegar à segunda base.

Ele usou um cronômetro para cronometrar um corredor indo de casa (Home plate) para o segundo (Second base). Ele iniciou o relógio quando o corredor cruzou um ponto a 35 pés do home plate e parou o relógio em um ponto a 15 pés da segunda base. Isso eliminou a variabilidade nos tempos causada pela parada e partida. Finalmente, ele cronometrou uma amostra aleatória de 22 corredores diferentes, para que suas conclusões pudessem ser generalizadas para todos os corredores. Além disso, após um período de descanso apropriado, ele fez com que cada corredor seguisse cada caminho (em ordem aleatória). Dessa forma, ele poderia usar os corredores como blocos e eliminar a variabilidade do erro entre corredores. Os dados são mostrados na tabela abaixo.

\[ \begin{array}{cccc} \mbox{Corredor} & \mbox{Arrendodamento} & \mbox{Ângulo estreito} & \mbox{Ângulo amplo} \\\hline 1 & 5.40 & 5.50 & 5.55 \\ 2 & 5.85 & 5.70 & 5.75 \\ 3 & 5.20 & 5.60 & 5.50 \\ 4 & 5.55 & 5.50 & 5.40 \\ 5 & 5.90 & 5.85 & 5.70 \\ 6 & 5.45 & 5.55 & 5.60 \\ 7 & 5.40 & 5.40 & 5.35 \\ 8 & 5.45 & 5.50 & 5.35 \\ 9 & 5.25 & 5.15 & 5.00 \\ 10 & 5.85 & 5.80 & 5.70 \\ 11 & 5.25 & 5.20 & 5.10 \\ 12 & 5.65 & 5.55 & 5.45 \\ 13 & 5.60 & 5.35 & 5.45 \\ 14 & 5.05 & 5.00 & 4.95 \\ 15 & 5.50 & 5.50 & 5.40 \\ 16 & 5.45 & 5.55 & 5.50 \\ 17 & 5.55 & 5.55 & 5.35 \\ 18 & 5.45 & 5.50 & 5.55 \\ 19 & 5.50 & 5.45 & 5.25 \\ 20 & 5.65 & 5.60 & 5.40 \\ 21 & 5.70 & 5.65 & 5.55 \\ 22 & 6.30 & 6.30 & 6.25 \\\hline \end{array} \]

  1. Qual é o modelo apropriado para esses dados?

  2. Complete a ANOVA e determine se há alguma diferença significativa entre os três caminhos.

  3. Use um procedimento de comparação múltipla apropriado para determinar quais caminhos são diferentes entre si.

  4. O bloqueio foi eficaz neste experimento? Por que ou por que não?

  5. Use gráficos de resíduos para verificar as premissas do modelo que você ajusta. Se as suposições não forem válidas, o que você recomendaria fazer?

8- Considere a situação descrita no Exercício 6 do Capítulo 2 com \(t = 4\) níveis do fator de tratamento e \(\Delta= 2.0\sigma\).

  1. Se ao bloquear as unidades experimentais em blocos se acreditasse que a variância do erro experimental \(\sigma^2\), poderia ser reduzida em 50%, calcule o número de blocos que seriam necessários para ter um poder de 0.90 para detectar um a diferença máxima no tratamento significa tão grande quanto \(\Delta\).

  2. Se usando um delineamento de quadrado latino a variância do erro experimental \(\sigma^2\), puder ser reduzida em mais 10%, determine o poder para detectar diferenças de tratamento ao usar um delineamento de quadrado latino 4 x 4.