7.1 Introdução


Um dos dois propósitos dos delineamentos de blocos casualizados, descritos no Capítulo 4, era agrupar unidades experimentais heterogêneas em subgrupos homogêneos chamados blocos. Isto aumenta o poder ou a precisão para detectar diferenças nos grupos de tratamento.

O teste \(F\) geral para comparação de médias de tratamento, em um delineamento de blocos casualizados, é uma razão entre a variabilidade entre as médias de tratamento e a variabilidade das unidades experimentais dentro dos blocos homogêneos.

Uma restrição aos delineamentos em blocos casualizados é que o número de unidades experimentais no bloco deve ser maior ou igual ao número de níveis do fator de tratamento. Para o delineamento de blocos completos casualizados (RCB) o número de unidades experimentais por bloco \(t\), é igual ao número de níveis do fator de tratamento, e para o delineamento em blocos completos generalizados (GCB) o número de unidades experimentais por bloco é igual ao número de níveis do fator de tratamento vezes o número de réplicas por bloco \(tr\).

Quando o número de níveis do fator de tratamento é grande em um delineamento de blocos casualizados, o número correspondente de unidades experimentais por bloco também deve ser grande. Isso pode causar um problema. Por exemplo, frequentemente em testes de campo agrícolas de novas culturas híbridas, chamados ensaios varietais, o número de híbridos pode ser muito grande (50–100).

Como as unidades experimentais são lotes de terreno, quanto maior for o número de parcelas incluídas num bloco, mais diversificadas serão provavelmente estas parcelas, uma vez que cobrem uma área física mais ampla. Quando as unidades experimentais são animais pequenos, é possível agrupá-los em pequenos blocos de ninhadas geneticamente mais homogêneas. Porém, quando são necessários blocos maiores, animais de ninhadas diferentes serão incluídos em um bloco, tornando os grupos menos homogêneos. Menos homogeneidade dentro dos blocos resulta em maior variabilidade entre as unidades experimentais dentro de um bloco e anula um dos propósitos do uso de um delineamento em blocos casualizados.

Uma solução para o problema é construir projetos de blocos onde cada bloco contém apenas um subconjunto dos níveis possíveis do fator de tratamento. Dessa forma, o número de unidades experimentais por bloco ou o tamanho do bloco, pode ser mantido pequeno. Projetos que fazem isso são chamados de projetos de blocos incompletos.

Existem dois tipos comuns de designs de blocos incompletos. O primeiro tipo é chamado de projeto de bloco incompleto balanceado ou BIB, e o outro tipo é chamado de projeto de bloco incompleto parcialmente balanceado ou PBIB. Projetos de blocos incompletos também são úteis quando os requisitos físicos da experimentação tornam impossível testar todos os níveis do fator de tratamento dentro de cada bloco de unidades experimentais.

Projetos de blocos incompletos são comumente usados em experimentação agrícola, ciência animal, testes educacionais e ciência alimentar. Como exemplo de situação em que um projeto de bloco incompleto seria útil, considere a seguinte situação. Na ciência alimentar, os painéis de sabor são frequentemente utilizados para testar a palatabilidade de novas receitas para novos produtos alimentares. Nestes painéis, os participantes são convidados a provar e avaliar diferentes receitas.

As diferentes receitas representam os níveis do fator de tratamento. Uma amostra aleatória de sujeitos ou unidades experimentais, é incluída para representar o mercado potencial. Como existe uma grande variabilidade de gosto entre os sujeitos, é melhor usar um plano bloqueado onde cada sujeito prova e avalia cada receita. No entanto, se houverem muitas receitas a serem testadas, os sujeitos perderão a capacidade de discriminação e será difícil detectar quaisquer diferenças. Uma solução é fazer com que cada sujeito (bloco) experimente apenas um subconjunto das receitas.


7.2 Projetos de blocos incompletos balanceado (BIB)


Deve-se ter cuidado ao escolher o subconjunto de combinações de tratamento testadas em cada bloco de um peojeto de blocos incompletos. Se um nível de fator de tratamento for deixado de fora de cada bloco, ele não poderá ser comparado com os outros níveis de tratamento. Se diferentes níveis de tratamento forem representados de forma desigual, algumas comparações de níveis de fatores terão mais precisão do que outras.

A maneira ideal de criar um projeto de blocos incompletos é fazer com que cada nível de tratamento seja replicado igualmente e apareça dentro de um bloco com todos os outros níveis de tratamento um número igual de vezes. Isso é chamado de projeto de blocos incompletos balanceado ou BIB. Ao fazer isso, todas as diferenças entre pares de médias de tratamento de mínimos quadrados terão o mesmo erro padrão e o poder para detectar uma diferença em quaisquer duas médias será o mesmo.

A maneira mais simples de construir um BIB para o caso onde existem \(t\) níveis do fator de tratamento e \(k < t\) unidades experimentais por bloco é formar todos os subconjuntos possíveis de \(k\) níveis de tratamento escolhidos a partir de \(t\). Por exemplo, no painel de sabores descrito acima, se houvesse \(t = 6\) receitas a serem testadas e fosse determinado que cada sujeito poderia provar no máximo \(k = 3\) receitas sem perder o poder discriminatório, seriam necessários \(\binom{6}{3}=20\) sujeitos.

Todos os subconjuntos possíveis estão listados abaixo: \[ \begin{array}{ccccc} (1 \quad 2 \quad 3), & (1 \quad 2 \quad 4), & (1 \quad 2 \quad 5), & (1 \quad 2 \quad 6), & (1 \quad 3 \quad 4) \\ (1 \quad 3 \quad 5), & (1 \quad 3 \quad 6), & (1 \quad 4 \quad 5), & (1 \quad 4 \quad 6), & (1 \quad 5 \quad 6) \\ (2 \quad 3 \quad 4), & (2 \quad 3 \quad 5), & (2 \quad 3 \quad 6), & (2 \quad 4 \quad 5), & (2 \quad 4 \quad 6) \\ (2 \quad 5 \quad 6), & (3 \quad 4 \quad 5), & (3 \quad 4 \quad 6), & (3 \quad 5 \quad 6), & (4 \quad 5 \quad 6) \end{array} \]

Assim, o sujeito um provaria as receitas 1, 2 e 3 em ordem aleatória; o sujeito 2 provaria as receitas 1, 2 e 4 e assim por diante. Este plano é completamente equilibrado, pois cada nível de tratamento ou receita é replicado \(r = 10\) vezes ou provado por 10 sujeitos e cada par de níveis de tratamento ocorre juntos no mesmo bloco \(\lambda = 4\) vezes. Por exemplo, os níveis de tratamento 1 e 2 ocorrem juntos apenas nos primeiros quatro blocos da primeira linha acima. Pela inspeção, pode-se observar que todos os pares de níveis de tratamento ocorrem juntos em apenas quatro blocos.

Embora tomar todos os subconjuntos possíveis de tamanho \(k\) escolhidos em \(t\) seja a maneira mais simples de formar um projeto de blocos incompletos balanceado, pode haver outros projetos de blocos incompletos balanceados que exijam menos blocos. Se a precisão do projeto não exigir tantos \(\binom{b}{k}\) blocos, não haveria necessidade de usar tantos.

Por exemplo, se uma diferença prática de tamanho nas receitas pudesse ser detectada com menos de 20 sujeitos e 10 réplicas de cada nível de tratamento, no painel de teste de sabor, talvez um desenho BIB pudesse ser encontrado com menos de 20 blocos. Se \(r\) é o número de vezes que um nível de tratamento é replicado em um projeto de blocos incompletos, \(\lambda\) é o número de vezes que cada nível de tratamento ocorre com todos os outros níveis de tratamento no mesmo bloco, \(t\) é o número de níveis do fator de tratamento, \(k\) é o número de unidades experimentais em um bloco e \(b\) é o número de blocos, então os seguintes requisitos devem ser atendidos para que esse projeto seja um projeto BIB.

\[\begin{equation*} \tag{7.1} b\geq t, \end{equation*}\]

\[\begin{equation*} \tag{7.2} tr = bk, \end{equation*}\]

\[\begin{equation*} \tag{7.3} \lambda (t-1)=r (k-1)\cdot \end{equation*}\]

Estas relações podem ser usadas para encontrar o número mínimo de blocos necessários para um projeto BIB. Como \(r\) e \(\lambda\) devem ser inteiros, pela Equação (7.3) vemos que \(\lambda (t-1)\) deve ser divisível por \(k-1\). Se \(t = 6\) e \(k = 3\), como no painel de teste de sabor, \(5\lambda\) deve ser divisível por 2. O menor número inteiro \(\lambda\) para o qual isso é satisfeito é \(\lambda = 2\).

Portanto, pode ser possível encontrar um BIB com \(\lambda = 2\), \(r\) = 10/2 = 5 e \(b\) = \((6\times 5)/3\) = 10. A função BIBsize no pacote R daewr fornece uma maneira rápida de encontrar valores de \(\lambda\) e \(r\) para satisfazer as Equações (7.1) a (7.3) quando dado o número de níveis do fator de tratamento \(t\) e o tamanho do bloco \(k\). Por exemplo, no código abaixo a função é chamada com \(t = 6\) e \(k = 3\).

library(daewr)
BIBsize(6, 3)
## Posible BIB design with b= 10  and r= 5  lambda= 2


R.A. Fisher (1940) mostrou que embora as Equações (7.1) – (7.3) sejam satisfeitas para alguma combinação de \(t\), \(b\), \(r\), \(\lambda\) e \(k\), um BIB correspondente pode não existir.

Se existir um BIB, Kiefer (1958) e Kshirsager (1958) mostraram que é D-ótimo, portanto pode ser encontrado usando o pacote R AlgDesign que foi descrito na Seção 6.5.2. A função optBlock nesse pacote pode encontrar projetos BIB.

Por exemplo, o código abaixo procura um BIB com \(b = 10\) blocos de \(k = 3\) unidades experimentais por bloco e \(t = 6\) níveis do fator de tratamento. A opção blocksizes = rep(3,10) especifica 10 blocos de tamanho 3 e a opção withinData = factor(1:6) especifica seis níveis de um fator.

library(AlgDesign)
BIB = optBlock( ~ ., withinData = factor(1:6), blocksizes = rep(3, 10))


O objeto BIB criado por optBlock contém um conjunto de dados BIB$design com uma coluna que contém uma lista de níveis de fator de tratamento para cada um dos 10 blocos em ordem.

Criar o plano novamente com a função optBlock pode resultar em um BIB diferente, mas equivalente.

des = BIB$rows
dim(des) = NULL
des = matrix(des, nrow = 10, ncol = 3, byrow = TRUE, 
             dimnames = list(c( "Block1", "Block2", "Block3", "Block4", 
                                "Block5", "Block6", "Block7", "Block8", "Block9",
                                "Block10"), c("unit1", "unit2", "unit3")))
des
##         unit1 unit2 unit3
## Block1      1     2     5
## Block2      2     3     4
## Block3      2     3     5
## Block4      3     5     6
## Block5      2     4     6
## Block6      1     3     6
## Block7      1     3     4
## Block8      4     5     6
## Block9      1     4     5
## Block10     1     2     6


De acordo com esse plano, as três unidades experimentais do primeiro bloco receberiam os níveis de tratamento 4, 5 e 6, as unidades experimentais do segundo bloco receberiam os níveis de tratamento 2, 3 e 5, e assim por diante.

Por inspeção, pode-se observar que cada nível do fator de tratamento é repetido \(r = 5\) vezes neste projeto, e que cada nível de tratamento ocorre dentro do mesmo bloco com todos os outros níveis de tratamento \(\lambda = 2\) vezes.

Assim, temos certeza de que este é um projeto de bloco incompleto balanceado. Uma vez encontrado um projeto BIB, os níveis do fator de tratamento dentro de cada bloco devem ser randomizados para as unidades experimentais dentro desse bloco, conforme ilustrado para o projeto RCB na Seção 4.2.


7.3 Análise de projetos de blocos incompletos


O modelo para um projeto de bloco incompleto é \[\begin{equation*} \tag{7.4} y_{ij} = \mu + b_i + \tau_j +\epsilon_{ij}, \end{equation*}\] que é idêntico ao modelo para um desenho de blocos completos aleatórios apresentado na Seção 4.3. No entanto, a análise é ligeiramente diferente devido às observações faltantes.


7.3.1 Um exemplo


Considere os dados de um experimento de painel de sabores relatado por Moskowitz (1988), mostrado na Tabela 7.1. Este experimento é um BIB com \(t=4\) níveis do fator de tratamento ou receita e tamanho de bloco \(k=2\). Assim, cada membro do painel prova apenas duas das quatro receitas em ordem aleatória e atribui uma pontuação na escala de categorias.

As escalas de categorias são comumente usadas para avaliar gostos ou desgostos alimentares e consistem em números de 1 a 10 que representam categorias descritivas. Apenas \(\binom{4}{2} = 6\) blocos ou painelistas são necessários para um BIB, mas neste experimento esse número foi duplicado para aumentar o poder de detecção de diferenças.

Assim, os primeiros seis painelistas e os últimos seis são uma repetição do mesmo design BIB. Os participantes do painel de provadores foram atribuídos aleatoriamente aos números dos provadores e a ordem das duas receitas degustadas por cada provador foi aleatória.

\[ \begin{array}{c} \quad \qquad \quad \qquad \mbox{Receitas} \end{array} \\ \begin{array}{ccccc} \mbox{Painelista} \\ & \mbox{A} & \mbox{B} & \mbox{C} & \mbox{D} \\\hline 1 & 5 & 5 & - & - \\ 2 & 7 & - & 6 & - \\ 3 & 5 & - & - & 4 \\ 4 & - & 6 & 7 & - \\ 5 & - & 6 & - & 4 \\ 6 & - & - & 8 & 6 \\ 7 & 6 & 7 & - & - \\ 8 & 5 & - & 8 & - \\ 9 & 4 & - & - & 5 \\ 10 & - & 7 & 7 & - \\ 11 & - & 6 & - & 5 \\ 12 & - & - & 7 & 4 \\\hline \end{array} \] Tabela 7.1: Dados do teste de sabor BIB

Ao analisar os dados de um delineamento de blocos incompletos, as médias marginais do tratamento não são estimadores não viciados dos efeitos estimáveis \(\mu+\tau_i\). Por exemplo, na Tabela 7.1, a média marginal da receita A pode ter um viés baixo pelo fato de não ter sido provada pelos membros do painel 4, 5, 6, 10, 11 e 12, que parecem avaliar as receitas mais elevadas.

Da mesma forma, o fator de não centralidade para as somas de quadrados sequenciais para tratamentos ou receitas pode conter efeitos de bloco, bem como efeitos de tratamento. A solução para esses problemas é a mesma mostrada na Seção 3.5.3 para análise de dados de experimentos fatoriais com número desigual de réplicas por célula.

As médias dos mínimos quadrados são usadas em vez das médias marginais e o tipo III ou somas de quadrados ajustadas para tratamentos devem ser usados. A função Anova no pacote car pode ser usada para obter o tipo III ou somas de quadrados ajustadas para receitas, conforme mostrado na Seção 3.5.3 ou a função lm pode ser usada com o termo da receita ordenado por último no modelo, conforme mostrado no código abaixo.

Não produziremos o tipo III ou somas de quadrados ajustadas para blocos ou painelistas, mas como as diferenças nos painelistas não são de interesse, elas não são necessárias.

library(daewr)
mod1 = aov( score ~ panelist + recipe, data = taste)
summary(mod1)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## panelist    11 19.333  1.7576   2.301 0.1106  
## recipe       3  9.125  3.0417   3.982 0.0465 *
## Residuals    9  6.875  0.7639                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


O valor \(F_{3,9}\) para testar receitas foi 3.982, o que é significativo ao nível de significância \(\alpha = 0.05\). As médias ajustadas ou de mínimos quadrados podem ser calculadas usando o comando predict e a função tapply conforme mostrado na Seção 3.5.3, mas isso pode ser feito com menos codificação usando o pacote lsmeans.

O código abaixo usando lsmeans calcula as médias ajustadas, seus erros padrão e intervalos de confiança, e faz comparações de Tukey de todos os pares de médias.

library(lsmeans)
lsmeans(mod1, pairwise ~ recipe, adjust = ("tukey"))
## $lsmeans
##  recipe lsmean    SE df lower.CL upper.CL
##  A        5.46 0.418  9     4.51     6.40
##  B        6.21 0.418  9     5.26     7.15
##  C        6.83 0.418  9     5.89     7.78
##  D        4.83 0.418  9     3.89     5.78
## 
## Results are averaged over the levels of: panelist 
## Confidence level used: 0.95 
## 
## $contrasts
##  contrast estimate    SE df t.ratio p.value
##  A - B      -0.750 0.618  9  -1.214  0.6342
##  A - C      -1.375 0.618  9  -2.225  0.1882
##  A - D       0.625 0.618  9   1.011  0.7472
##  B - C      -0.625 0.618  9  -1.011  0.7472
##  B - D       1.375 0.618  9   2.225  0.1882
##  C - D       2.000 0.618  9   3.236  0.0421
## 
## Results are averaged over the levels of: panelist 
## P value adjustment: tukey method for comparing a family of 4 estimates


Os resultados mostram que a pontuação média da receita C é significativamente maior do que a pontuação da receita D no nível \(\alpha = 0.05\), mas nenhuma outra diferença é significativa no nível \(\alpha = 0.05\).

Outra coisa que deve ser observada na saída é o fato de que o erro padrão das diferenças de médias é o mesmo para todos os pares de médias. Isto é resultado do fato de ter sido utilizado um design BIB.


7.3.2 Determinando o número de réplicas


Uma estimativa aproximada do número de réplicas de cada nível de tratamento \(r = bk/t\), necessárias para a potência adequada de detecção ou o número de blocos \(b = tr/k\) uma diferença prática nas médias de tratamento em um projeto BIB pode ser determinada usando a seguinte estratégia.

Se uma estimativa de \(\sigma^2\), a variância de unidades experimentais heterogêneas e \(\Delta\), o tamanho de uma diferença prática em duas médias de tratamento estiver disponível, então use o método da Seção 3.5.2 para determinar o número de repetições, \(r_{crd}\), necessárias para um planejamento completamente casualizado.

Se se espera que o bloqueio das unidades experimentais heterogêneas em pequenos blocos de tamanho \(k\) reduza a variância das unidades experimentais dentro dos blocos em uma porcentagem igual a \(100\times (1-1/RE)\), então, seguindo a Seção 4.5, o número de réplicas necessárias para o planejamento bloqueado seria \(r = r_{crd}/RE\) e o número de blocos de tamanho \(k\) em um bloco incompleto seria \(b = tr/k\).


7.4 Projetos BTIB e PBIB


Às vezes, um projeto BIB requer mais blocos ou unidades experimentais do que os disponíveis ou necessários para obter potência adequada para detectar diferenças práticas nas médias de tratamento. Nesta situação, o número de blocos e unidades experimentais pode ser reduzido relaxando os requisitos de que:

  1. cada nível de tratamento seja igualmente replicado e

  2. que apareça dentro de um bloco com todos os outros níveis de tratamento o mesmo número de vezes.

Ao relaxar esses requisitos, cada nível de tratamento ocorrerá com mais frequência em um bloco com alguns níveis de tratamento do que com outros níveis de tratamento. Portanto, algumas comparações pareadas de médias de tratamento terão erros padrão menores do que outras.

Em outras situações, um projeto BIB não pode ser usado porque as restrições físicas da experimentação impedem que alguns níveis de tratamento sejam testados juntos no mesmo bloco. Por exemplo, foi realizada uma experiência para comparar a leitura de um monitor portátil de pressão arterial para uso doméstico com outros monitores automáticos de pressão arterial em farmácias de supermercado, a fim de determinar se as leituras do monitor portátil apresentavam um viés alto.

A unidade experimental foi a pressão nas veias de um sujeito no momento em que foi medida, e os níveis dos fatores de tratamento foram os monitores utilizados para fazer a medição.

Sabe-se que a pressão arterial varia amplamente de pessoa para pessoa e dentro de uma pessoa em diferentes momentos do dia. A pressão arterial é mais consistente em uma pessoa em um curto período de tempo. Portanto as unidades experimentais foram agrupadas em grupos homogêneos por assunto e tempo.

O monitor portátil de pressão arterial poderia ser transportado para uma loja e a pressão arterial de um sujeito poderia ser verificada dentro de um curto período de tempo tanto pelo monitor automático dentro da loja quanto pelo monitor portátil. Porém, os monitores de duas lojas não podiam ser comparados dentro de um bloco ou em um curto período de tempo, porque as lojas estavam fisicamente separadas.

Dirigir entre lojas poderia alterar completamente a pressão arterial de um sujeito, por isso foi utilizado o desenho de blocos incompletos mostrado na Tabela 7.2. A resposta, pressão arterial diastólica, é mostrada na tabela.

\[ \begin{array}{c|cccc}\hline & \begin{array}{c} \mbox{Tratamentos} \end{array} \\ & \mbox{Monitor} & \mbox{Monitor} & \mbox{Monitor} & \mbox{Monitor} \\ \mbox{Blocos} & \mbox{portátil} & \mbox{loja A} & \mbox{loja B} & \mbox{loja C} \\\hline 1 = (\mbox{sujeito 1, tempo 1}) & 85 & 77 & - & - \\ 2 = (\mbox{sujeito 2, tempo 1}) & 80 & 75 & - & - \\ 3 = (\mbox{sujeito 1, tempo 2}) & 89 & - & 73 & - \\ 4 = (\mbox{sujeito 2, tempo 2}) & 80 & - & 70 & - \\ 5 = (\mbox{sujeito 1, tempo 3}) & 78 & - & - & 76 \\ 6 = (\mbox{sujeito 2, tempo 3}) & 80 & - & - & 70 \\\hline \end{array} \] Tabela 7.2: Projeto de blocos incompletos com monitores de pressão arterial.

Aqui pode ser visto que o nível de tratamento 1 (monitor portátil) aparece num bloco com todos os outros níveis de tratamento, mas os outros níveis de tratamento nunca aparecem juntos num bloco. O código para analisar os dados usando a função R aov e a função lsmeans é mostrado abaixo.

library(daewr)
modm = aov( pressure ~ Block + Treatment, data = BPmonitor)
library(lsmeans)
lsmeans(modm,pairwise~Treatment,adjust=("tukey"))
## $lsmeans
##  Treatment lsmean   SE df lower.CL upper.CL
##  A           75.5 2.75  3     66.7     84.3
##  B           69.0 2.75  3     60.2     77.8
##  C           76.0 2.75  3     67.2     84.8
##  P           82.0 1.23  3     78.1     85.9
## 
## Results are averaged over the levels of: Block 
## Confidence level used: 0.95 
## 
## $contrasts
##  contrast estimate   SE df t.ratio p.value
##  A - B         6.5 4.26  3   1.525  0.5212
##  A - C        -0.5 4.26  3  -0.117  0.9993
##  A - P        -6.5 3.01  3  -2.157  0.3110
##  B - C        -7.0 4.26  3  -1.642  0.4744
##  B - P       -13.0 3.01  3  -4.313  0.0670
##  C - P        -6.0 3.01  3  -1.991  0.3564
## 
## Results are averaged over the levels of: Block 
## P value adjustment: tukey method for comparing a family of 4 estimates


Na tabela resultante de comparações de médias, mostrada acima, pode-se observar que os erros padrão das diferenças entre a média do monitor portátil (P) e as médias dos demais monitores (A, B e C) são menores que os erros padrão das comparações entre A e B, A e C e B e C.

O projeto para o experimento do monitor de pressão arterial é um caso especial de um projeto de blocos incompletos que Bechhofer and Tamhane (1981) chamaram de BTIB, equilibrado em relação aos tratamentos de teste. Nestes projetos, um nível de tratamento é designado como nível de controle e há mais interesse em comparar cada um dos outros níveis de tratamento com o controle do que em comparar os outros níveis de tratamento.

Em um projeto BTIB, cada tratamento deve aparecer o mesmo número de vezes \(\lambda_0\) em um bloco com o tratamento de controle e cada tratamento de teste deve ocorrer o mesmo número de vezes \(\lambda_1\) em um bloco com todos os outros tratamentos de teste. Isto resulta em um projeto que é mais eficiente na comparação de cada tratamento com o controle, mas menos eficiente nas comparações entre os outros níveis de tratamento. Uma maneira de formar um projeto BTIB com \(t\) níveis do fator de tratamento e tamanho de bloco \(k\) é combinar um nível de controle para cada bloco de um projeto BIB com \(t-1\) níveis do fator de tratamento e tamanho de bloco \(k-1\).

O projeto BTIB, descrito no último parágrafo, é um caso especial de projeto de blocos incompletos parcialmente balanceado ou PBIB com duas classes associadas. Nestes projetos, cada par de tratamentos são primeiros associados ou segundos associados.

As primeiras associadas ocorrem juntas em um bloco \(\lambda_1\) vezes, e as segundas associadas ocorrem juntas em um bloco \(\lambda_2\) vezes, onde \(\lambda_1 > \lambda_2\). O erro padrão da diferença nas médias de tratamento para as primeiras associadas é menor que o erro padrão da diferença nas médias para as segundas associadas.

Existem várias maneiras de criar designs PBIB. Bose et al. (1954) publicaram tabelas de alguns dos planos mais úteis. Jarrett and Hall (1978) descreveram uma classe de projetos PBIB chamados projetos de blocos incompletos cíclicos generalizados, que possuem boas propriedades estatísticas e são fáceis de criar.

Projetos de blocos incompletos cíclicos generalizados com blocos de tamanho \(k\) e \(b = t\) podem ser criados seguindo as etapas listadas abaixo.

Para formar um projeto cíclico generalizado com \(b = t\),

  1. Comece com um subconjunto de \(k\) níveis de fator de tratamento como bloco inicial.

  2. Adicione 1, módulo \(t\), a cada nível de tratamento no bloco inicial para formar o próximo bloco.

  3. Continue adicionando blocos até obter \(t\) blocos.

Para ilustrar isso, considere a criação de um projeto de blocos incompletos com \(t = 6\) e \(k = 3\). O projeto BIB com o menor número de blocos para esta combinação é encontrado resolvendo as Equações (7.1) a (7.3) como \(b = 10\).

Um projeto de bloco incompleto cíclico generalizado para testar \(t = 6\) níveis do fator de tratamento pode ser encontrado com \(b = t = 6\) blocos. Para encontrar um experimento com seis blocos, seguindo os passos acima, comece com um subconjunto de \(k = 3\) níveis do fator de tratamento a ser testado no bloco inicial, ou seja, \[ (1 \quad 2 \quad 4)\cdot \]

Em seguida, adicione um a cada nível de tratamento para obter os níveis de tratamento no próximo bloco, ou seja, \[ (2 \quad 3 \quad 5)\cdot \]

Continue este módulo 6, ou seja, 7 módulo 6 = 1, etc. para formar o seguinte. \[ \begin{array}{ccc} & \mbox{Bloco} & \mbox{Tratamentos} \\ \hline \end{array} \\ \begin{array}{ccccc} 1 & & 1 & 2 & 4 \\ 2 & & 2 & 3 & 5 \\ 3 & & 3 & 4 & 6 \\ 4 & & 4 & 5 & 1 \\ 5 & & 5 & 6 & 2 \\ 6 & & 6 & 1 & 3 \\ \end{array} \]

Os níveis de tratamento em cada bloco seriam randomizados para as três unidades experimentais em cada bloco. A função design.cyclic no pacote R agricolae pode criar projetos cíclicos generalizados com \(t\) blocos de tamanho \(k\). Por exemplo, o código abaixo mostra os comandos para criar um projeto cíclico generalizado com \(t = 6\), \(k = 3\).

O primeiro argumento para design.cyclic é um vetor contendo os níveis do fator de tratamento. O segundo argumento é o tamanho do bloco \(k\), e o terceiro argumento é o número de réplicas \(r\), de cada nível de tratamento. Neste caso como são seis blocos de três unidades experimentais há um total de 18 unidades experimentais e cada nível de tratamento será atribuído a três, perfazendo \(r = 3\).

library(agricolae)
treat = c(1, 2, 3, 4, 5, 6)
des = design.cyclic(treat, k = 3, r = 3)
## 
## cyclic design
## Generator block basic:
## 1 2 4 
## 
## Parameters
## ===================
## treatmeans : 6
## Block size : 3
## Replication: 3


A função design.cyclic gera e randomiza o plano. Neste exemplo de projeto PBIB, cada nível de tratamento tem um primeiro associado com \(\lambda_1 = 2\) e quatro segundos associados com \(\lambda_2 = 1\).

O objeto criado por design.cyclic possui dois componentes. O componente <strongdes$book contém o design mostrado abaixo.

des$book
##    plots group block treat
## 1    101     1     1     2
## 2    102     1     1     6
## 3    103     1     1     5
## 4    104     1     2     6
## 5    105     1     2     1
## 6    106     1     2     3
## 7    107     1     3     5
## 8    108     1     3     3
## 9    109     1     3     2
## 10   110     1     4     4
## 11   111     1     4     5
## 12   112     1     4     1
## 13   113     1     5     4
## 14   114     1     5     3
## 15   115     1     5     6
## 16   116     1     6     4
## 17   117     1     6     1
## 18   118     1     6     2


A análise dos projetos PBIB é igual aos exemplos mostrados para projetos BIB. Devem ser utilizadas as somas dos quadrados do tipo III para tratamento e os mínimos quadrados médios. O modelo e as suposições são os mesmos do projeto RCB, e as suposições de normalidade e homogeneidade da variância do erro experimental podem ser verificadas com os gráficos de resíduos descritos na Seção 2.4.


7.5 Projetos de coluna e linha


Projetos de quadrados latinos com dois fatores de bloqueio independentes foram descritos no Capítulo 4. Esses projetos poderiam aumentar a precisão na detecção de diferenças entre tratamentos, ajustando a variabilidade em unidades experimentais de duas maneiras.

No entanto, a restrição aos projetos de quadrado latino era que o número de níveis do fator de bloqueio de linha, o número de níveis do fator de bloqueio de coluna e o número de níveis do fator de tratamento tinham que ser todos iguais. Esta restrição pode ser impraticável em algumas situações.

No Capítulo 4 foi descrito um experimento cujo objetivo era estudar o efeito do revestimento das prateleiras nas vendas de creme dental em drogarias. Nesse exemplo, foram utilizados quatro níveis do fator de tratamento: revestimentos de prateleiras, quatro níveis do fator de bloqueio de linhas, ou seja, as lojas e quatro níveis do fator de bloqueio de colunas, isto é, semanas de vendas.

Se os investigadores desejassem expandir o seu estudo para testar oito revestimentos de prateleiras diferentes em vez de quatro, poderiam facilmente aumentar o número de níveis do factor de bloqueio de filas e incluir oito lojas. No entanto, aumentar o número de semanas prolongaria o estudo e poderia ser indesejável.

Um projeto alternativo denominado projeto de coluna e linha ou RCD utiliza um projeto de bloco completo nos blocos de coluna, mas um projeto de bloco incompleto nos blocos de linha. Este de tipo de projeto também pode ser criado e randomizado pela função design.cycle no pacote R agricolae.

O código abaixo ilustra como isso pode ser feito. A adição do argumento rowcol = TRUE faz com que design.cyclic crie um plano de coluna e linha ou RCD. Como existem oito níveis do fator de tratamento e tamanho de bloco de coluna \(k = 4\), haverá \(r = 4\) réplicas de cada nível de tratamento no experimento. O argumento seed = 1 fixa a semente aleatória para que o mesmo plano possa ser produzido em execuções repetidas.

library(agricolae)
treat = c(1, 2, 3, 4, 5, 6, 7, 8)
RCD = design.cyclic(treat, k = 4, r = 4, rowcol = TRUE, seed = 1)
## 
## cyclic design
## Generator block basic:
## 1 2 4 8 
## 
## Parameters
## ===================
## treatmeans : 8
## Block size : 4
## Replication: 4
knitr::kable(head(RCD$book))
plots group block treat
101 1 1 5
102 1 1 6
103 1 1 8
104 1 1 4
105 1 2 6
106 1 2 7


Este código criará um design com oito blocos de linhas para lojas e quatro blocos de colunas para semanas. O modelo e a análise dos RCDs são idênticos ao modelo e à análise dos experimentos de quadrados latinos descritos no Capítulo 4, com a exceção de que as somas dos quadrados do tratamento do tipo III e as médias do tratamento dos mínimos quadrados devem ser usadas devido ao fato de que os blocos de linhas são incompletos e não contêm todos os níveis do fator de tratamento.


7.6 Projetos \(2^k\) e \(2^{k-p}\) confusos


Quando as unidades experimentais são heterogêneas e podem ser agrupadas em blocos, frequentemente há poucas unidades experimentais por bloco para acomodar todas as combinações de tratamento em planejamento fatorial \(2^k\) ou fatorial fracionário \(2^{k-p}\).

Portanto, é impossível utilizar projetos de blocos completos, como aqueles descritos na Seção 4.5. Uma solução é usar um projeto de blocos incompletos descrito na primeira parte deste capítulo com \(t = 2^k\). No entanto, isso geralmente resulta em muito mais bloqueios do que o necessário. O princípio da dispersão de efeitos e o princípio da ordenação hierárquica nos dizem que é improvável que todas as interações, especialmente aquelas acima da ordem 3, sejam importantes. Se estivermos dispostos a sacrificar a capacidade de estimar algumas interações, experimentos fatoriais \(2^k\) podem ser bloqueados em um número mínimo de blocos, desde que o número de unidades experimentais em cada bloco seja uma potência de 2.

Por exemplo, um planejamento fatorial \(2^3\) tem oito combinações de tratamento. Ao confundir a interação de três fatores com blocos, este projeto pode ser executado em dois blocos de tamanho 4, conforme mostrado na Tabela 7.3 abaixo. Neste projeto, o efeito da interação ABC é completamente confundido entre os dois blocos e não pode ser estimado. No entanto, uma vez que as interações entre os efeitos do bloqueio e do tratamento são consideradas não significativos, todos os outros efeitos principais e as interações de dois fatores não são confundidos.

\[ \begin{array}{ccccc}\hline & & & \begin{array}{c} \qquad \qquad \qquad \mbox{Bloco = ABC} \end{array} \\ \mbox{A} & \mbox{B} & \mbox{C} & & \\\hline - & - & - & 1 & - \\ + & - & + & 1 & - \\ - & + & + & 1 & - \\ + & + & - & 1 & - \\ - & - & + & 2 & + \\ + & - & - & 2 & + \\ - & + & - & 2 & + \\ + & + & + & 2 & + \\\hline \end{array} \] Tabela 7.3: \(2^3\) em dois blocos de tamanho 4.

A detecção dos efeitos significativos de um experimento como este pode ser feita usando os métodos gráficos ilustrados na Seção 3.7.5 e no Capítulo 6.


7.6.1 Confundindo projetos \(2^k\)


Em geral, um fatorial \(2^k\) pode ser executado em blocos de tamanho \(2^q\) escolhendo \(k-q\) contrastes de interação para confundir com blocos. Essas interações são chamadas de contrastes que definem blocos. Quando um \(2^k\) é executado em blocos de tamanho \(2^q\), haverá \(2^k/2^q = 2^{k-q}\) blocos.

Portanto, haverá \(2^{k-q-1}\) graus de liberdade para os blocos. Esses \(2^{k-q-1}\) graus de liberdade são explicados pelos contrastes de blocos que definem \(k-q\) e todas as suas interações generalizadas.

Como exemplo, considere confundir um fatorial \(2^4\) em blocos de tamanho \(4=2^2\). Como \(k = 4\) e \(q = 2\), \(k-q = 2\) que definem contrastes de blocos devem ser escolhidos. Se as interações de três fatores ABD e BCD forem escolhidas como contrastes definidores de bloco, sua interação generalizada ABD(BCD) = AC também será confundida com blocos, contabilizando os 3 graus de liberdade para blocos.

A função FrF2 no pacote R FrF2 pode encontrar este plano experimental conforme mostrado no código abaixo.

library(FrF2)
Bdish = FrF2( 16, 4, blocks = c("ABD", "BCD"), alias.block.2fis = TRUE, randomize = FALSE)
knitr::kable(Bdish)
Blocks A B C D
1 -1 -1 -1 -1
1 -1 1 -1 1
1 1 -1 1 1
1 1 1 1 -1
2 -1 -1 1 -1
2 -1 1 1 1
2 1 -1 -1 1
2 1 1 -1 -1
3 -1 -1 1 1
3 -1 1 1 -1
3 1 -1 -1 -1
3 1 1 -1 1
4 -1 -1 -1 1
4 -1 1 -1 -1
4 1 -1 1 -1
4 1 1 1 1


O experimento mostrado acima é chamado de fatorial bloqueado completamente confundido ou CCBF. Na prática, as combinações de tratamento dentro de cada bloco seriam randomizadas para unidades experimentais naquele bloco, removendo a opção randomize = FALSE.

A análise de um fatorial bloqueado confuso é semelhante à análise de um experimento \(2^k\) não replicado, conforme descrito na Seção 3.7.5. Como exemplo, considere o experimento conduzido por Apple (2006). Ele estava interessado nos efeitos dos quatro fatores mostrados na Tabela 7.4 sobre a lavagem da louça.

\[ \begin{array}{lcc} \hline \mbox{Fator} & \mbox{Nível (-)} & \mbox{Nível (+)} \\\hline \mbox{A - Temperatura da água} & \mbox{60 graus F} & \mbox{115 graus F} \\ \mbox{B - Quantidade de sabão} & \mbox{1 colher de sopa} & \mbox{2 colheres de sopa} \\ \mbox{C - Tempo de imersão} & \mbox{3 minutos} & \mbox{5 minutos} \\ \mbox{D - Marca de detergente} & \mbox{WF} & \mbox{UP} \\\hline \end{array} \] Tabela 7.4: Fatores para experiência de lavagem de louça.

Seu experimento consistiu em mergulhar pratos com molho de espaguete assado, feito no micro-ondas, em água de lavar louça que consistia em todas as combinações possíveis dos níveis de fator mostrados acima.

Ele desenhou uma grade \(10\times 10\) em um prato branco com um marcador permanente e sua resposta foi o número de quadrados limpos da grade depois de molhar o prato com molho de espaguete assado na máquina de lavar louça. A unidade experimental foi o molho de espaguete assado e, para generalizar suas conclusões, incluiu quatro blocos que consistiam em combinações de duas marcas diferentes de molho de espaguete e dois tempos de cozimento diferentes no microondas, conforme mostrado na Tabela 7.5 abaixo.

\[ \begin{array}{ccc}\hline \mbox{Bloquo} & \mbox{Tipo de molho} & \mbox{Tempo de microondas} \\\hline 1 & \mbox{Marca de loja} & \mbox{1 minuto} \\ 2 & \mbox{Marca premium} & \mbox{1 minuto} \\ 3 & \mbox{Marca de loja} & \mbox{1:30 minutos} \\ 4 & \mbox{Marca premium} & \mbox{1:30 minutos} \\\hline \end{array} \] Tabela 7.5: Blocos para experiência de lavagem de louça.

Neste experimento, teria sido possível executar um planejamento fatorial de blocos completo onde todas as combinações dos níveis dos fatores de tratamento da Tabela 7.4 foram incluídas em cada bloco.

Isso levaria um total de \(4\times 16 = 64\) experimentos. Porém, considerando o princípio da ordenação hierárquica, algumas interações foram confundidas a fim de reduzir o número total de experimentos. Utilizando o mesmo desenho mostrado anteriormente, ABD e BCD e sua interação generalizada ABD(BCD) = AC foram confundidos com blocos, resultando em 16 experimentos ou placas agrupadas em 4 blocos com 4 unidades experimentais em cada bloco.

O planejamento e a resposta, o número de quadrados limpos da grade, são mostrados na Tabela 7.6 mais adiante. Para a análise dos dados foi ajustado o modelo fatorial que incluiu todos os principais efeitos e interações. O código R para fazer isso usando a função lm é mostrado abaixo.

y <- c(0, 0, 12, 14, 1, 0, 1, 11, 10, 2, 33, 24, 3, 5, 41, 70)
Bdish = add.response(Bdish, response = y)
dish = lm( y ~ Blocks + A * B * C * D, data = Bdish)


Como ABD, BCD e AC foram confundidos com blocos, a função lm atribui o valor de NA para seus efeitos. Como não houve réplicas no experimento, um gráfico meio normal dos efeitos foi usado para determinar os efeitos e interações significativos.

O código abaixo produz o gráfico meio normal. A segunda e terceira afirmações selecionam os efeitos não-bloco que não possuem o valor de NA e a última afirmação adiciona uma linha de referência ao gráfico.

effects = coef(dish)
effects = effects[5:19]
effects = effects[ !is.na(effects) ]
library(daewr)
par(mar=c(4,4,1,1))
halfnorm(effects, names(effects), alpha=.25)
## zscore= 0.05224518 0.1573107 0.264147 0.3740954 0.4887764 0.6102946 0.741594 0.8871466 1.054472 1.258162 1.534121 2.036834effp= 0.1875 0.8125 1.1875 1.5625 2.3125 2.4375 2.5625 2.6875 3.4375 4.5625 6.9375 11.5625
grid()

Figura 7.1: Gráfico seminormal de coeficientes de regressão absoluta do experimento de lavagem de louça.

\[ \begin{array}{ccccc}\hline \mbox{A} & \mbox{B} & \mbox{C} & \mbox{D} & \mbox{Bloco} & y \\\hline - & - & - & - & 1 & 0 \\ + & + & + & - & 1 & 14 \\ - & + & - & + & 1 & 0 \\ + & - & + & + & 1 & 12 \\ + & - & - & - & 2 & 33 \\ - & + & + & - & 2 & 2 \\ + & + & - & + & 2 & 24 \\ - & - & + & + & 2 & 10 \\ + & + & - & - & 3 & 11 \\ - & - & + & - & 3 & 1 \\ + & - & - & + & 3 & 1 \\ - & + & + & + & 3 & 0 \\ - & + & - & - & 4 & 5 \\ + & - & + & - & 4 & 41 \\ - & - & - & + & 4 & 3 \\ + & + & + & + & 4 & 70 \\ \end{array} \] Tabela 7.6: Projeto e dados para experimento de lavagem de louça.

Na Figura 7.1 pode-se observar que o efeito principal A, a temperatura da água e possivelmente a interação BD entre a quantidade de sabão e a marca do sabão parecem ser significativos. O efeito principal da temperatura da água foi fácil de interpretar.

As médias para este fator revelaram que 23.125 quadrados a mais da grade foram limpos com água quente 115º F do que com água fria 60º F. Para interpretar a interação BD é necessário um gráfico de interação ou tabela de médias. A Figura 7.2 mostra o gráfico de interação. Aqui pode ser visto que aumentar a quantidade de sabonete da marca WF de 1 colher de sopa para 2 colheres de sopa na verdade diminui o número de quadrados de grade limpos no prato que está sendo embebido, enquanto aumentar a quantidade de sabonete da marca UP de 1 colher de sopa para 2 colheres de sopa tem o oposto efeito e aumenta o número de quadrados de grade limpos.

x=- as.numeric(Bdish$B)
x[x==1] = "1 tbs"
x[x=="2"] = "2 tbs"
Brand = as.numeric(Bdish$D)
Brand[Brand==1] = "WF"
Brand[Brand=="2"] = "UP"
par(mar=c(4,4,1,1))
interaction.plot(x, Brand, Bdish$y, type="l" ,xlab="Soap Amount B",ylab="Average Clean Squares")
grid()

Figura 7.2: Gráfico de interação para quantidade de sabão x marca de sabão.

De acordo com o princípio da hereditariedade do efeito, seria incomum haver uma interação entre dois fatores que não tivessem efeitos principais significativos. Isto, juntamente com o fato de que a interação BD não parece ser significativa usando as técnicas gráficas de Box and Meyer (1986a), Lawson et al. (1998) ou Lenth (1989) justificariam ignorar esta descoberta incomum. Portanto, a única coisa que parece ter um efeito significativo na facilidade de remoção do molho de espaguete assado é a temperatura da água da louça.

Os blocos não mostrados no gráfico normal também representaram uma grande proporção das somas dos quadrados. Se o termo do bloco não fosse incluído no modelo, nenhum dos efeitos dos fatores seria considerado significativo. Se as unidades experimentais tivessem sido restritas a uma marca de molho de espaguete e a um tempo de micro-ondas, as conclusões relativas à água da louça só se aplicariam a essa marca de molho e tempo de cozimento.


7.6.2 Confundindo projetos \(2^{k-p}\)


Um fatorial fracionário de \(2^{k-p}\) também pode ser facilmente bloqueado por interações confusas se o tamanho do bloco for uma potência de dois. Por exemplo, considere o fatorial fracionário \(2^{5−2}\) mostrado na Seção 6.3. Na Tabela 7.7, as oito execuções neste projeto são divididas em dois blocos usando a interação BC como bloco que define o contraste.

\[ \begin{array}{cccccc}\hline \mbox{A} & \mbox{B} & \mbox{C} & \mbox{D} & \mbox{E} & \mbox{Bloco = BC} & \\\hline - & - & - & + & + & 2 \qquad + \\ + & - & - & - & - & 2 \qquad + \\ - & + & - & - & + & 1 \qquad - \\ + & + & - & + & - & 1 \qquad - \\ - & - & + & + & - & 1 \qquad - \\ + & - & + & - & + & 1 \qquad - \\ - & + & + & - & - & 2 \qquad + \\ + & + & + & + & + & 2 \qquad + \\\hline \end{array} \] Tabela 7.7: Projeto \(2^{5-2}\) bloqueado.

Quando há apenas um bloco definindo o contraste em um planejamento fatorial completo, apenas essa interação é confundida com a diferença nos blocos. Entretanto, em um fatorial fracionário de um quarto, cada efeito que pode ser estimado é associado a três outros efeitos devido ao fracionamento. No exemplo acima os geradores para a fração trimestral foram D = AB e E = AC, resultando na relação definidora para a fração I = ABD = ACE = BCDE.

Multiplicando a relação definidora do fatorial fracionário pelo contraste definidor do bloco, vemos que BC = ACD = ABE = DE e que quatro interações são na verdade confundidas com os blocos.

Em geral, quando um fatorial fracionário de \(2^{k−p}\) é bloqueado em blocos de tamanho \(2^q\), haverá blocos de \(2^{k−p}/2^q = 2^{k−p−q}\). As \(k-p-q\) interações devem ser escolhidas como contrastes que definem blocos. Os contrastes que definem o bloco e todas as suas interações generalizadas serão responsáveis pelos \(2^{k-p-q} − 1\) graus de liberdade para os blocos e cada interação que for confundida também será alias com \(2^p − 1\) outras interações devido ao fracionamento. Esses projetos são chamados de fatorial fracionário bloqueado completamente confundido ou CCBFF.

Para ilustrar o projeto e a análise de um projeto \(2^{k − p}\) confuso, considere o experimento descrito por Porter and Busch (1978). O objetivo foi explorar os efeitos das oito variáveis mostradas na Tabela 7.8 na sobrevivência e no crescimento de camundongos cervos neonatos. O conhecimento da sobrevivência e do crescimento de qualquer espécie pode ajudar na compreensão de aspectos da distribuição animal.

\[ \begin{array}{cccc}\hline \mbox{Fator} & \mbox{Descrição} & \mbox{Nível (-)} & \mbox{Nível (+)} \\\hline \mbox{A} & \mbox{Brotos} & \mbox{nenhum} & \mbox{Acesso livre} \\ \mbox{B} & \mbox{Frequência de pesagem} & \mbox{Uma vez por dia} & \mbox{Uma vez a cada 3 dias} \\ \mbox{C} & \mbox{Caixa ninho} & \mbox{Não} & \mbox{Sim} \\ \mbox{D} & \mbox{Remover jovens} & \mbox{Não} & \mbox{Sim} \\ \mbox{E} & \mbox{Presença masculina} & \mbox{Sim} & \mbox{Não} \\ \mbox{F} & \mbox{Roda de exercício} & \mbox{Bloqueado} & \mbox{Livre} \\ \mbox{G} & \mbox{Comida disponível} & \mbox{80 por cento} & \mbox{Acesso livre} \\ \mbox{H} & \mbox{Água disponível} & \mbox{80 por cento} & \mbox{Acesso livre} \\\hline \end{array} \] Tabela 7.8: Fatores e níveis para experimento de crescimento de ratos.

Eles usaram um planejamento fatorial de \(\frac{1}{16}\) frações para identificar variáveis que afetam a capacidade das fêmeas de camundongos selvagens de criar filhotes até o desmame. Este foi um experimento de triagem com o objetivo de identificar efeitos principais significativos que seriam estudados posteriormente em experimentos posteriores.

Os geradores para o projeto fracionário \(2^{8−4}\) foram E = BCD, F = ACD, G = ABC e H = ABD, resultando na relação definidora \[ \begin{array}{rcl} \mbox{I} & = & \mbox{BCDE = ACDF = ABCG = ABDH = ABEF = ADEG = ACEH} \\ & = & \mbox{BDFG = BCFH = CDGH = CEFG = DEFH = BEGH = AFGH = ABCDEFGH}\cdot \end{array} \]

Esta era uma fração de resolução IV e os oito efeitos principais foram confundidos com sequências de interações de três fatores e de ordem superior. Além disso, havia sete cadeias de interações estimáveis de dois fatores confusas listadas abaixo: \[ \mbox{AB + CG + DH + EF} \\ \mbox{AC + BG + DF + EH} \\ \mbox{BC + AG + DE + FH} \\ \mbox{AD + BH + CF + EG} \\ \mbox{BD + AH + CE + FG} \\ \mbox{CD + AF + BE + GH} \\ \mbox{CH + AE + BF + DG} \]

Os experimentadores desejavam bloquear os experimentos em oito blocos de \(2^1 = 2\) execuções cada. Isto permitir-lhes-ia evitar vieses de variáveis não controladas, como a época do ano, ao longo da duração das suas experiências. Fazer isso exigiria escolher \(k-p-q = 8-4-1 = 3\) blocos que definem contrastes. Esses contrastes que definem os blocos, juntamente com suas interações generalizadas, seriam responsáveis pelos \(8–1=7\) graus de liberdade dos blocos.

Os contrastes definidores dos blocos escolhidos foram \[ \mbox{AB + CG + DH + EF , AC + BG + DF + EH} \] e \[ \mbox{AD + BH + CF + EG}\cdot \] As interações generalizadas de dois fatores são AB(AC) = BC ou BC + AG + DE + F H, AB(AD) = BD ou BD + AH + CE + F G e AC(AD) = CD ou CD + AF + BE + GH.

Finalmente, a interação generalizada de três fatores pode ser identificada substituindo BH por AD, uma vez que AD é confundido com BH para obter AB(AC)(AD) = AB(AC)(BH) = CH ou CH + AE + BF + DG. Portanto, usar os três blocos que definem contrastes AB + CG + DH + EF , AC + BG + DF + EH e AD + BH + CF + EG na verdade confunde todas as sete cadeias confusas de interações de dois fatores, mostradas acima, com blocos.

Os pesquisadores estavam dispostos a abrir mão de informações sobre todas as interações de dois fatores para evitar preconceitos, porque se tratava de um experimento de triagem em que se satisfaziam em obter informações sobre a importância relativa dos efeitos principais. O projeto e os resultados são mostrados na Tabela 7.9.

\[ \begin{array}{cccccccccc} \hline \mbox{Bloco} & \mbox{A} & \mbox{B} & \mbox{C} & \mbox{D} & \mbox{E} & \mbox{F} & \mbox{G} & \mbox{H} & \mbox{Peso} \\\hline 1 & + & - & - & - & - & + & + & + & 9.0 \\ 1 & - & + & + & + & + & - & - & - & 0.0 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 2 & - & - & + & + & - & - & + & + & 9.25 \\ 2 & + & + & - & - & + & + & - & - & 4.90 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 3 & + & - & + & - & + & - & - & + & 8.80 \\ 3 & - & + & - & + & - & + & + & - & 4.35 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 4 & - & - & - & + & + & + & - & + & 0.0 \\ 4 & + & + & + & - & - & - & + & - & 7.43 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 5 & - & + & + & - & - & + & - & + & 5.35 \\ 5 & + & - & - & + & + & - & + & - & 9.90 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 6 & + & + & - & + & - & - & - & + & 2.60 \\ 6 & - & - & + & - & + & + & + & - & 7.43 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 7 & - & + & - & - & + & - & + & + & 6.80 \\ 7 & + & - & + & + & - & + & - & - & 3.93 \\ -- & -- & -- & -- & -- & -- & -- & -- & -- & -- \\ 8 & + & + & + & + & + & + & + & + & 10.20 \\ 8 & - & - & - & - & - & - & - & - & 4.87 \\\hline \end{array} \] Tabela 7.9: Projeto e resultados do experimento de crescimento de ratos.

A resposta foi o peso ao desmame. Cada execução do projeto foi iniciada no dia em que os filhotes de uma fêmea nasceram e terminou quando todos morreram ou aos 21 dias. Os ratos foram agrupados em blocos de dois sequencialmente à medida que davam à luz. As duas combinações de tratamento dentro de cada bloco foram randomizadas para os ratos desse bloco.

O código para criar este fatorial fracionário bloqueado usando a função FrF2 no pacote R FrF2 é mostrado abaixo.

library(FrF2)
Bff = FrF2(16, 8, generators = c("BCD", "ACD", "ABC", "ABD"), blocks = c("AB", "AC", "AD"), 
           alias.block.2fis = TRUE, randomize = FALSE)
weight = c(0.0, 9.0, 5.35, 9.90, 4.35, 8.8, 6.8, 3.93, 9.25, 4.9, 7.43, 2.6, 0.0, 7.43, 4.87, 10.2)
add.response(Bff, response = weight)
##   run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 1      1         8.1.1      1 -1  1  1  1  1 -1 -1 -1      0
## 2      2         9.1.2      1  1 -1 -1 -1 -1  1  1  1      9
##   run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 3      3         7.2.1      2 -1  1  1 -1 -1  1 -1  1   5.35
## 4      4        10.2.2      2  1 -1 -1  1  1 -1  1 -1   9.90
##   run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 5      5         6.3.1      3 -1  1 -1  1 -1  1  1 -1   4.35
## 6      6        11.3.2      3  1 -1  1 -1  1 -1 -1  1   8.80
##   run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 7      7         5.4.1      4 -1  1 -1 -1  1 -1  1  1   6.80
## 8      8        12.4.2      4  1 -1  1  1 -1  1 -1 -1   3.93
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 9       9         4.5.1      5 -1 -1  1  1 -1 -1  1  1   9.25
## 10     10        13.5.2      5  1  1 -1 -1  1  1 -1 -1   4.90
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 11     11         3.6.1      6 -1 -1  1 -1  1  1  1 -1   7.43
## 12     12        14.6.2      6  1  1 -1  1 -1 -1 -1  1   2.60
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 13     13         2.7.1      7 -1 -1 -1  1  1  1 -1  1   0.00
## 14     14        15.7.2      7  1  1  1 -1 -1 -1  1 -1   7.43
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F  G  H weight
## 15     15         1.8.1      8 -1 -1 -1 -1 -1 -1 -1 -1   4.87
## 16     16        16.8.2      8  1  1  1  1  1  1  1  1  10.20
## class=design, type= FrF2.blocked 
## NOTE: columns run.no and run.no.std.rp  are annotation, 
##  not part of the data frame


A opção generators = especifica os geradores, interações confundidas com fatores adicionados, para o \(\frac{1}{6}\)-esimo fatorial fracionário e a opção blocks = especifica os contrastes que definem o bloco.

Para analisar os dados pode ser ajustado um modelo envolvendo apenas os efeitos principais A − H e os efeitos de bloco, uma vez que consideram todos os graus de liberdade.

O código R para ajustar este modelo é mostrado abaixo.

mouse <- lm(weight ~ Blocks + A + B + C + D + E + F + G + H, data = Bff)


Como se tratava de um modelo saturado com zero graus de liberdade para o termo de erro, a significância dos efeitos pôde ser acessada utilizando as técnicas gráficas descritas anteriormente. O código para fazer o gráfico seminormal dos efeitos na Figura 7.3 é mostrado abaixo.

effects = coef(mouse)
effects = effects[ 9:16 ]
library(daewr)
par(mar=c(4,4,1,1))
halfnorm(effects, names(effects), alpha=.15)
## zscore= 0.07841241 0.2372021 0.4022501 0.5791322 0.7764218 1.00999 1.318011 1.862732effp= 0.078125 0.280625 0.574375 0.623125 0.721875 0.896875 1.169375 2.119375
grid()

Figura 7.3: Gráfico meio normal de coeficientes de regressão absoluta do experimento de crescimento de camundongos.

A partir do gráfico semi-normal fica claro que o único factor que teve um efeito significativo no peso ao desmame foi G – alimento disponível. O efeito calculado mostrou que o peso ao desmame foi, em média, 4.24 g maior para filhotes de camundongos fêmeas com livre acesso à comida, em comparação com filhotes de camundongos cuja ingestão alimentar foi restrita a 80% do normal. Essa foi a conclusão a que chegaram os autores do artigo.


7.6.3 Critérios para escolha de contrastes definindo blocos


Deve-se ter cuidado ao escolher o bloco que define contrastes para experimentos fatoriais completos \(2^k\) ou fatoriais fracionários \(2^{k-p}\). Para ilustrar o porquê, considere os dois exemplos a seguir.

Exemplo 1

Consiste em bloquear um fatorial \(2^5\) em 8 blocos de tamanho \(2^2 = 4\). Para fazer isso \(k-q = 5-2 = 3\) blocos que definem contrastes devem ser escolhidos. Suponha que as interações ABC, CDE e ABCDE sejam escolhidas como o bloco que define os contrastes. Suas interações generalizadas de dois fatores \[ \mbox{ABC(CDE) = ABDE, ABC(ABCDE) = DE, CDE(ABCDE) = AB}, \] e sua interação generalizada de três fatores \[ \mbox{ABC(CDE)(ABCDE) = ABC(AB) = C} \] também é confundida, contabilizando os sete graus de liberdade para blocos.

Os contrastes que definem o blocos foram todas interações de três fatores e superiores, mas uma de suas interações generalizadas é o efeito principal C que não gostaríamos de confundir com blocos. Uma escolha melhor seria escolher ACE, BCE e ABCD como contrastes de definição de bloco. Suas interações generalizadas não incluem efeitos principais.

Exemplo 2

Consiste em bloquear um fatorial fracionário \(2^{6−2}\) em quatro blocos de tamanho \(2^2 = 4\). Para isso devem ser escolhidos \(k-p-q = 6-2-2 = 2\) contrastes definidores de blocos.

Se os geradores do fatorial fracionário forem E = ABC e F = ABD, a relação definidora do fatorial fracionário é \[ \mbox{I = ABCE = ABDF = CDEF}\cdot \]

Se os contrastes de definição de blocos escolhidos forem BDE e ACDE, eles e sua interação generalizada BDE(ACDE) = ABC serão responsáveis pelos três graus de liberdade dos blocos. No entanto, devido ao fracionamento, vemos que todos os aliases a seguir também são confundidos com blocos \[ \mbox{BDE = ACD = AEF = BCF} \\ \mbox{ACDE = BD = BCEF = AF} \\ \mbox{ABC = E = CDF = ABDEF} \]

Novamente podemos ver que esta escolha de geradores resulta na confusão do efeito principal E com blocos. Este foi um resultado não intencional. Uma melhor escolha de contrastes de definição de bloco seria ACD e AB, o que não resultará na confusão de quaisquer efeitos principais com blocos.

Existem muitas opções para definir contrastes de blocos e geradores fatoriais fracionários, e cada uma resultará em um conjunto diferente de interações sendo confundidas com blocos e uma estrutura de alias diferente para o projeto. Algumas escolhas serão melhores que outras e resultarão em menos interações de ordem inferior sendo confundidas com bloqueios e efeitos principais. Entretanto, encontrar os melhores geradores e blocos que definam contrastes para um determinado problema de projeto não é uma tarefa simples. Felizmente, os estatísticos forneceram tabelas que mostram escolhas que são óptimas em certos aspectos.

Box et al. (1978) fornecem tabelas para contrastes de definição de blocos que resultarão em um número mínimo de interações de ordem inferior sendo confundidas com blocos em um projeto bloqueado de \(2^k\). Wu and Hamada (2000) fornecem uma tabela mais extensa que foi gerada pelo algoritmo descrito por Chen et al. (1993). Em alguns casos, como os \(2^6\) blocos bloqueados em 16 blocos de tamanho 4, as tabelas de Wu and Hamada fornecem um conjunto de contrastes que definem blocos que são melhores, no sentido de que menos interações de dois fatores são confundidas com blocos, do que os contrastes mostrados nas tabelas em Box, Hunter and Hunter.

É mais difícil encontrar geradores fatoriais fracionários e contrastes de definição de bloco para projetos fatoriais fracionários \(2^{k-p}\), devido à combinação de confusão devido aos efeitos de bloco e fracionamento. No entanto, Sun et al. (1997) fornecem um extenso catálogo de contrastes de definição de blocos para projetos \(2^k\) e geradores para projetos \(2^{k-p}\), juntamente com os correspondentes contrastes de definição de blocos que resultarão em melhores projetos no que diz respeito a um dos vários critérios de qualidade, como ordem de estimação.

Eles dizem que um projeto com estimabilidade de ordem \(e\) é aquele em que todos os efeitos fatoriais de ordem \(e\) ou menos são estimáveis; isto é, eles não são confundidos com blocos ou efeitos fatoriais de ordem menor que \(e + 1\). Eles afirmam que não existe um único projeto melhor, mas a escolha depende da situação.

Quando não especificada pelo usuário, a função FrF2 no pacote R homônimo usa os contrastes de definição de bloco do catálogo de Sun et al. (1997) para criar projetos \(2^k\) bloqueados. Para \(2^{k-p}\), FrF2 usa a função blockpick ou blockpick.big, que frequentemente encontra planos isomórficos aos do catálogo de Sun et al.

Por exemplo, o código para criar um projeto \(2^{6-1}\), bloqueado em quatro blocos de oito unidades experimentais cada um usando FrF2 é mostrado a continuação.

library(FrF2)
Blocked.design = FrF2(32, 6, blocks = 4, alias.block.2fis = TRUE, randomize = FALSE)
summary(Blocked.design)
## Call:
## FrF2(32, 6, blocks = 4, alias.block.2fis = TRUE, randomize = FALSE)
## 
## Experimental design of type  FrF2.blocked 
## 32  runs
## blocked design with  4  blocks of size  8 
## 
## Factor settings (scale ends):
##    A  B  C  D  E  F
## 1 -1 -1 -1 -1 -1 -1
## 2  1  1  1  1  1  1
## 
## Design generating information:
## $legend
## [1] A=A B=B C=C D=D E=E F=F
## 
## $`generators for design itself`
## [1] F=ABCDE
## 
## $`block generators`
## [1] ABC ADE
## 
## 
## no aliasing of main effects or 2fis  among experimental factors
## 
## Aliased with block main effects:
## [1] AF
## 
## The design itself:
##   run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 1      1         1.1.1      1 -1 -1 -1 -1 -1 -1
## 2      2         4.1.2      1 -1 -1 -1  1  1 -1
## 3      3        13.1.3      1 -1  1  1 -1 -1 -1
## 4      4        16.1.4      1 -1  1  1  1  1 -1
## 5      5        22.1.5      1  1 -1  1 -1  1  1
## 6      6        23.1.6      1  1 -1  1  1 -1  1
## 7      7        26.1.7      1  1  1 -1 -1  1  1
## 8      8        27.1.8      1  1  1 -1  1 -1  1
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 9       9         2.2.1      2 -1 -1 -1 -1  1  1
## 10     10         3.2.2      2 -1 -1 -1  1 -1  1
## 11     11        14.2.3      2 -1  1  1 -1  1  1
## 12     12        15.2.4      2 -1  1  1  1 -1  1
## 13     13        21.2.5      2  1 -1  1 -1 -1 -1
## 14     14        24.2.6      2  1 -1  1  1  1 -1
## 15     15        25.2.7      2  1  1 -1 -1 -1 -1
## 16     16        28.2.8      2  1  1 -1  1  1 -1
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 17     17         5.3.1      3 -1 -1  1 -1 -1  1
## 18     18         8.3.2      3 -1 -1  1  1  1  1
## 19     19         9.3.3      3 -1  1 -1 -1 -1  1
## 20     20        12.3.4      3 -1  1 -1  1  1  1
## 21     21        18.3.5      3  1 -1 -1 -1  1 -1
## 22     22        19.3.6      3  1 -1 -1  1 -1 -1
## 23     23        30.3.7      3  1  1  1 -1  1 -1
## 24     24        31.3.8      3  1  1  1  1 -1 -1
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 25     25         6.4.1      4 -1 -1  1 -1  1 -1
## 26     26         7.4.2      4 -1 -1  1  1 -1 -1
## 27     27        10.4.3      4 -1  1 -1 -1  1 -1
## 28     28        11.4.4      4 -1  1 -1  1 -1 -1
## 29     29        17.4.5      4  1 -1 -1 -1 -1  1
## 30     30        20.4.6      4  1 -1 -1  1  1  1
## 31     31        29.4.7      4  1  1  1 -1 -1  1
## 32     32        32.4.8      4  1  1  1  1  1  1
## class=design, type= FrF2.blocked 
## NOTE: columns run.no and run.no.std.rp  are annotation, 
##  not part of the data frame


O relatório resumido mostra que o experimento \(2^{6-1}\) foi criado usando o gerador F = ABCDE e o bloco que define os contrastes AB e AC. Este é um fatorial fracionário de resolução VI e, se fosse executado em um delineamento completamente aleatório, todos os efeitos principais e interações de dois fatores seriam estimáveis, assumindo que as interações de quatro fatores e de ordem superior fossem desprezíveis.

Um projeto como esse poderia ser usado se o experimentador estivesse interessado em estimar interações de dois fatores. No entanto, se as unidades experimentais forem heterogêneas, mais poder ou precisão para detectar efeitos fatoriais e interações poderiam ser alcançados sacrificando algumas interações e confundindo-as com blocos. Os contrastes que definem o bloco escolhidos por FrF2 são interações de dois fatores.

A interação generalizada AB(AC) = BC representa o terceiro grau de liberdade para blocos, e devido ao fracionamento cada interação confundida com blocos possui um alias que também é confundido com blocos. Neste caso, a relação definidora para o fatorial fracionário é I = ABCDEF e vemos que AB = CDEF, AC = BDEF e BC = ADEF. Portanto, na realidade, três interações de dois fatores e três interações de quatro fatores serão confundidas com blocos e perdidas usando este projeto.

Ao remover a opção alias.block.2fis = TRUE conforme mostrado abaixo, FrF2 cria um fatorial fracionário de resolução IV com relação definidora I = ABCF e bloco definidor de contrastes ABD e ACE.

Blocked.design = FrF2(32, 6, blocks = 4, randomize = FALSE)
summary(Blocked.design)
## Call:
## FrF2(32, 6, blocks = 4, randomize = FALSE)
## 
## Experimental design of type  FrF2.blocked 
## 32  runs
## blocked design with  4  blocks of size  8 
## 
## Factor settings (scale ends):
##    A  B  C  D  E  F
## 1 -1 -1 -1 -1 -1 -1
## 2  1  1  1  1  1  1
## 
## Design generating information:
## $legend
## [1] A=A B=B C=C D=D E=E F=F
## 
## $`generators for design itself`
## [1] F=ABC
## 
## $`block generators`
## [1] ABD ACE
## 
## 
## Alias structure:
## $fi2
## [1] AB=CF AC=BF AF=BC
## 
## Aliased with block main effects:
## [1] none
## 
## The design itself:
##   run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 1      1         1.1.1      1 -1 -1 -1 -1 -1 -1
## 2      2         6.1.2      1 -1 -1  1 -1  1  1
## 3      3        11.1.3      1 -1  1 -1  1 -1  1
## 4      4        16.1.4      1 -1  1  1  1  1 -1
## 5      5        20.1.5      1  1 -1 -1  1  1  1
## 6      6        23.1.6      1  1 -1  1  1 -1 -1
## 7      7        26.1.7      1  1  1 -1 -1  1 -1
## 8      8        29.1.8      1  1  1  1 -1 -1  1
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 9       9         2.2.1      2 -1 -1 -1 -1  1 -1
## 10     10         5.2.2      2 -1 -1  1 -1 -1  1
## 11     11        12.2.3      2 -1  1 -1  1  1  1
## 12     12        15.2.4      2 -1  1  1  1 -1 -1
## 13     13        19.2.5      2  1 -1 -1  1 -1  1
## 14     14        24.2.6      2  1 -1  1  1  1 -1
## 15     15        25.2.7      2  1  1 -1 -1 -1 -1
## 16     16        30.2.8      2  1  1  1 -1  1  1
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 17     17         3.3.1      3 -1 -1 -1  1 -1 -1
## 18     18         8.3.2      3 -1 -1  1  1  1  1
## 19     19         9.3.3      3 -1  1 -1 -1 -1  1
## 20     20        14.3.4      3 -1  1  1 -1  1 -1
## 21     21        18.3.5      3  1 -1 -1 -1  1  1
## 22     22        21.3.6      3  1 -1  1 -1 -1 -1
## 23     23        28.3.7      3  1  1 -1  1  1 -1
## 24     24        31.3.8      3  1  1  1  1 -1  1
##    run.no run.no.std.rp Blocks  A  B  C  D  E  F
## 25     25         4.4.1      4 -1 -1 -1  1  1 -1
## 26     26         7.4.2      4 -1 -1  1  1 -1  1
## 27     27        10.4.3      4 -1  1 -1 -1  1  1
## 28     28        13.4.4      4 -1  1  1 -1 -1 -1
## 29     29        17.4.5      4  1 -1 -1 -1 -1  1
## 30     30        22.4.6      4  1 -1  1 -1  1 -1
## 31     31        27.4.7      4  1  1 -1  1 -1 -1
## 32     32        32.4.8      4  1  1  1  1  1  1
## class=design, type= FrF2.blocked 
## NOTE: columns run.no and run.no.std.rp  are annotation, 
##  not part of the data frame


Multiplicando cada bloco que define o contraste e sua interação generalizada pela relação definidora, verifica-se que ABD = DCF, ACE = BEF e BCDE = ADEF são confundidos com blocos. Assim, nenhuma interação de dois fatores é confundida com blocos, mas as interações de dois fatores são confundidas com outras interações de dois fatores devido ao fato do projeto ser de resolução IV.

O primeiro projeto \(2^{6-1}\) em quatro blocos apresentado na tabela de Wu and Hamada oferece outra alternativa. Utiliza F = ABCDE como gerador da meia fração e ACD, BCD como bloco que define os contrastes. Este plano confunde apenas uma interação de dois fatores com blocos e é, portanto, um pouco melhor que o primeiro projeto criado por FrF2 acima. Tendo o gerador de fração e os contrastes de definição de bloco disponíveis na tabela de Wu and Hamada, este projeto pode ser criado com FrF2 especificando os geradores e blocos como o experimento de crescimento de mouse mostrado na Seção 7.6.2.


7.7 Confundindo experimentos fatoriais de 3 níveis e \(p\)-níveis


Se cada fator em um fatorial tiver três níveis, chamamos o projeto de projeto simétrico \(3^k\). Esses projetos podem ser executados em blocos (CCBF) usando a mesma estratégia mostrada na Seção 7.6.1, confundindo porções de interações com blocos. Projetos \(3^k\) confusos só podem ser executados em blocos de tamanho \(3^q\) onde \(q < k\).

Para ilustrar o método de confusão, considere um experimento \(3^2\) com fatores A e B, cada um com três níveis. Como \(k = 2\), este projeto só pode ser bloqueado em blocos de tamanho três, resultando em três blocos. Para evitar que os efeitos principais A e B sejam completamente confundidos com blocos, a interação de dois fatores AB deve ser confundida com blocos.

No entanto, existem \((3-1)\times (3-1) = 4\) graus de liberdade para a interação de dois fatores, enquanto existem apenas \(3-1 = 2\) graus de liberdade para blocos. Portanto, apenas parte da interação precisa ser confundida com blocos. Os quatro graus de liberdade para AB podem ser particionados em dois graus de liberdade contrastantes A + B e A + 2B, e um deles pode ser usado para definir os blocos.

Se os níveis dos fatores A e B forem representados simbolicamente por 0, 1 e 2, os níveis dos dois contrastes A + B módulo 3 e A + 2B módulo 3, são mostrados abaixo.

\[ \begin{array}{cccc} \mbox{A} & \mbox{B} & \mbox{A+B} & \mbox{A+2B} \\\hline 0 & 0 & 0 & 0 \\ 0 & 1 & 1 & 2 \\ 0 & 2 & 2 & 1 \\ 1 & 0 & 1 & 1 \\ 1 & 1 & 2 & 0 \\ 1 & 2 & 0 & 2 \\ 2 & 0 & 2 & 2 \\ 2 & 1 & 0 & 1 \\ 2 & 2 & 1 & 0 \\ \end{array} \]

Cada um dos níveis desses dois contrastes pode ser visto como tendo dois graus de liberdade porque dividem as combinações de tratamento em três grupos, semelhante à forma como os níveis dos efeitos principais A e B dividem as combinações de tratamento em três grupos.

Ambos os contrastes são ortogonais aos efeitos principais A e B, uma vez que todos os três níveis de cada efeito principal são representados dentro de cada nível de ambos os contrastes. Portanto, se qualquer um desses contrastes for usado para definir blocos, nenhum dos efeitos principais será confundido com blocos.

O código R abaixo mostra como um plano criado com a função gen.factorial pode ser bloqueada usando a função mod no pacote daewr, confundindo blocos com o contraste A + B.

library(AlgDesign)
Blockdes = gen.factorial(3, nVars = 2, center = FALSE, varNames = c( "A", "B" ))
Block = 1+mod((Blockdes$A -1 )+(Blockdes$B - 1), 3)
Blockdes = cbind(Block, Blockdes)
knitr::kable(Blockdes)
Block A B
1 1 1
2 2 1
3 3 1
2 1 2
3 2 2
1 3 2
3 1 3
1 2 3
2 3 3


O modelo, representado na notação R aov para este projeto, seria Bloco+A+B. A interação AB, que é confundida com blocos, é deixada de fora do modelo, assim como teria sido nos projetos confusos \(2^k\) e \(2^{k-p}\).

O efeito principal A teria dois graus de liberdade, o efeito principal B teria dois graus de liberdade, os blocos teriam dois graus de liberdade e o erro teria dois graus de liberdade. Para que este projeto seja útil, a interação AB seria considerada desprezível.

Em geral, ao confundir experimentos \(3^k\) em blocos de tamanho \(3^q\), os contrastes que definem o bloco \(k-p\) devem ser escolhidos. Eles e todas as suas interações generalizadas também serão confundidos com bloqueios. Seria difícil escolher um conjunto de contrastes de definição de blocos por tentativa e erro que resultaria na confusão do menor número de interações de ordem inferior com blocos.

Wu and Hamada (2000) fornecem tabelas de contrastes que definem blocos e geradores de planos para projetos \(3^k\) e \(3^{k-p}\) bloqueados em blocos de tamanho \(3^q\) que resultarão no número máximo de efeitos estimáveis. Essas tabelas foram determinadas utilizando o algoritmo descrito por Chen et al. (1993). Os planos listados em suas tabelas podem ser criados usando as funções mod conforme mostrado no exemplo acima.

Cook and Nachtsheim (1989) desenvolveram um algoritmo diferente para bloquear um projeto existente, ou criar um projeto bloqueado a partir de uma lista de candidatos, maximizando a \(D\)-eficiência do bloco, \(D_s\). A função optBlock no pacote R AlgDesign usa um algoritmo diferente, mas a mesma ideia fundamental de Cook and Nachtsheim (1989) para encontrar projetos bloqueados. Por exemplo, o código abaixo cria um desenho \(3^4\) em nove blocos de nove.

library(AlgDesign)
Blockdes = gen.factorial(3, nVars = 4, factors = "all", varNames = c("A", "B", "C", "D"))
Blockdes = optBlock( ~ A + B + C + D + A:B + A:C + A:D + B:C + B:D + C:D, 
                     withinData = Blockdes, blocksizes = c(rep(9, 9)), criterion = "D")


A declaração do modelo A+B+C+D+A:B+A:C+A:D+B:C+B:D+C:D define os termos que o experimentador gostaria de estimar. Neste exemplo, todos os efeitos principais e interações de dois fatores devem ser estimáveis. Com esta especificação, as interações de três e quatro fatores podem ser total ou parcialmente confundidas com os \(9-1\) graus de liberdade para blocos.

Projetos \(p^k\), onde \(p\) é um número primo, também podem ser bloqueados usando a função mod conforme mostrado acima, mas na prática, projetos \(3^k\) ou \(3^{k-p}\) e projetos \(p^k\) ou \(p^{k-s}\) raramente são usados porque é incomum para todos os fatores em um fatorial projete para ter o mesmo número de níveis, a menos que o número de níveis seja dois. Os projetos \(2^k\) e \(2^{k-p}\) são comumente usados na prática porque os experimentadores reduzem o número de níveis de cada fator para dois, escolhendo os dois níveis que eles acham que exibirão a diferença máxima, para reduzir o número total de experimentos.

Nos casos em que o número de níveis de alguns fatores não pode ser reduzido a dois, porque representam um conjunto discreto de alternativas, como configurações de máquina, nível misto ou resultados fatoriais assimétricos. Os princípios mostrados nesta seção, para bloquear experimentos \(3^k\) ou \(p^k\) confundindo porções de interações, podem ser estendidos aos fatoriais de nível misto, conforme mostrado na próxima seção.


7.8 Bloqueio de fatoriais de nível misto e matrizes ortogonais


Um nível misto ou fatorial assimétrico pode ser representado como \(s_1^{m_1}\times s_2^{m_2}\times \cdots\times s_\gamma^{m_\gamma}\) envolvendo \(n = \sum_{i=1}^\gamma m_i\) fatores onde cada fator \(m_i\) tem níveis \(s_i\). Por exemplo, \(2^3\times 3^2\times 4^1\times 6^1\) é um fatorial com três fatores com dois níveis, dois fatores com três níveis, um fator com quatro níveis e um fator com seis níveis.

O número de níveis de cada fator em um fatorial de nível misto é um número primo ou produto de números primos. Se o número do \(i\)-ésimo fator \(s_i = \prod_{l=1}^m p_l\) onde \(p_l\) são números primos, então os níveis do fator \(s_i\) podem ser representados pela combinação de níveis de \(m\) pseudofatores, cada um com um número primo de níveis. Por exemplo, no fatorial \(2^3\times 3^2\times 4^1\times 6^1\), os três primeiros fatores A, B e C têm dois níveis, onde dois é um número primo.

O quarto e quinto fatores D e E possuem três níveis, onde três é um número primo. O sexto fator F tem quatro níveis e \(4 = 2\times 2\) é o produto de dois números primos. Finalmente, o sétimo fator G tem seis níveis e \(6 = 2\times 3\) também é um produto de números primos. Os níveis dos fatores F e G de quatro e seis níveis podem ser representados como combinações dos níveis dos pseudofatores \(f_1\), \(f_2\), \(g_1\) e \(g_2\) de dois e três níveis, conforme mostrado abaixo.

\[ \begin{array}{ccccccc} \mbox{F} & f_1 & f_2 & & \mbox{G} & g_1 & g_2 \\\hline 0 & 0 & 0 & & 0 & 0 & 0 \\ 1 & 1 & 0 & & 1 & 1 & 1 \\ 2 & 0 & 1 & & 2 & 0 & 2 \\ 3 & 1 & 1 & & 3 & 1 & 0 \\ & & & & 4 & 0 & 1 \\ & & & & 5 & 1 & 2 \\ \end{array} \]


7.8.1 Bloqueio de fatoriais de nível misto


Como os níveis de cada fator em um fatorial de nível misto podem ser representados por uma combinação dos níveis de pseudofatores com um número primo de níveis, o fatorial inteiro pode ser representado por um fatorial \(p_1^{n_1}\times p_2^{n_2}\times \cdots \times p_g^{n_g}\), onde todos os fatores têm um número primo de níveis.

Por exemplo, o fatorial \(2^3\times 3^2\times 4^1\times 6^1\) pode ser representado por um fatorial \(2^6\times 3^3\). Os \(p_i^{n_i}\) são chamados de subexperimentos e o método clássico de confundir um nível misto ou fatorial assimétrico é aplicar o método descrito na última seção a cada subexperiência e então combinar os blocos de cada subexperiência para formar os blocos de todo o fatorial bloqueado completamente confundido (CCBF).

Este método resultará na maior eficiência para estimar os efeitos e interações que não são confundidos com blocos, na medida em que serão completamente ortogonais aos blocos.

Fatoriais assimétricos da forma \(s_1^{m_1}\times s_2^{m_2}\times \cdots \times s_\gamma^{m_\gamma}\) podem ser bloqueados em \(b\) blocos de tamanho \(k\). Porém, para evitar confundir ou confundir parcialmente qualquer efeito principal, o tamanho do bloco \(k\) deve ser divisível por todos os números primos \(p_1 \cdots p_r\) que representam o número de níveis dos fatores ou número de níveis dos pseudofatores usados para representar um fator.

Para ilustrar o método clássico de bloqueio de um fatorial de nível misto, considere bloquear as 36 combinações de tratamento de um fatorial \(2^2\times 3^2\). Este fatorial pode ser representado como o produto de dois subexperimentos: um \(2^2\) composto por dois fatores A e B, cada um em dois níveis; e um \(3^2\) composto por dois fatores C e D, cada um em três níveis. Como os níveis de todos os fatores são primos, o tamanho do bloco deve ser divisível por dois e por três.

Os blocos podem ser encontrados confundindo-se dentro de cada subexperimento. Como existem apenas dois fatores em cada subexperiência, e seria indesejável confundir efeitos principais com blocos, existe apenas uma interação que pode ser confundida em cada subexperiência.

Confundir A + B no subexperimento \(2^2\) resulta em dois blocos de tamanho 2. Confundir o contraste C + D no subexperimento \(3^2\) resulta em três blocos de tamanho 3. A combinação de cada bloco do primeiro subexperimento com cada bloco do segundo subexperimento resulta em blocos de tamanho \(k = 6\), que é divisível por 2 e 3. As interações confundidas no fatorial completo serão AB, dois graus de liberdade de CD e dois graus de liberdade do produto ABCD. Os efeitos principais A, B, C, D e as interações de dois fatores AC, AD, BC, BD e as interações de três fatores ABC, ABD, ACD e BCD não são confundidos com blocos e são estimáveis.

O código abaixo mostra como criar este design em R. Primeiro, a função fac.design do pacote DoE.base é usada para criar o \(2^2\times 3^2\) composto por todas as combinações possíveis dos dois subexperimentos.

library(DoE.base)
Mixfac = fac.design(nlevels = c(2, 2, 3, 3), 
                    factor.names = c("A", "B", "C", "D"), randomize = FALSE)
knitr::kable(head(Mixfac))
A B C D
1 1 1 1
2 1 1 1
1 2 1 1
2 2 1 1
1 1 2 1
2 1 2 1


A seguir, a função mod do pacote daewr é usada para criar os indicadores de bloco.

library(daewr)
blk1 = mod(as.numeric(Mixfac$A) + as.numeric(Mixfac$B), 2) + 1
blk2 = mod(as.numeric(Mixfac$C) + as.numeric(Mixfac$D), 3) + 1
Block = as.factor((blk1 - 1) * 3 + blk2 )
Block
##  [1] 3 6 6 3 1 4 4 1 2 5 5 2 1 4 4 1 2 5 5 2 3 6 6 3 2 5 5 2 3 6 6 3 1 4 4 1
## Levels: 1 2 3 4 5 6


As colunas no plano experimental criado por fac.design são objetos de fator em R e devem ser convertidas em objetos numéricos usando a função R as.numeric para usá-las como argumentos na função mod para criar os indicadores de bloco blk1 e blk2 nos dois subexperimentos.

O indicador de bloco blk1 para o subexperimento \(2^2\) assume os valores 1 e 2. O indicador de bloco blk2 no subexperimento \(3^2\) assume os valores 1, 2 e 3. A instrução

Block = as.factor( (blk1 - 1) * 3 + blk2)

combina os dois indicadores de bloco em um. Quando blk1 = 1 e blk2 = 1, Block = 1; quando blk1 = 1 e blk2 = 1, Block = 2 e assim por diante.

Por fim, os indicadores de bloco são combinados com o plano \(2^2\times 3^2\) e as execuções são ordenadas por blocos.

BlMixfac = cbind(Block,Mixfac)
BlMixfac = BlMixfac[order(BlMixfac$Block), ]
knitr::kable(head(BlMixfac))
Block A B C D
5 1 1 1 2 1
8 1 2 2 2 1
13 1 1 1 1 2
16 1 2 2 1 2
33 1 1 1 3 3
36 1 2 2 3 3


Este planejamento permitirá a estimativa de todos os termos do modelo A+B+C+D+A:B+A:D+B:C+B:D, mas as interações A:B e C:D são confundidas com blocos e não podem ser estimados.

Quando os níveis de um ou mais fatores em um fatorial de nível misto são um produto de potências primárias e podem ser representados pela combinação de níveis de pseudofatores, nenhuma interação entre pseudofatores que representam o mesmo fator pode ser confundida em qualquer subexperimento. Se qualquer interação entre pseudofatores que representa um fator for confundida, então esse efeito principal também será confundido.

Por exemplo, considere bloquear as 72 combinações de níveis de fator em um fatorial \(3\times 4\times 6\). O fator A tem três níveis, o fator B tem quatro níveis e pode ser representado por todas as combinações de dois pseudofatores de dois níveis \(b_1\) e \(b_2\), e o fator C tem seis níveis que podem ser representados por todas as combinações de um pseudofator de dois níveis \(c_1\) e um pseudofator de três níveis \(c_2\).

Usando os pseudofatores, o fatorial \(3\times 4\times 6\) pode ser representado por um fatorial \(2^3\times 3^2\) em fatores de nível primo e pseudofatores de nível primo. O tamanho do bloco deve ser divisível pelos números primos 2 e 3 para evitar confundir um efeito principal, portanto blocos de tamanho 6 ou 12 podem ser possíveis.

O primeiro subexperimento é um \(2^3\) composto por pseudofatores de dois níveis \(b_1\), \(b_2\), \(c_1\) e o segundo subexperimento é um \(3^2\) composto pelo fator A e pelo pseudofator \(c_2\). O primeiro subexperimento só pode ser bloqueado em 2 blocos de 4 para evitar confundir a interação \(b_1 + b_2\) e, portanto, o efeito principal B.

Assim, a interação de três fatores \(b_1 + b_2 + c_1\) deve ser confundida com blocos no primeiro subexperimento. No segundo subexperimento, o contraste \(A + c_2\) da interação AC deve ser confundido para criar três blocos de três. A combinação de cada bloco do primeiro subexperimento combinado com cada bloco do segundo subexperimento resulta em seis blocos de 12 combinações de tratamento e este é o único tamanho de bloco possível sem confundir um efeito principal.

As interações confundidas com os cinco graus de liberdade para blocos no fatorial combinado serão BC, com um grau de liberdade, do primeiro subexperimento, dois graus de liberdade de AC do segundo subexperimento e dois graus de liberdade do produto ABC, ou seja, \(b_1 + b_2 + c_1\times (A + c_2)\).

O código R abaixo ilustra como esse plano pode ser criado usando fac.design. Primeiro, a função fac.design é usada para criar o fatorial completo em fatores e pseudofatores.

library(DoE.base)
Mixfac = fac.design(nlevels = c(2, 2, 2, 3, 3), 
                    factor.names = c("b1", "b2", "c1", "A", "c2"), randomize = FALSE)


Em seguida, a interação do pseudofator \(b_1\times b_2\times c_1\) é confundida com o indicador de bloco blk1 no \(2^3\) subexperimento e a interação \(A\times c_2\) é confundida com o indicador de bloco blk2 no \(3^2\) subexperimento.

library(daewr)
blk1 = mod(as.numeric(Mixfac$b1) + as.numeric(Mixfac$b2) + as.numeric(Mixfac$c1) ,2) + 1
blk2 = mod(as.numeric(Mixfac$A) + as.numeric(Mixfac$c2),  3) +1


Finalmente, os indicadores de bloco são combinados para criar o fator de bloco, os pseudofatores são combinados para criar os níveis de fator e todos são combinados e classificados pelos números de bloco conforme mostrado abaixo. As primeiras seis linhas resultantes do plano experimental é mostrado no final.

Block = as.factor((blk1 - 1) * 3 + blk2)
B = (as.numeric(Mixfac$b1) - 1) * 2 + as.numeric(Mixfac$b2)
C = (as.numeric(Mixfac$c1) - 1) * 3 + as.numeric(Mixfac$c2)
BlMixfac = cbind(Block, A = Mixfac$A, B = as.factor(B), C = as.factor(C))
BlMixfac = BlMixfac[order(Block), ]
knitr::kable(head(BlMixfac))
Block A B C
1 2 3 1
1 2 2 1
1 2 1 4
1 2 4 4
1 1 3 2
1 1 2 2


O modelo que pode ser ajustado aos dados resultantes deste experimento é A+B+C+A:B uma vez que nenhum dos termos deste modelo se confunde com blocos. Embora este desenho seja óptimo para estimar os parâmetros do modelo, pode não ser o melhor em todas as situações, uma vez que as interacções de dois factores AC e BC não podem ser estimadas.

Como existem apenas cinco graus de liberdade para blocos, parece que deveria haver uma maneira de confundir parte dos \(2\times 3\times 5 = 30\) graus de liberdade para a interação de três fatores ABC com blocos e deixar todas as interações de dois fatores estimáveis. Na verdade, se você estiver disposto a sacrificar parte da eficiência na estimativa dos termos do modelo, um experimento bloqueado melhor poderá ser encontrado usando uma busca D-ótima do que pode ser encontrado usando o método clássico.

Antes dos computadores modernos e das linguagens de programação como R, era necessário confundir completamente algumas interações com blocos, usando o método clássico, para que outras interações fossem deixadas ortogonais aos blocos. Dessa forma, a análise dos dados poderia ser completada manualmente usando as fórmulas de soma de quadrados ANOVA para dados balanceados.

No entanto, com a disponibilidade de programas como a função R lm, as somas dos quadrados são calculadas usando operações matriciais como mostrado nos Capítulos 2 e 3 e não é mais necessário que cada termo do modelo seja completamente ortogonal aos blocos para calcular os testes ANOVA e \(F\).

O modelo para um experimento fatorial bloqueado pode ser escrito em notação matricial como \[\begin{equation*} \tag{7.5} \pmb{y}=\pmb{X}\pmb{\tau}+\pmb{Z}\pmb{\beta}+\pmb{\epsilon}, \end{equation*}\] onde \(\pmb{y}\) é o vetor \(n\times 1\) de respostas, \(\pmb{\tau}\) é o vetor de efeitos e interações estimáveis do tratamento e \(\pmb{\beta}\) é o vetor de efeitos de bloco. Um critério de otimalidade que foi proposto para projetos bloqueados são os critérios \(D_s\), ver Atkinson et al. (2007).

Um projeto \(D_s\)-ótimo é aquele que minimiza a matriz de covariância do estimador de mínimos quadrados para \(pmb{\tau}\) ou equivalentemente maximiza o determinante de \[\begin{equation*} \tag{7.6} \pmb{X}^\top \pmb{Q}\pmb{X} \end{equation*}\] onde \[\begin{equation*} \tag{7.7} \pmb{Q}=\pmb{I}-\pmb{Z}(\pmb{Z}^\top \pmb{Z})^{1} \pmb{Z}^\top\cdot \end{equation*}\]

Projetos onde os blocos são ortogonais aos efeitos do tratamento ou \(\pmb{X}^\top \pmb{Z} = 0\), são 100% \(D_s\)-eficientes.

A aplicação do método clássico separadamente a subexperimentos simétricos resulta em projetos que possuem padrões de confusão conhecidos e são 100% \(D_s\)-eficientes para estimar os efeitos e interações \(\pmb{\tau}\), que não são confundidos com as diferenças de bloco, uma vez que serão ortogonais aos blocos.

Contudo, em situações práticas, o uso da abordagem clássica não proporciona muita flexibilidade na escolha do tamanho do bloco ou na escolha das interações a serem confundidas com diferenças de bloco. Como os subexperimentos são frequentemente definidos em termos de pseudofatores, as interações de interesse muitas vezes são confundidas com blocos.

O algoritmo de computador mais geral de Cook and Nachtsheim (1989) para a criação de experimentos bloqueados e o algoritmo semelhante disponível na função optBlock do pacote AlgDesign podem encontrar melhores experimentos bloqueados para fatoriais de níveis mistos. Esses algoritmos começam com um projeto inicial não singular e, em seguida, trocam sequencialmente as combinações de tratamento atribuídas a um bloco com aquelas atribuídas a outros blocos, a fim de maximizar \(∣\pmb{X}^\top \pmb{Q}\pmb{X}∣\).

Os projetos resultantes deste algoritmo podem não ser 100% \(D_s\)-eficientes para estimar \(\pmb{\tau}\), mas são possíveis maiores escolhas de tamanhos de bloco e interações estimáveis. O próximo exemplo ilustra o uso da função optBlock. Primeiro, a função gen.factorial no pacote AlgDesign cria um conjunto candidato composto por um fatorial \(3\times 4\times 6\). A instrução do modelo na chamada da função optBlock especifica que todas as interações de dois fatores sejam estimáveis.

A opção blocksizes = c(rep(12,6)) solicita seis blocos de tamanho 12 e criterion = “D” solicita que optBlock encontre um plano que seja ideal no sentido de que maximiza o determinante.

library(AlgDesign)
des = gen.factorial(levels = c(3, 4, 6), factors = "all", varNames = c("A", "B", "C"))
bdes = optBlock( ~ A + B + C + A:B + A:C + B:C, withinData = des, 
                 blocksizes = c(rep(12, 6)), criterion = "D")


optBlock não produz um projeto exclusivo, portanto, executar esse código novamente pode resultar em um plano diferente com propriedades semelhantes. Os seis blocos do desenho aqui produzido estão armazenados em bdes$Blocks e são mostrados a continuação.

knitr::kable(bdes$Blocks)
A B C
2 2 1 1
4 1 2 1
9 3 3 1
13 1 1 2
17 2 2 2
24 3 4 2
27 3 1 3
32 2 3 3
34 1 4 3
66 3 2 6
67 1 3 6
71 2 4 6
A B C
15 3 1 2
20 2 3 2
22 1 4 2
28 1 2 3
33 3 3 3
35 2 4 3
38 2 1 4
42 3 2 4
43 1 3 4
61 1 1 6
65 2 2 6
72 3 4 6
A B C
6 3 2 1
7 1 3 1
14 2 1 2
37 1 1 4
41 2 2 4
48 3 4 4
52 1 2 5
57 3 3 5
59 2 4 5
63 3 1 6
68 2 3 6
70 1 4 6
A B C
11 2 4 1
25 1 1 3
29 2 2 3
36 3 4 3
39 3 1 4
44 2 3 4
46 1 4 4
50 2 1 5
54 3 2 5
55 1 3 5
64 1 2 6
69 3 3 6
A B C
1 1 1 1
8 2 3 1
12 3 4 1
18 3 2 2
19 1 3 2
40 1 2 4
45 3 3 4
47 2 4 4
51 3 1 5
53 2 2 5
58 1 4 5
62 2 1 6
A B C
3 3 1 1
5 2 2 1
10 1 4 1
16 1 2 2
21 3 3 2
23 2 4 2
26 2 1 3
30 3 2 3
31 1 3 3
49 1 1 5
56 2 3 5
60 3 4 5


O projeto pode ser armazenado em um formato conveniente para análise usando o código a seguir. Mostramos somente as primeiras 6 linhas do arquivo de dados gerado bdesign.

Block = c(rep(1:6, each = 12))
bdesign = cbind(Block, bdes$design)
knitr::kable(head(bdesign))
Block A B C
2 1 2 1 1
4 1 1 2 1
9 1 3 3 1
13 1 1 1 2
17 1 2 2 2
24 1 3 4 2


Embora não seja 100% eficiente, implicando que todos os termos do modelo são completamente ortogonais aos blocos, como o projeto encontrado usando o método clássico, pelo menos todas as interações de dois fatores são estimáveis. Se o código for modificado alterando a opção na instrução de blocos de blocksizes = c(rep(12,6)) para blocksizes = c(rep(6,12)), a função optBlock encontra um fatorial \(3\times 4\times 6\) bloqueado em 12 blocos de seis que ainda permitem a estimativa de todas as interações de dois fatores.

A \(D\)-eficiência para os tratamentos neste projeto foi baixa, mas isto é muito melhor do que poderia ser conseguido com o método clássico. A única maneira pela qual o método clássico poderia bloquear o fatorial \(3\times 4\times 6\) em blocos de tamanho 6 seria confundir parte do efeito principal para o fator B. Se reduzir o tamanho do bloco para seis reduzir a variância das unidades experimentais dentro de um bloco, o sacrifício em termos de eficiência valerá a pena.

Ao usar a abordagem \(D_s\)-ótima para encontrar um projeto de bloco confuso para um fatorial de nível misto, não é mais necessário que o tamanho do bloco seja divisível por todos os números primos que representam níveis de fator nos subexperimentos. Se o tamanho do bloco que é mais conveniente para reduzir a variabilidade das unidades experimentais dentro de um bloco não for divisível pelo número de níveis de todos os fatores, isso pode impedir encontrar um projeto onde todos os fatores e interações de interesse sejam ortogonais aos blocos.

No entanto, um projeto encontrado usando a busca ideal \(D_s\)-ótima geralmente não terá todos os efeitos no modelo ortogonal aos blocos de qualquer maneira. Desde que o determinante não seja zero, os termos especificados no modelo serão estimáveis. Devido à não ortogonalidade desses projetos, as somas dos quadrados do tipo III e as médias dos mínimos quadrados devem ser usadas quando analisando dados.


7.8.2 Outros bloqueios


Projetos de arranjos ortogonais, planos de efeitos principais ortogonais e planos quase ortogonais discutidos na Seção 6.7 também podem ser bloqueados, a fim de reduzir a variação de unidades experimentais dentro de blocos ou para permitir que a lista de experimentos seja concluída em dias diferentes ou com diferentes lotes de matérias-primas e assim por diante.

Uma maneira de conseguir isso é incluir o fator de bloqueio como um dos fatores ao criar inicialmente um projeto usando a função oa.design no pacote DoE.base. O código abaixo, que é semelhante ao mostrado na Seção 6.7, procura uma matriz ortogonal apropriada para criar uma fração de desenho 41 × 61 × 23 × 32 bloqueada em três blocos.

library("DoE.base")
show.oas(factors = list(nlevels = c(4, 6, 2, 3), number = c(1, 1, 3, 3)))
## no suitable  resolution IV or more  array found
## 27  orthogonal  arrays found, 
## the first  10  are listed
##                      name nruns lineage
## 382  L72.2.43.3.8.4.1.6.1    72        
## 384  L72.2.42.3.4.4.1.6.2    72        
## 398  L72.2.36.3.9.4.1.6.1    72        
## 402 L72.2.35.3.12.4.1.6.1    72        
## 403  L72.2.35.3.5.4.1.6.2    72        
## 405  L72.2.34.3.8.4.1.6.2    72        
## 406  L72.2.34.3.3.4.1.6.3    72        
## 418 L72.2.19.3.20.4.1.6.1    72        
## 420 L72.2.18.3.16.4.1.6.2    72        
## 422 L72.2.17.3.12.4.1.6.3    72


Os resultados mostram que existem vários arrays ortogonais de 72 execuções para esta finalidade. Como são ortogonais, todos os efeitos principais serão ortogonais entre si e ao fator de bloco. O código abaixo mostra como criar o plano \(4^1\times 6^1\times 2^3\times 3^2\) de 72 corridas em três blocos de 24.

library("DoE.base")
fnames = c ("A", "B", "C", "D", "E", "F", "G", "Block")
BlockOA = oa.design(nlevels = c(4, 6, 2, 2, 2, 3, 3, 3), factor.names = fnames, seed=104, nruns = 72)
BlockOA = BlockOA[order(BlockOA$Block), ]


Como são necessários apenas 18 graus de liberdade para estimar os efeitos principais e o fator de bloco, este projeto deixa 56 graus de liberdade para erro. Se o experimentador estivesse disposto a sacrificar a ortogonalidade, um desenho bloqueado muito menor poderia ser encontrado.

Por exemplo, o código abaixo cria uma matriz ortogonal de 72 execuções como uma lista de candidatos e, em seguida, usa a função optBlock para criar um subconjunto de 24 execuções bloqueado em três blocos de 8.

library(DoE.base)
library(AlgDesign)
fnames = c("A", "B", "C", "D", "E", "F", "G")
cand = oa.design(nlevels = c(4, 6, 2, 2, 2, 3, 3), 
                 factor.names = fnames, randomize = TRUE, seed = 104, nruns = 72)
bdes = optBlock( ~ A + B + C + D + E + F + G, withinData = cand, blocksizes = c(rep(8, 3)),criterion = "D")
knitr::kable(head(bdes$Blocks))
A B C D E F G
4 2 1 2 1 1 3 2
5 1 6 2 2 1 3 3
6 1 3 1 2 2 2 2
28 3 2 2 1 2 2 3
40 3 6 1 1 1 2 1
45 3 5 1 1 2 1 2
50 4 1 1 1 1 2 3
70 3 3 2 2 1 1 3
A B C D E F G
10 2 6 1 2 2 3 3
33 4 3 1 1 1 3 1
47 3 1 1 2 2 1 1
49 2 5 2 1 1 2 1
59 1 3 1 1 2 3 1
62 2 4 1 2 1 1 3
66 4 4 1 2 2 2 2
67 4 3 2 1 1 1 3
A B C D E F G
9 1 1 1 1 2 2 3
27 4 6 2 1 2 1 2
30 4 5 2 2 2 3 3
37 3 4 2 1 2 3 1
44 1 2 2 2 1 1 1
56 1 4 1 1 1 1 3
63 3 4 2 2 1 2 2
71 3 2 1 1 1 3 2



7.9 Fatorial bloqueado parcialmente confundido (PCBF)


Um dos principais objetivos de executar um experimento fatorial com poucos fatores é estimar todas as interações. No entanto, se o projeto for confundido em blocos, o experimentador perderá a capacidade de estimar algumas interações. No entanto, a inclusão de alguns blocos adicionais no projeto permitirá a estimativa de todos os principais efeitos e interações usando o método de confusão parcial.

Este método consiste em confundir um ou mais efeitos ou interações em um conjunto de blocos e confundir diferentes efeitos ou interações em conjuntos adicionais de blocos ou réplicas. Ao combinar todas as réplicas, todos os efeitos e interações serão estimáveis, embora não sejam ortogonais aos blocos.

Por exemplo, se um experimento fosse realizado para estudar o efeito de dois níveis de A = suplementos de cálcio e dois níveis de B = suplementos de potássio sobre a pressão arterial de indivíduos hipertensos, um experimento fatorial \(2^2\) seria realizado para estimar o dois efeitos principais e a interação.

No entanto, se os experimentos fossem bloqueados em dois blocos de duas unidades experimentais, por exemplo, dois pares de gêmeos idênticos, confundindo AB essa interação seria perdida. Uma forma de remediar o problema seria incluir quatro blocos adicionais, confundindo o efeito principal A com a diferença de dois blocos adicionais e o efeito principal B com a diferença de mais dois blocos.

Combinando os seis blocos, tanto os efeitos principais como a sua interação seriam estimáveis. Esse experimento é mostrado na Tabela 7.10 e essa classe geral de experimentos é chamada de fatoriais bloqueados parcialmente confundidos ou PCBF.

\[ \begin{array}{cccc}\hline \mbox{Bloco} & \mbox{A} & \mbox{B} & \\\hline 1 & - & - & \\ 1 & + & + & \mbox{Repetição 1} \\ -- & -- & -- & \mbox{confundindo} \\ 2 & - & + & \mbox{AB} \\ 2 & + & - & \\\hline 3 & - & - & \\ 3 & - & + & \mbox{Repetição 2} \\ -- & -- & -- & \mbox{confundindo} \\ 4 & + & - & \mbox{A} \\ 4 & + & + & \\\hline 5 & - & - & \\ 5 & + & - & \mbox{Repetição 3} \\ -- & -- & -- & \mbox{confundindo} \\ 6 & - & + & \mbox{B} \\ 6 & + & + & \\\hline \end{array} \] Tabela 7.10: Projeto fatorial \(2^2\) parcialmente confundidos em 6 Blocos de 2.

O modelo Block+A+B+A:B poderia então ser ajustado aos dados do conjunto combinado de blocos. As somas de quadrados e médias de mínimos quadrados do tipo III seriam usadas para analisar os dados, uma vez que os efeitos não são completamente ortogonais aos blocos.

Se cada efeito e interação no modelo for confundido um número igual de vezes em diferentes conjuntos de blocos, como no exemplo mostrado acima, Butler (2006) mostra que o planejamento terá propriedades favoráveis e a máxima D-eficiência do tratamento para estimar o fatorial efeitos.

Portanto, um projeto como este poderia ser criado usando o algoritmo de Cook and Nachtsheim ou o algoritmo semelhante disponível na função optBlock do pacote AlgDesign. O exemplo abaixo mostra como isso poderia ser feito.

library(AlgDesign)
Blockdes = gen.factorial(2, nVars = 2, factors = "all", varNames = c("A","B"))
Blockdes = optBlock( ~ A + B + A:B, withinData = Blockdes, blocksizes = c(rep(2,6)), criterion = "D")
knitr::kable(head(Blockdes$design))
A B
2 2 1
4 2 2
1 1 1
3 1 2
11 1 1
21 2 1


Para planos fatoriais de nível misto, Das (1960) forneceu um método para construir projetos confusos balanceados onde:

  1. a informação recuperada para cada grau de liberdade para qualquer interação parcialmente confusa é a mesma, e

  2. qualquer contraste de uma interação parcialmente confusa a interação é estimável independentemente de qualquer contraste de outra interação parcialmente confundida.

A informação recuperada para o \(i\)-ésimo grau de liberdade no modelo (7.5) é calculada como \(c_{ii}/c^′_{ii}\times c_{ii}\) é a diagonal da matriz \((X^\top X)^{−1}\) correspondente a um determinado grau de liberdade único e \(\sigma^2 c_{ii}\) é a variância de \(\widehat{\tau}_i\) em um projeto onde os efeitos do tratamento são ortogonais aos blocos. \(c^′_{ii}\) é a diagonal de \((X^\top QX)^{−1}\) e \(\sigma^{′2} c^′_{ii}\) é a variância de \(\widehat{\tau}_̂\)i no projeto parcialmente confundido onde \(Q\) é definido na Equação (7.7).

Em projetos parcialmente confundidos \(c^′_{ii} > c_{ii}\), mas \(\sigma^{′2}\) deve ser bem menor que \(\sigma^2\) devido ao fato das unidades experimentais serem mais homogêneas dentro dos blocos de tamanho reduzido.

A construção de um experimento utilizando o método de Das consiste em converter o fatorial assimétrico em uma fração de um fatorial simétrico. O confundimento parcial é realizado em réplicas do fatorial simétrico e então cada réplica é reduzida por fracionamento.

Lawson et al. (2009) mostram como o método de Das pode ser implementado em SAS com proc plan e programação de etapas de dados. Eles também fornecem uma macro SAS para gerar projetos confusos balanceados de Das. A criação de projetos por este método permitirá que todas as interações no modelo sejam estimadas e resultará em um projeto com igual precisão para cada grau de liberdade de efeitos e interações parcialmente confundidos.

Uma desvantagem da utilização deste método é que o número total de combinações de tratamento \[ N = s_1^{m_1}\times s_2^{m_2}\times \cdots s_\gamma^{m_\gamma}, \] deve ser sempre divisível pelo tamanho do bloco. Isso pode exigir um grande número de blocos em alguns casos.

A função optBlock também pode ser usada para encontrar um fatorial de nível misto parcialmente confundido que permitirá a estimativa de todas as interações e não há restrição quanto ao tamanho do bloco. O uso deste método às vezes pode produzir um projeto confuso e balanceado, como o método de Das, e em outros casos ele encontrará um projeto aproximadamente balanceado com mais opções para o tamanho do bloco e o número total de execuções. Lawson et al. (2009) comparam as propriedades dos projetos criados por este método com os projetos criados pelo método de Das.

O exemplo abaixo mostra o uso das funções AlgDesign, gen.factorial e optBlock para construir um fatorial \(3\times 2^2\) parcialmente confundido bloqueado em 12 blocos de 4.

desf = gen.factorial(c(2, 2, 3), factors = "all", varNames = c("A", "B", "C"))
Blockdes = optBlock( ~ A*B*C, withinData = desf, blocksizes = c(rep(4, 12)),criterion = "D")
knitr::kable(head(Blockdes$design))
A B C
3 1 2 1
5 1 1 2
7 1 2 2
10 2 1 3
1 1 1 1
2 2 1 1


Como exemplo de planejamento e análise de um fatorial parcialmente confundido, considere um experimento realizado por Dossett et al. (2007). Eles estavam investigando métodos de armazenamento de fatias de maçã em lanches marrons. O problema é que as fatias de maçã em um saco de almoço ficam marrons e parecem pouco apetitosas antes da hora do almoço.

Eles queriam comparar os efeitos de mergulhar as fatias em diferentes soluções de tratamento antes do armazenamento e comparar os efeitos de armazená-las em diferentes recipientes de armazenamento para ver se conseguiam encontrar condições para reduzir a quantidade de escurecimento. A Tabela 7.11 mostra os fatores e níveis. Eles pensaram que diferentes variedades de maçãs poderiam dourar em taxas diferentes e, portanto, queriam bloquear por variedade de maçã.

\[ \begin{array}{cll}\hline & \mbox{Fator A} & \mbox{Fator B} \\ \mbox{Nível do fator} & \mbox{Solução de pré-tratamento} & \mbox{Contêiner de armazenamento} \\\hline 0 & \mbox{nenhuma} & \mbox{nenhuma – ao ar livre} \\ 1 & \mbox{suco de limão fraco} & \mbox{saco Ziploc} \\ 2 & \mbox{água salgada} & \mbox{Tupperware} \\ 3 & \mbox{água com bicarbonato de sódio} & - \\\hline \end{array} \] Tabela 7.11: Níveis dos fatores para experimento de Browning de fatias de maçã.

O cortador de maçãs cortou as maçãs em seis fatias, portanto, todas as combinações de tratamento \(4\times 3 = 12\) não puderam ser testadas dentro de cada bloco ou maçã. Como estavam interessados na possível interação de seus fatores de tratamento, executaram um projeto parcialmente confuso.

O código R abaixo pode ser usado para criar um experimento fatorial \(4\times 3\) em 4 blocos de tamanho 6 usando gen.factorial e optBlock. Os blocos representavam quatro variedades diferentes de maçãs; nomeadamente Fuji, Braeburn, Red Delicious e Granny Smith.

As unidades experimentais seriam as seis fatias de cada maçã, e estas poderiam ser atribuídas aleatoriamente a uma das combinações de tratamento designadas para cada bloco.

des23 = gen.factorial(c(4, 3), factors = "all", varNames = c("A", "B"))
Blockdes = optBlock( ~ A*B, withinData = des23, blocksizes = c(rep(6, 4)),criterion = "D")
knitr::kable(head(Blockdes$design))
A B
2 2 1
3 3 1
6 2 2
8 4 2
10 2 3
11 3 3


Dosset et al. (2007) na verdade usaram um procedimento ligeiramente diferente para gerar o projeto, mas seu projeto tinha propriedades semelhantes. Depois de armazenar as fatias de maçã tratadas por uma hora e quarenta e cinco minutos, cada fatia foi comparada com fotografias de uma fatia de maçã em vários estágios de escurecimento e recebeu uma classificação entre 1 e 11.

A classificação mais baixa foi para a menor quantidade de escurecimento e a mais alta foi para a maior quantidade. Todos os três membros da equipe avaliaram as fatias de forma independente e a resposta foi a classificação média. A Tabela 7.12 mostra os resultados.

\[ \begin{array}{ccc|ccc|ccc|ccc}\hline & & \mbox{Bloco 1} & & & \mbox{Bloco 2} & & & \mbox{Bloco 3} & & & \mbox{Bloco 4} \\ \mbox{A} & \mbox{B} & \mbox{Classificação} & \mbox{A} & \mbox{B} & \mbox{Classificação} & \mbox{A} & \mbox{B} & \mbox{Classificação} & \mbox{A} & \mbox{B} & \mbox{Classificação} \\\hline 0 & 0 & 7.33 & 2 & 0 & 1.00 & 3 & 2 & 10.33 & 2 & 2 & 1.00 \\ 2 & 1 & 1.67 & 1 & 0 & 3.33 & 1 & 0 & 2.00 & 3 & 0 & 8.33 \\ 0 & 2 & 6.67 & 2 & 2 & 1.00 & 2 & 1 & 2.33 & 1 & 1 & 4.33 \\ 1 & 1 & 1.33 & 0 & 1 & 8.67 & 0 & 2 & 7.00 & 1 & 2 & 1.33 \\ 2 & 0 & 1.67 & 0 & 0 & 8.33 & 3 & 1 & 3.67 & 0 & 1 & 3.33 \\ 3 & 0 & 8.00 & 3 & 2 & 4.00 & 1 & 2 & 6.00 & 3 & 1 & 9.33 \\\hline \end{array} \] Tabela 7.12: Planejamento fatorial \(4\times 3\) bloqueado e resultados para escurecimento de fatias de maçã.

Este design e os resultados são armazenados no data frame apple no pacote daewr. O exemplo abaixo mostra como acessar e analisar esses dados.

library(daewr)
library(car)
modf = lm(rating ~ Block + A + B + A:B, data = apple, 
          contrasts = list(A = contr.sum, B = contr.sum, Block = contr.sum))
Anova(modf,type="III")
## Anova Table (Type III tests)
## 
## Response: rating
##             Sum Sq Df F value    Pr(>F)    
## (Intercept) 522.48  1 72.7428 1.323e-05 ***
## Block         3.01  3  0.1396    0.9338    
## A           145.96  3  6.7740    0.0110 *  
## B             2.21  2  0.1535    0.8599    
## A:B           7.73  6  0.1795    0.9755    
## Residuals    64.64  9                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


Percebe-se que a única coisa significativa foi o fator A, a solução de tratamento. Os mínimos quadrados médios para as diferentes soluções de tratamento podem ser encontradas conforme mostrado abaixo.

library(lsmeans)
lsmeans(modf, pairwise ~ A, adjust = ("tukey"))
## $lsmeans
##  A lsmean   SE df lower.CL upper.CL
##  0   6.97 1.12  9    4.445     9.50
##  1   2.97 1.12  9    0.444     5.50
##  2   1.53 1.12  9   -0.998     4.05
##  3   7.19 1.12  9    4.668     9.72
## 
## Results are averaged over the levels of: Block, B 
## Confidence level used: 0.95 
## 
## $contrasts
##  contrast estimate   SE df t.ratio p.value
##  A0 - A1     4.001 1.61  9   2.484  0.1295
##  A0 - A2     5.443 1.55  9   3.518  0.0276
##  A0 - A3    -0.223 1.61  9  -0.138  0.9990
##  A1 - A2     1.442 1.61  9   0.896  0.8074
##  A1 - A3    -4.223 1.55  9  -2.729  0.0901
##  A2 - A3    -5.666 1.61  9  -3.518  0.0276
## 
## Results are averaged over the levels of: Block, B 
## P value adjustment: tukey method for comparing a family of 4 estimates


Utilizando o procedimento HSD de Tukey, conforme descrito na Secção 2.8.2, descobriu-se que mergulhar as fatias de maçã em água salgada reduz ao máximo o escurecimento, mas a quantidade de escurecimento das fatias mergulhadas em sumo de limão não foi significativamente pior. Os experimentadores recomendaram mais estudos variando a concentração do suco de limão para ver se conseguiam melhorar os resultados e eliminar o gosto residual deixado pela água salgada.

Para apresentar os resultados utilizaremos a função plotTukeysHSD. Esta função utiliza a saída da função TukeyHSD e traça as diferenças estimadas e os intervalos de confiança. Em particular, ele traça diferentes comparações ao longo do eixo \(x\) e adiciona automaticamente um rótulo informando que as barras de erro são ICs de 95%

source("http://leg.ufpr.br/~lucambio/DoE/plotTukeysHSD.R")
ANOVA = aov(modf)
TUKEY = TukeyHSD(ANOVA, "A")
# Tuckey test representation :
plotTukeysHSD(TUKEY)
grid()


7.10 Exercícios