Planejamento de Experimentos

6.1 Introdução
6.2 Meias frações de projetos \(2^k\)
6.3 Frações de terceira ordem e superiores de projetos \(2^k\)
6.4 Critérios para escolha de geradores para projetos \(2^{k-p}\)
6.5 Aumentando fatoriais fracionários
6.5.1 Aumentando por dobramento ou planejamento de imagem espelhada
6.5.2 Aumentando por planejamento ideal
6.6 Plackett-Burman (PB) e projetos de triagem robusta modelo
6.7 Fatoriais de níveis mistos e matrizes ortogonais
6.8 Projetos de triagem definitiva
6.9 Exercícios

6.1 Introdução

Existem dois benefícios em estudar vários fatores de tratamento simultaneamente em um planejamento fatorial. Primeiro, a interação ou os efeitos conjuntos dos fatores podem ser detectados. Em segundo lugar, os experimentos são mais eficientes. Em outras palavras, a mesma precisão de efeitos pode ser alcançada com menos experimentos do que seria necessário se cada um dos fatores fosse estudado um de cada vez em experimentos separados.

Quanto mais fatores forem incluídos em um planejamento fatorial, maior será a eficiência e maior será o número de interações que podem ser detectadas.

Entretanto, quanto mais fatores forem incluídos em um experimento fatorial, maior será o número de execuções que deverão ser realizadas. Quando muitos fatores são incluídos em um experimento fatorial, uma maneira de reduzir o número de execuções é usar apenas dois níveis de cada fator e executar apenas um experimento por célula ou combinação de tratamento. Estas ideias foram discutidas nas Seções 3.7 e 3.7.5.

Na fase preliminar de experimentação, onde o objetivo pode ser determinar quais fatores são importantes em uma longa lista de candidatos, um planejamento fatorial pode exigir a realização de muitos experimentos, mesmo quando há apenas dois níveis de cada fator e apenas uma réplica por célula.

A Tabela 6.1 mostra o número de experimentos necessários para um planejamento fatorial \(2^k\) em função do número de fatores \(k\). Com \(k = 7\) ou mais fatores, o grande número de execuções necessárias para um plano \(2^k\) geralmente é impraticável.

\[ \begin{array}{cc}\hline \mbox{Número de fatores} \, k & \mbox{Número de experimentos} \, 2^k \\\hline 4 & 16 \\ 5 & 32 \\ 6 & 64 \\ 7 & 128 \\ 8 & 256 \\ 9 & 512 \\\hline \end{array} \] Tabela 6.1: Número de experimentos necessários para planos experimental \(2^k\).

Quando o número de fatores em estudo é grande, os pesquisadores muitas vezes abandonam completamente a eficiência dos experimentos fatoriais e revertem para uma abordagem simples ou variam o plano de um fator de cada vez. com um subconjunto de fatores, escolhidos de uma lista mais longa, adivinhando quais podem ser mais importantes.

No entanto, essas abordagens não são ideais e não retêm os benefícios dos experimentos fatoriais com um grande número de fatores. Uma solução melhor para este problema é usar uma fração dos experimentos ou execuções, necessárias para um experimento fatorial completo.

Para ser eficaz, a fração de execuções utilizadas deve ser cuidadosamente selecionada, a fim de preservar alguns dos benefícios de um experimento fatorial completo. Uma das propriedades desejáveis de um plano fatorial \(2^k\) é que os efeitos dos fatores não sejam obscurecidos ou correlacionados por mudanças planejadas em outros fatores. Esta propriedade foi chamada de ortogonalidade na Seção 3.7.

6.2 Meias frações de projetos \(2^k\)

Considere primeiro escolher uma meia fração de um experimento fatorial \(2^k\). A escolha descuidada de metade das execuções \(n = 2^k\) pode não reter a propriedade desejável de ortogonalidade de um projeto de \(2^k\).

Uma maneira de preservar esta propriedade, ao selecionar meia fração de um experimento fatorial \(2^k\) é escolher as execuções onde os níveis de fator codificados para um termo de interação, de preferência a interação de ordem mais alta, são constantes.

A Tabela 6.2 ilustra esse procedimento. No lado esquerdo da tabela há uma representação dos níveis dos fatores codificados para um experimento \(2^4\). No lado direito da tabela estão as execuções que possuem um valor constante (+) para \(X_A\times X_B \times X_C \times X_D\). Essas corridas representam a meia fração.

\[ \begin{array}{cc}\hline \mbox{Fatorial Completo} \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \quad & \mbox{Meio Fatorial} \qquad\qquad\qquad \quad \\ \end{array} \\ \begin{array}{ccccccccccc} \mbox{Execução} & X_A & X_B & X_C & X_D & X_A\times X_B \times X_C \times X_D & \mbox{Execução} & X_A & X_B & X_C & X_D \\\hline 1 & - & - & - & - & + & 1 & - & - & - & - \\ 2 & + & - & - & - & - & 10 & + & - & - & + \\ 3 & - & + & - & - & - & 11 & - & + & - & + \\ 4 & + & + & - & - & + & 4 & + & + & - & - \\ 5 & - & - & + & - & - & 13 & - & - & + & + \\ 6 & + & - & + & - & + & 6 & + & - & + & - \\ 7 & - & + & + & - & + & 7 & - & + & + & - \\ 8 & + & + & + & - & - & 16 & + & + & + & + \\ 9 & - & - & - & + & - & & & & & \\ 10 & + & - & - & + & + & & & & & \\ 11 & - & + & - & + & + & & & & & \\ 12 & + & + & - & + & - & & & & & \\ 13 & - & - & + & + & + & & & & & \\ 14 & + & - & + & + & - & & & & & \\ 15 & - & + & + & + & - & & & & & \\ 16 & + & + & + & + & + & & & & & \\\hline \end{array} \] Tabela 6.2: Criando uma meia fração escolhendo as execuções em uma fração completa com valores constantes para uma interação.

A ordem das execuções no lado direito da tabela foi reordenada para que possa ser facilmente visto que o padrão fatorial típico está presente nas três primeiras colunas. Portanto pode-se observar que a propriedade de ortogonalidade é preservada para as três primeiras colunas. Por uma inspeção mais aprofundada, pode-se ver que o quarto fator também é ortogonal aos outros três.

Com 16 execuções em um fatorial completo de \(2^4\), 15 efeitos podem ser estimados além da média geral. Os 15 efeitos consistem em quatro efeitos principais, seis efeitos de interação de dois fatores, quatro interações de três fatores e uma interação de quatro fatores.

Em meia fração de um experimento de \(2^4\), entretanto, há apenas 8 execuções. Assim, apenas 7 efeitos podem ser estimados além da média geral. Ao escolher as execuções de um fatorial completo que possuem um valor constante para uma interação, perdemos automaticamente a capacidade de estimar o efeito da interação.

Estudando a metade direita da Tabela 6.2, também pode ser visto que os níveis dos fatores codificados ou coluna de sinais para \(X_D\) são exatamente o produto dos sinais nas três primeiras colunas, ou seja, \(X_D = X_A\times X_B\times X_C\). Isto significa que o efeito que podemos estimar para \(X_D\) será completamente obscurecido ou confundido pela interação de três fatores \(X_A\times X_B\times X_C\). Isso não é tudo.

Como será mostrado mais adiante, cada efeito e interação principal no plano é obscurecido ou confundido com uma outra interação. Este é o preço que pagamos pela execução de metade do número total de experimentos. Contudo, em experiências preliminares onde é incluído um grande número de factores para descobrir quais são realmente importantes, este pode não ser um preço sério a pagar.

Em experiências preliminares envolvendo um grande número de factores, normalmente apenas uma pequena proporção dos factores terá efeitos significativos. Este fato foi denominado princípio de esparsidade de efeitos por Box and Meyer (1986a).

Assim como dois planetas se alinharão com a Lua no céu noturno com mais frequência do que três planetas, os efeitos principais têm maior probabilidade de serem importantes do que as interações de dois fatores e as interações de dois fatores têm maior probabilidade de serem importantes do que as de três fatores e assim por diante.

Esta regra geral foi chamada de princípio de ordenação hierárquica por Wu and Hamada (2000). Portanto, se frações de experimentos fatoriais puderem ser planejadas de forma que os efeitos principais sejam confundidos com interações de três fatores e de ordem superior, a quantidade de informação perdida pelo fracionamento do número de execuções será pequena em comparação com o benefício de um número reduzido de corridas.

A forma como um fatorial fracionário de \(2^k\) é criado na prática é na verdade a ordem oposta do que foi mostrado acima. Em vez de começar com um fatorial completo e eliminar execuções para obter a fração desejada, comece com um fatorial completo contendo o número desejado de execuções e adicione fatores adicionais ao projeto. Por exemplo, para construir uma meia fração de um projeto \(2^k\), denotado por \(\frac{1}{2}2^k\) ou \(2^{k-1}\), o procedimento é o seguinte:

Escreva o projeto base, um plano fatorial completo em \(k-1\) fatores usando os níveis de fator codificados (−) e (+).
Adicione o \(k\)-ésimo fator ao experimento, tornando seus níveis de fator codificados iguais ao produto dos outros níveis de fator, ou seja, a interação de ordem mais alta.
Use essas \(k\) colunas para definir o projeto.

Uma lista completa de interações confundidas com cada efeito principal e interação em um fatorial semi-fracionário é chamada de padrão de confusão ou estrutura de alias do planejamento. Esta lista é fácil de construir com base na atribuição do \(k\)-ésimo fator no item 2 da lista acima.

Por exemplo, no experimento \(2^{4-1}\), se os níveis do quarto fator forem iguais ao produto dos níveis dos três primeiros fatores do experimento, escrevemos simbolicamente D = ABC. Isso é chamado de gerador do projeto.

Multiplicando em ambos os lados do gerador obtemos: \[ \mbox{D}^2= \mbox{ABCD} \] ou \[ \mbox{I} = \mbox{ABCD}, \] onde I representa uma coluna de sinais de mais e é a identidade multiplicativa para produtos elemento a elemento de colunas de níveis de fator codificados.

A equação, I = ABCD, é chamada de relação definidora para o planejamento fatorial fracionário, e multiplicando em ambos os lados desta equação, a interação confundida com qualquer efeito ou interação principal pode ser determinada.

Por exemplo, multiplicando pelo primeiro fator em ambos os lados da relação definidora, vemos: A(I) = A(ABCD) ou A= BCD. Isto significa que o efeito do primeiro fator A é confundido com a interação de três fatores BCD. Quando os dados são recolhidos, o efeito do factor A é estimado como a diferença na resposta média nos níveis alto e baixo do factor A.

Contudo, esse efeito realmente estima a soma dos efeitos do fator A e da interação de três fatores. Portanto, escrevemos como A + BCD. O padrão de alias ou confundimento completo para este projeto \(2^{4-1}\) pode ser determinado multiplicando a relação de definição por cada efeito principal e interação, resultando em: \[ \begin{array}{c} \mbox{I+ABCD}, \\ \mbox{A+BCD}, \\ \mbox{B+ACD}, \\ \mbox{C+ABD}, \\ \mbox{D+ABC}, \\ \mbox{AB + CD}, \\ \mbox{AC + BD}, \\ \mbox{AD + BC}\cdot \end{array} \]

Existem apenas oito resultados únicos neste padrão de alias, e eles representam os oito efeitos, sendo I a média geral, que podem ser estimados a partir do experimento fatorial fracionário de 8 execuções.

O padrão de alias também pode ser representado graficamente como um mapa de cores da matriz de correlação calculada a partir das colunas da matriz de projeto, como pode ser visto na Figura 6.1.

Figura 6.1: Mapa de cores de correlações.

Neste gráfico, a intensidade da cor em cada quadrado da grade representa a correlação entre as colunas da matriz de planejamento. Por exemplo, pode-se observar que o fator A tem uma correlação de 1 consigo mesmo e com a interação BCD e correlação zero com todos os outros fatores e interações.

Isso fornece as mesmas informações que o padrão de alias. Quando a correlação entre um fator e uma interação é 1, ambos não podem ser incluídos no modelo ajustados por mínimos quadrados ou causarão singularidades na matriz \(\pmb{X}^\top\pmb{X}\).

As réplicas não são incluídas em um planejamento fatorial meio fracionário porque as réplicas exigiriam tantos experimentos adicionais quanto seriam para completar o fatorial completo. Portanto, não há estimativa de \(\sigma^2\), a variância do erro experimental, ao executar um fatorial fracionário.

Para julgar a significância dos efeitos em um planejamento fatorial fracionário, métodos gráficos como os descritos na Seção 3.7.5 devem ser usados. Os efeitos considerados significativos devem ser interpretados tendo em mente o princípio da ordenação hierárquica. Por exemplo, se o efeito para B + ACD for considerado significativo, será assumido que representa o efeito do fator B em vez da interação de três vias.

A maneira mais fácil de criar um fatorial \(2^{k-1}\) no R é usar a função FrF2 no pacote R FrF2. O exemplo abaixo cria o projeto \(2^{5-1}\) de 16 execuções com gerador E = ABCD. Se o gerador for deixado desligado, FrF2 encontra um que seja ótimo no sentido que será descrito na Seção 6.4.

library(FrF2)
design = FrF2( 16, 5, generators = "ABCD", randomize = FALSE)
design

##     A  B  C  D  E
## 1  -1 -1 -1 -1  1
## 2   1 -1 -1 -1 -1
## 3  -1  1 -1 -1 -1
## 4   1  1 -1 -1  1
## 5  -1 -1  1 -1 -1
## 6   1 -1  1 -1  1
## 7  -1  1  1 -1  1
## 8   1  1  1 -1 -1
## 9  -1 -1 -1  1 -1
## 10  1 -1 -1  1  1
## 11 -1  1 -1  1  1
## 12  1  1 -1  1 -1
## 13 -1 -1  1  1  1
## 14  1 -1  1  1 -1
## 15 -1  1  1  1 -1
## 16  1  1  1  1  1
## class=design, type= FrF2.generators

Na prática, as combinações de tratamento devem ser aleatórias para as unidades experimentais e uma lista aleatória como a mostrada na Secção 3.4 deve ser utilizada.

Este delineamento é então chamado de delineamento fatorial fracionário completamente aleatório. O plano resultante do código acima está em ordem padrão (não randomizado), remova a opção randomize = FALSE para obter uma lista aleatória.

A função design.info(design) do pacote FrF2 imprimirá informações sobre um experimento criado anteriormente pela função FrF2, como o gerador, os nomes dos fatores, o padrão de confundimento, se há ou não réplicas e se a ordem foi aleatória.

O alias ou confundimento da função FrF2 apenas imprimirá a estrutura de alias para um projeto previamente construído. Esta função requer um vetor de resposta e \(y\), um vetor de números uniformes aleatórios foi usado no exemplo abaixo.

library(FrF2)
y = runif(16, 0, 1)
aliases( lm( y~ (.)^4, data = design))

##             
##  A = B:C:D:E
##  B = A:C:D:E
##  C = A:B:D:E
##  D = A:B:C:E
##  E = A:B:C:D
##  A:B = C:D:E
##  A:C = B:D:E
##  A:D = B:C:E
##  A:E = B:C:D
##  B:C = A:D:E
##  B:D = A:C:E
##  B:E = A:C:D
##  C:D = A:B:E
##  C:E = A:B:D
##  D:E = A:B:C

br>

Neste padrão de alias para o plano \(2^{5-1}\), pode-se ver que os efeitos principais são confundidos com interações de quatro vias e as interações de dois fatores são confundidas com interações de três fatores.

Portanto, se as interações de três e quatro fatores pudessem ser consideradas não significantes, poderiam ser feitas estimativas de todos os efeitos principais e das interações de dois fatores.

Para ilustrar a análise de um projeto \(2^{k−1}\), considere uma continuação do exemplo da mistura de sopa seca apresentado na Seção 5.4.3. Nesse exemplo, descobriu-se que a maior parte da variabilidade na sopa “intermix” ocorre dentro de um lote, e não entre lotes.

Os investigadores responsáveis pelo projecto fizeram uma lista de factores que consideraram que poderiam influenciar a variabilidade dentro de um lote (ver Hare, 1988). Estas eram opções que podiam ser alteradas no mixer onde um lote era mixado e o intermix era adicionado através das portas. A lista consistia em:

o número de portas onde o intermix foi adicionado,
a temperatura do misturador (que pode ser controlada adicionando água de resfriamento à camisa que o rodeia),
o tempo de mistura,
peso do lote, e
o tempo de atraso entre a mistura e o empacotamento.

A resposta ou variabilidade em todos os pesos da mistura foi obtida tomando-se cinco amostras consecutivas da mistura para sopa a cada 15 minutos enquanto o lote era embalado. Os rótulos e níveis dos fatores são mostrados na Tabela 6.3.

\[ \begin{array}{cccc}\hline \mbox{Tótulo do fator} & \mbox{Nome} & \mbox{Nível baixo} & \mbox{Nível alto} \\\hline \mbox{A} & \mbox{Número de portas} & 1 & 3 \\ \mbox{B} & \mbox{Temperatura} & \mbox{Água de refrigeração} & \mbox{Ambiente} \\ \mbox{C} & \mbox{Tempo de mistura} & 60 \mbox{seg.} & 80 \mbox{seg.} \\ \mbox{D} & \mbox{Peso do lote} & 1.500 \mbox{lb} & 2.000 \mbox{lb} \\ \mbox{E} & \mbox{Dias de atraso} & 7 & 1 \\\hline \end{array} \] Tabela 6.3: Fatores e níveis para experimento de mistura de sopa \(2^{5-1}\). Observação: lb significa a unidade de medida libra, 1 lb = 453.59237 gramas.

O tamanho normal do lote era de 2.000 lb e o tempo normal de mistura era de 60 segundos. Como esse experimento seria realizado em uma instalação de produção, tanto a equipe de pesquisa quanto a de produção tiveram que concordar com o plano.

O plano acordado foi o \(2^{5-1}\) guardado no objeto R design e a Tabela 6.4 mostra uma lista dos experimentos em níveis reais de fatores. A lista está na ordem padrão, com as ordens de execução aleatórias listadas na primeira coluna.

\[ \begin{array}{ccccccc}\hline & mbox{(A)} & \mbox{(B)} & \mbox{(C)} & \mbox{(D)} & \mbox{(E)} & \\ \mbox{Ordem} & \mbox{Número} & \mbox{Temperatura} & \mbox{Tempo de} & \mbox{Peso do} & \mbox{Atraso} & \mbox{Resposta} \\ \mbox{de execução} & \mbox{de} & & \mbox{mistura} & \mbox{lote} & \mbox{(dias)} & \widehat{\sigma}_p \\ \mbox{aleatória} & \mbox{portas} & & \mbox{(seg)} & \mbox{(lb)} & & \\\hline 12 & 1 & \mbox{Água Fria} & 60 & 1500 & 1 & 1.13 \\ 13 & 3 & \mbox{Água Fria} & 60 & 1500 & 7 & 1.25 \\ 5 & 1 & \mbox{Ambiente} & 60 & 1500 & 7 & 0.97 \\ 3 & 3 & \mbox{Ambiente} & 60 & 1500 & 1 & 1.70 \\ 6 & 1 & \mbox{Água Fria} & 80 & 1500 & 7 & 1.47 \\ 4 & 3 & \mbox{Água Fria} & 80 & 1500 & 1 & 1.28 \\ 16 & 1 & \mbox{Ambiente} & 80 & 1500 & 1 & 1.18 \\ 14 & 3 & \mbox{Ambiente} & 80 & 1500 & 7 & 0.98 \\ 1 & 1 & \mbox{Água Fria} & 60 & 2000 & 7 & 0.78 \\ 15 & 3 & \mbox{Água Fria} & 60 & 2000 & 1 & 1.36 \\ 7 & 1 & \mbox{Ambiente} & 60 & 2000 & 1 & 1.85 \\ 10 & 3 & \mbox{Ambiente} & 60 & 2000 & 7 & 0.62 \\ 11 & 1 & \mbox{Água Fria} & 80 & 2000 & 1 & 1.09 \\ 2 & 3 & \mbox{Água Fria} & 80 & 2000 & 7 & 1.10 \\ 9 & 1 & \mbox{Ambiente} & 80 & 2000 & 7 & 0.76 \\ 8 & 3 & \mbox{Ambiente} & 80 & 2000 & 1 & 2.10 \\\hline \end{array} \] Tabela 6.4: Experimento \(2^{5-1}\) para determinar quais fatores estão associados à variação de preenchimento em ordem aleatória.

Todos os níveis de fatores podiam ser alterados entre lotes com relativamente pouco esforço e a randomização não era um problema. A redução solicitada no peso do lote e o aumento no tempo de mistura para alguns lotes na lista planejada de experimentos não interfeririam seriamente no cronograma de produção se a lista fosse curta, mas retardariam a produção se um projeto de 32 execuções fosse usado. Por esta razão, o fatorial meio fracionário de 16 execuções foi acordado.

A unidade experimental deste experimento foi o lote de mistura de sopa desidratada colocada na batedeira. A resposta \(\widehat{\sigma}_p\) foi uma estimativa do desvio padrão do peso dentro de um lote, calculado a partir de um estudo de amostragem feito durante o empacotamento de cada lote.

O mesmo planejamento criado e guardado em design pode ser criado com nomes e níveis de fatores reais. No código R abaixo, isso é demonstrado junto com o uso da função add.response do pacote DoE.base para incluir a resposta.

Depois de adicionar a resposta, o modelo em mod1 foi ajustado aos dados do experimento de sopa usando a função R lm.

library(FrF2)
soup = FrF2(16, 5, generators = "ABCD", factor.names = list(Ports=c(1,3), 
    Temp=c("Cool","Ambient"), MixTime=c(60,80), BatchWt=c(1500,2000), delay=c(7,1)), randomize = FALSE)
y = c(1.13, 1.25, .97, 1.70, 1.47, 1.28, 1.18, .98, .78, 1.36, 1.85, .62, 1.09, 1.10, .76, 2.10 )
library(DoE.base)
soup = add.response( soup , y )
soup

##    Ports    Temp MixTime BatchWt delay    y
## 1      1    Cool      60    1500     1 1.13
## 2      3    Cool      60    1500     7 1.25
## 3      1 Ambient      60    1500     7 0.97
## 4      3 Ambient      60    1500     1 1.70
## 5      1    Cool      80    1500     7 1.47
## 6      3    Cool      80    1500     1 1.28
## 7      1 Ambient      80    1500     1 1.18
## 8      3 Ambient      80    1500     7 0.98
## 9      1    Cool      60    2000     7 0.78
## 10     3    Cool      60    2000     1 1.36
## 11     1 Ambient      60    2000     1 1.85
## 12     3 Ambient      60    2000     7 0.62
## 13     1    Cool      80    2000     1 1.09
## 14     3    Cool      80    2000     7 1.10
## 15     1 Ambient      80    2000     7 0.76
## 16     3 Ambient      80    2000     1 2.10
## class=design, type= FrF2.generators

mod1 = lm( y ~ (.)^2, data = soup)
summary(mod1)

## 
## Call:
## lm.default(formula = y ~ (.)^2, data = soup)
## 
## Residuals:
## ALL 16 residuals are 0: no residual degrees of freedom!
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)
## (Intercept)        1.22625        NaN     NaN      NaN
## Ports1             0.07250        NaN     NaN      NaN
## Temp1              0.04375        NaN     NaN      NaN
## MixTime1           0.01875        NaN     NaN      NaN
## BatchWt1          -0.01875        NaN     NaN      NaN
## delay1             0.23500        NaN     NaN      NaN
## Ports1:Temp1       0.00750        NaN     NaN      NaN
## Ports1:MixTime1    0.04750        NaN     NaN      NaN
## Ports1:BatchWt1    0.01500        NaN     NaN      NaN
## Ports1:delay1      0.07625        NaN     NaN      NaN
## Temp1:MixTime1    -0.03375        NaN     NaN      NaN
## Temp1:BatchWt1     0.08125        NaN     NaN      NaN
## Temp1:delay1       0.20250        NaN     NaN      NaN
## MixTime1:BatchWt1  0.03625        NaN     NaN      NaN
## MixTime1:delay1   -0.06750        NaN     NaN      NaN
## BatchWt1:delay1    0.15750        NaN     NaN      NaN
## 
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:    NaN 
## F-statistic:   NaN on 15 and 0 DF,  p-value: NA

A fórmula formula formula = y (.)^2 na chamada para a função lm faz com que ela se ajuste a um modelo saturado nos efeitos principais e nas interações de dois fatores. Como não há réplicas, um gráfico de probabilidade normal dos coeficientes de regressão foi utilizado para auxiliar no julgamento de quais efeitos são significativos.

Isto é o mesmo que foi feito na Seção 3.7.5, exceto que cada efeito neste modelo é confundido com uma outra interação. Portanto, apenas 15 efeitos podem ser estimados. No código abaixo, o conjunto de dados é recriado usando rótulos de fator codificados e a função LGB é usada para criar um gráfico de normalidade.

soupc = FrF2(16,5, generators="ABCD", randomize=FALSE)
soupc = add.response(soupc, y)
modc = lm(y~(.)^2, data=soupc)
library(daewr)
par(mar=c(4,4,1,1), pch =19)
LGB(coef(modc)[-1], rpt = FALSE)
grid()

Figura 6.2: Gráfico normal de efeitos do experimento de variabilidade de preenchimento.

Como pode ser visto no gráfico de efeitos mostrado na Figura 6.2, aparecem os efeitos principais E, tempo de atraso entre a mistura e embalagem, BE a interação entre temperatura e tempo de atraso e DE, a interação entre peso do lote e tempo de atraso, aparentam serem significativos.

Se a ordem hierárquica dos efeitos puder ser assumida, esta é a interpretação correta e as interações de três e quatro fatores podem ser consideradas não significativas.

delay = as.numeric(sub(-1, 7, soup$delay))
temp = soup$Temp
par(mar=c(4,4,1,1), pch =19)
interaction.plot(delay, temp, soup$y, type="b",pch=c(24,18,22), leg.bty="o",
                 main="Interaction Plot for Mixing Temperature by Delay time",
                 xlab="Delay Time (days)", ylab="Average S.D. Fill Weight")
grid()

Figura 6.3: Gráfico de interação para temperatura de mistura por tempo de atraso.

E = Tempo de atraso (Delay Time) tem um efeito positivo; isso normalmente significaria que aumentar o tempo de atraso entre a mistura e o empacotamento aumentaria a resposta ou a variação dentro do lote. No entanto, devido à atribuição não convencional de 7 ao nível baixo (codificado) do factor E e de 1 ao nível alto (codificado) na Tabela 6.3, na verdade diz-nos que, em média, o aumento do tempo de atraso entre a mistura e o empacotamento diminui o dentro da variabilidade do lote.

Dado que as interações BE e DE também parecem ser significativas, o efeito principal médio do fator E não conta toda a história. A Figura 6.3 mostra o gráfico de interação para Temperatura e Tempo de Atraso. Aqui pode ser visto que o Delay Time tem pouco efeito na variabilidade dentro do lote quando o misturador é resfriado com água de resfriamento durante a mistura. Contudo, a variabilidade dentro do lote diminui substancialmente aumentando o tempo de atraso entre a mistura e o empacotamento quando a mistura foi feita à temperatura ambiente.

#### Use of IAPlot function to create interacton plots  #############
######         like Figuers 6.3 and 6.4              ################
## Note Delay time axis is reversed from Figures 6.3 and 6.4 ########
## due to the way it is coded in Table 6.3 and the code on p 201 ####
library(FrF2)
par(mar=c(4,4,1,1), pch =19)
IAPlot(soup, sel=c(2,4,5), abbrev=7)
grid()

A Figura 6.4 mostra o gráfico de interação para Peso do Lote e Tempo de Atraso. Lá pode ser visto que aumentar o tempo de atraso entre a mistura e o empacotamento tem pouco efeito na variabilidade dentro de um lote para lotes pequenos (1.500 lb), enquanto aumentar o tempo de atraso entre a mistura e o empacotamento diminui a variabilidade dentro de um lote para lotes grandes (2.000 lb).

A função IAPlot no pacote R FrF2 também pode ser usada para criar vários gráficos de interação simultaneamente, conforme mostrado acima.

Com base nos resultados deste estudo, a variação mínima da mistura dentro de um lote poderia ser obtida usando o tamanho de lote maior (2.000 lb), a temperatura ambiente na mistura e um atraso de 7 dias entre a mistura e o empacotamento. Não respondeu a uma nova questão suscitada pelos resultados: será necessário um atraso total de 7 dias entre a mistura e o embalamento ou um atraso de 3 ou 4 dias poderá reduzir igualmente a variabilidade? Contudo, o pessoal de produção e investigação concordou que os resultados actuais faziam sentido, uma vez que a uniformidade da mistura está relacionada com a dureza do óleo vegetal, que é afectada pela temperatura e agitação. A equipe de produção implementou as condições ideais enquanto a pesquisa continuava investigando a nova questão.

É interessante pensar que nenhuma das interações teria sido detectada se experimentos de um fator de cada vez tivessem sido conduzidos, em vez do plano fatorial fracionário. As conclusões de experimentos do tipo um fator de cada vez podem não ser reproduzíveis porque não se perceberia que os efeitos ou a ausência de efeitos observados poderiam depender de outras configurações de fatores que são consideradas insignificantes.

BatchWt = ((as.numeric(soup$BatchWt)-1.5)/.5)*250+1750
par(mar=c(4,4,1,1), pch =19)
interaction.plot(delay, BatchWt, soup$y, type="b",pch=c(18,24,22), leg.bty="o",
                 main="Interaction Plot for Batch Weight by Delay time",
                 xlab="Delay Time (days)", ylab="Average S.D. Fill Weight")
grid()

Figura 6.4: Gráfico de interação para peso do lote por tempo de atraso.

6.3 Frações de terceira ordem e superiores de projetos \(2^k\)

Em projetos \(2^{k-1}\), apenas metade das execuções experimentais são realizadas e cada efeito que pode ser estimado é confundido com uma interação. Da mesma forma, em um projeto de um quarto de fração \(2^{k−2}\), apenas um quarto das execuções experimentais do projeto \(2^k\) completo são executadas e cada efeito que pode ser estimado é confundido com três outras interações.

Numa fração de um oitavo, apenas um oitavo das execuções no fatorial completo é feito e cada efeito estimado será confundido com outras sete interações e assim por diante. Esses projetos podem parecer confusos à primeira vista devido ao grande número de efeitos confundidos com cada efeito estimável.

No entanto, eles são usados com bastante frequência na prática e, seguindo o princípio da dispersão de efeitos e o princípio da ordenação hierárquica, conclusões úteis geralmente podem ser alcançadas após apenas uma fração do total de execuções necessárias para um fatorial completo.

Para construir um quarto de fração de um experimento \(2^k\), comece com um experimento base em \(2^{k−2}\) fatores, depois adicione dois fatores tornando seus níveis de fator codificados iguais a duas interações entre as primeiras \(k−2\) colunas, conforme ilustrado a seguir.

Existem dois geradores para o projeto criado acima, D = AB e E = AC. A partir destes pode-se ver que I = ABD e I = ACE. Além disso, como \(\mbox{I}^2 = \mbox{I}\), uma terceira igualdade, chamada interação generalizada, é I = ABD(ACE) ou I = BCDE.

A combinação das três equações obtidas dos dois geradores e da interação generalizada resulta na relação definidora para o projeto I = ABD = ACE = BCDE. O padrão confuso, ou estrutura de alias, para o design é encontrado multiplicando-se a relação definidora por cada efeito que pode ser estimado: \[ \begin{array}{c} \mbox{A+BD + CE + ABCDE}, \\ \mbox{B+AD + ABCE + CDE}, \\ \mbox{C+ABCD + AE + BDE}, \\ \mbox{D+AB + ACDE + BCE}, \\ \mbox{E+ABDE + AC +BCD}, \\ \mbox{BC + ACD + ABE+ DE}, \\ \mbox{BE+ADE + ABC +CD}\cdot \end{array} \]

A construção de frações de um oitavo e superiores é semelhante. Para construir uma fração de um oitavo de um projeto \(2^6\) ou projeto \(2^{6-3}\), comece com um projeto base em 6 - 3 = 3 fatores e, em seguida, adicione três fatores adicionais, confundindo-os com interações.

Por exemplo, se escolhermos os geradores D = AB, E = AC e F = BC, o código R usando FrF2 abaixo poderia ser usado para gerar o projeto.

library(FrF2)
frac = FrF2( 8, 6, generators = c("AB", "AC", "BC"))
frac

##    A  B  C  D  E  F
## 1 -1 -1 -1  1  1  1
## 2 -1  1 -1 -1  1 -1
## 3 -1  1  1 -1 -1  1
## 4 -1 -1  1  1 -1 -1
## 5  1 -1 -1 -1 -1  1
## 6  1  1 -1  1 -1 -1
## 7  1  1  1  1  1  1
## 8  1 -1  1 -1  1 -1
## class=design, type= FrF2.generators

Existem oito execuções neste projeto e sete efeitos além da média geral que podem ser estimados. Cada efeito terá o alias de sete interações. Para descobrir quais interações estão associadas a cada efeito que pode ser estimado, primeiro encontre a relação definidora.

Dos geradores I = ABD = ACE = BCF. As interações generalizadas de dois fatores são ABD(ACE) = BCDE, ABD(BCF) = ACDF e ACE(BCF) = ABEF. A interação generalizada de três fatores é ABD(ACE)(BCF) = DEF. Combinando as equações encontradas nos geradores e nas interações generalizadas a relação definidora é: \[ \mbox{I = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF}\cdot \]

Multiplicando a relação de definição pelos efeitos principais (A - F) e pela interação de três fatores (ABC), podem ser determinados os aliases para os sete efeitos que podem ser estimados. Uma maneira rápida de fazer isso em R é usar a função aliases no pacote FrF2 conforme mostrado anteriormente.

6.4 Critérios para escolha de geradores para projetos \(2^{k-p}\)

Há mais de uma alternativa ao selecionar os geradores para um projeto \(2^{k−p}\). Por exemplo, para criar um quarto de fração de um projeto \(2^6\), os geradores E = ABC e F = ABD poderiam ser usados ou os geradores E = AB e F = ACD poderiam ser usados.

A primeira seleção resulta na definição da relação e da estrutura de alias, apenas para os efeitos principais, mostrada abaixo: \[ \begin{array}{c} \mbox{I=ABCE=ABDF=CDEF}, \\ \mbox{A+BCE + BDF + ACDEF}, \\ \mbox{B+ACE + ADF + BCDEF}, \\ \mbox{C+ABE + ABCFE + DEF}, \\ \mbox{D+ABCDE + ABF +CEF}, \\ \mbox{E + ABC + ABDEF+ CDF}, \\ \mbox{F+ABCEF + ABD +CDE}\cdot \end{array} \]

O segundo conjunto de geradores resulta na definição da relação e da estrutura de alias (apenas para os efeitos principais) abaixo: \[ \begin{array}{c} \mbox{I=ABE=ACDF=BCDEF}, \\ \mbox{A+BE + CDF + ABCDEF}, \\ \mbox{B+AE + ABCDF + CDEF}, \\ \mbox{C+ABCE + ADF + BDEF}, \\ \mbox{D+ABDE + ABF +CEF}, \\ \mbox{E + ABC + ACF+ ABEF}, \\ \mbox{F+ABEF + ACD +BCDE}\cdot \end{array} \]

Ambos os geradores resultam em fatoriais fracionários de 16 execuções, mas o primeiro conjunto de geradores pode ser preferível, uma vez que cada efeito principal é confundido com interações de três fatores e interações de ordem superior, enquanto o uso do segundo conjunto de geradores resulta em um projeto onde os efeitos principais A e B são confundidos com uma interação de dois fatores cada.

O primeiro projeto tem menos chances de confusão, uma vez que o princípio da ordenação hierárquica nos diz que as interações de três fatores têm menos probabilidade de serem importantes do que as interações de dois fatores.

Três critérios gerais foram propostos para orientar a escolha entre os vários conjuntos possíveis de geradores para qualquer projeto \(2^{k-p}\). Esses critérios são os critérios de resolução, os critérios de aberração e os critérios de efeitos claros.

Box and Hunter (1961) propuseram pela primeira vez os critérios de resolução. A resolução do desenho é definida como o comprimento da palavra mais curta na relação de definição. Por exemplo, na primeira relação de definição para um projeto \(2^{6-2}\) mostrada acima, a palavra mais curta tem comprimento 4. Portanto, é um projeto de resolução IV. A palavra mais curta para a segunda relação de definição para um projeto \(2^{6-2}\) mostrado acima tem comprimento 3 e é, portanto, um projeto de resolução III. Em geral, se o número de execuções em dois desenhos for o mesmo, o desenho com a resolução mais alta é preferido.

Em um projeto de resolução \(R\), nenhum efeito envolvendo \(i\) fatores é confundido com efeitos de ordem menor que \(R − i\). Por exemplo, em projetos com resolução V, os efeitos principais são alias com interações de quatro fatores e interações de ordem superior e as interações de dois fatores são alias com interações de três fatores e interações de ordem superior. Portanto, se todas as interações de três fatores e de ordem superior puderem ser consideradas insignificantes, todos os efeitos principais e interações de dois fatores poderão ser estimados a partir de um projeto de resolução V. Em projetos de resolução IV, os efeitos principais são associados a interações de três fatores e de ordem superior.

Enquanto em um projeto de resolução III, os efeitos principais são confundidos com interações de dois fatores. Os projetos de Resolução III são normalmente usados apenas em experimentos de triagem onde o objetivo é descobrir quais fatores são importantes o suficiente para serem estudados posteriormente em experimentos de acompanhamento.

A propriedade projetiva de um fatorial fracionário é outro atributo que pode ser determinado a partir de sua resolução. Em um projeto de resolução \(R\), qualquer subconjunto de \(k = R − 1\) fatores formará um projeto completo de \(2^k\), com possível replicação de algumas execuções.

Portanto, se um experimento for iniciado com um planejamento fatorial fracionário de resolução \(R\) e apenas \(R − 1\) dos fatores parecerem significativos, então os dados poderão ser reanalisados incluindo apenas os \(R − 1\) fatores significativos. Como o projeto desses fatores é um fatorial completo, podem ser examinadas interações de todas as ordens possíveis entre os \(R-1\) fatores.

Quando dois ou mais projetos, criados com diferentes conjuntos de geradores, têm o mesmo número de execuções e a mesma resolução, Fries and Hunter (1980) propuseram outro critério para decidir qual projeto é preferível. Eles chamaram esse critério de critério de aberração mínima. Se o número de palavras de comprimento \(r\) na relação definidora de um projeto for definido como \(A_r\), então um projeto \(d_1\) é considerado como tendo menos aberração do que um projeto \(d_2\) se \(r\) for o menor número inteiro tal que \(A_r(d_1)\neq A_r(d_2)\) e \(A_r(d_1) <A_r(d_2)\).

Por exemplo, se \(d_1\) é um projeto de resolução IV \(2^{7-2}\) criado com os geradores F = ABCD e G = ABCE, ele tem menos aberração que o projeto \(d_2\), criado com os geradores F = ABC e G = ADE, já que a relação definidora para \(d_1\), I = ABCDF = ABCEG = DEFG possui apenas uma palavra de comprimento 4, enquanto a relação definidora para \(d_2\), I = ABCF = ADEG = BCDEFG, possui duas palavras de comprimento 4.

Para qualquer \(k\) e \(p\) há sempre um projeto de aberração mínima \(2^{k-p}\) que tem menos aberração do que qualquer outro projeto \(2^{k-p}\). Para dois projetos da mesma resolução, o projeto de aberração mínima terá menos confusão de efeitos principais com interações de ordem baixa e é geralmente preferido.

Um critério final que é útil na seleção dos geradores para um projeto \(2^{k-p}\) é o número de efeitos claros. Chen et al. (1993) definem um efeito como claro se nenhum de seus apelidos forem efeitos principais ou interações de dois fatores. Em alguns casos, um planejamento que não seja o desenho de aberração mínima pode ter efeitos mais claros do que o desenho de aberração mínima.

Por exemplo, Wu and Hamada (2000) explicam que o plano \(2^{6-2}\) com relação definidora I = ABCE = ABDF = CDEF tem todos os seis efeitos principais claros, enquanto o design \(2^{6-2}\) com relação definidora I = ABE = ACDF = BCDEF tem três efeitos principais C, D e F que são eliminados junto com seis interações de dois fatores BC, BD, BF, CE, DE e EF.

Nos casos em que se acredita que algumas interações de dois fatores sejam importantes a priori, o segundo projeto pode ser preferido ao primeiro. A Tabela 4A de Wu and Hamada (2000) lista os geradores para o projeto de aberração mínima e o projeto com o número máximo de efeitos claros, se diferentes, para projetos de 8 a 64 execuções.

A função FrF2 no pacote R FrF2 pode criar planos de aberração mínima. Se o usuário não especificar geradores ao chamar FrF2, como no exemplo da Seção 6.3, FrF2 seleciona automaticamente o conjunto de geradores que resultará em um projeto de aberração mínima.

O código a continuação cria o projeto de aberração mínima \(2^{8-4}\) e as funções generators e aliases mostram os geradores e o padrão de alias para o projeto criado por FrF2.

library(FrF2)
des1 = FrF2( 16, 8 )
y = runif( 16, 0, 1 )
library(DoE.base)
generators(des1)

## $generators
## [1] "E=ABC" "F=ABD" "G=ACD" "H=BCD"

aliases( lm( y ~ (.)^3, data = des1) )

##                                                           
##  A = B:C:E = B:D:F = B:G:H = C:D:G = C:F:H = D:E:H = E:F:G
##  B = A:C:E = A:D:F = A:G:H = C:D:H = C:F:G = D:E:G = E:F:H
##  C = A:B:E = A:D:G = A:F:H = B:D:H = B:F:G = D:E:F = E:G:H
##  D = A:B:F = A:C:G = A:E:H = B:C:H = B:E:G = C:E:F = F:G:H
##  E = A:B:C = A:D:H = A:F:G = B:D:G = B:F:H = C:D:F = C:G:H
##  F = A:B:D = A:C:H = A:E:G = B:C:G = B:E:H = C:D:E = D:G:H
##  G = A:B:H = A:C:D = A:E:F = B:C:F = B:D:E = C:E:H = D:F:H
##  H = A:B:G = A:C:F = A:D:E = B:C:D = B:E:F = C:E:G = D:F:G
##  A:B = C:E = D:F = G:H                                    
##  A:C = B:E = D:G = F:H                                    
##  A:D = B:F = C:G = E:H                                    
##  A:E = B:C = D:H = F:G                                    
##  A:F = B:D = C:H = E:G                                    
##  A:G = B:H = C:D = E:F                                    
##  A:H = B:G = C:F = D:E

A função FrF2 também pode criar planos experimentais com o número máximo de efeitos claros. Por exemplo, a chamada FrF2(32,9) produz o plano de aberração mínima \(2^{9-4}\) que tem nove efeitos principais claros e oito interações claras de dois fatores. No entanto, a chamada FrF2(32,9, MaxC2 = TRUE) produz um plano \(2^{9-4}\) que tem todos os nove efeitos principais e 15 interações claras de dois fatores.

Considere o seguinte exemplo de projeto e análise de um fatorial fracionário \(2^{8-4}\). Almeidae Silva et al. (1998) conduziram um experimento para encontrar as condições ideais para o cultivo de Paecilomyces variotii, um fungo comumente encontrado no ar e nos solos de países tropicais, em hidrolisado hemicelulósico de eucalipto com o objetivo de produzir proteína microbiana.

Apenas 51.6% da massa seca total da madeira de eucalipto é aproveitada pela indústria brasileira, enquanto o restante: galhos, folhas, pequenas árvores, etc. fica no campo. A fração hemicelulose desses resíduos pode ser facilmente removida por tratamento ácido e o hidrolisado resultante é rico em açúcares fermentáveis. O fungo P. variotii foi selecionado dentre 21 espécies de leveduras e fungos filamentosos por seu desempenho sobre hidrolisado de hemicelulose de eucalipto. A biomassa proteica produzida por esse fungo durante 72 horas de fermentação possui perfil de aminoácidos igual ou superior aos produtos convencionais utilizados na alimentação animal.

O objetivo dos experimentos foi estudar a influência de inibidores, nutrientes e tempo de fermentação no crescimento da biomassa produzida por P. variotii. A Tabela 6.5 a seguir mostra os fatores e níveis que deveriam ser estudados.

\[ \begin{array}{cccc}\hline \mbox{Rótulo} & \mbox{Fatores} & \mbox{Nível -} & \mbox{Nível +} \\\hline \mbox{A} & \mbox{Inibidores: furfural e ácido acético} & \mbox{1.25g/L} & \mbox{7.8g/L} \\ \mbox{B} & \mbox{Farelo de arroz} & \mbox{10.0g/L} & \mbox{30.0g/L} \\ \mbox{C} & \mbox{Uréia} & \mbox{0.0g/L} & \mbox{2.0g/L} \\ \mbox{D} & \mbox{Sulfato de magnésio} & \mbox{0.0g/L} & \mbox{1.5g/L} \\ \mbox{E} & \mbox{Sulfato de amônia} & \mbox{0.0g/L} & \mbox{2.0g/L} \\ \mbox{F} & \mbox{Nitrato de potássio} & \mbox{0.0g/L} & \mbox{2.0g/L} \\ \mbox{G} & \mbox{Fosfato de sódio} & \mbox{0.0g/L} & \mbox{2.0g/L} \\ \mbox{H} & \mbox{Tempo de fermentação} & \mbox{72 horas} & \mbox{96 horas} \\\hline \end{array} \] Tabela 6.5: Fatores e níveis para experimento de biomassa.

Foi utilizado um planejamento fatorial fracionário \(2^{8-4}\) com geradores E = BCD, F = ACD, G = ABC e H = ABD. Este é o design IV de resolução de aberração mínima e os efeitos claros neste plano fatorial são os oito efeitos principais.

Existem também sete cadeias de alias de interações de dois fatores, mostradas abaixo, que podem ser estimadas.

\[ \mbox{CG + DH + AB + EF} \\ \mbox{AC + BG + DF + EH} \\ \mbox{CF + AD + EG + BH} \\ \mbox{CH + DG + AE + BF} \\ \mbox{CD + GH + AF + BE} \\ \mbox{BC + AG + DE + FH} \\ \mbox{CE + FG + AH + BD} \]

O plano criado por FrF2 é mostrado a continuação junto com os dados resultantes.

library(FrF2)
culture = FrF2( 16, generators = c("BCD", "ACD", "ABC", "ABD"), randomize = FALSE)
y1 = c(5.75, 6.7, 11.12, 10.67, 4.92, 5.35, 2.81, 10.83, 
       6.08, 7.27, 9.68, 4.2, 3.9, 3.78, 11.57, 7.39 )
culture = add.response( culture, y1 )
culture

##     A  B  C  D  E  F  G  H    y1
## 1  -1 -1 -1 -1 -1 -1 -1 -1  5.75
## 2   1 -1 -1 -1 -1  1  1  1  6.70
## 3  -1  1 -1 -1  1 -1  1  1 11.12
## 4   1  1 -1 -1  1  1 -1 -1 10.67
## 5  -1 -1  1 -1  1  1  1 -1  4.92
## 6   1 -1  1 -1  1 -1 -1  1  5.35
## 7  -1  1  1 -1 -1  1 -1  1  2.81
## 8   1  1  1 -1 -1 -1  1 -1 10.83
## 9  -1 -1 -1  1  1  1 -1  1  6.08
## 10  1 -1 -1  1  1 -1  1 -1  7.27
## 11 -1  1 -1  1 -1  1  1 -1  9.68
## 12  1  1 -1  1 -1 -1 -1  1  4.20
## 13 -1 -1  1  1 -1 -1  1  1  3.90
## 14  1 -1  1  1 -1  1 -1 -1  3.78
## 15 -1  1  1  1  1 -1 -1 -1 11.57
## 16  1  1  1  1  1  1  1  1  7.39
## class=design, type= FrF2.generators

A função R lm é usada para ajustar um modelo aos dados. O código e os resultados são mostrados a seguir. A fórmula formula = y (.)^2 na chamada para a função lm faz com que ela se ajuste a um modelo saturado nos efeitos principais e nas interações de dois fatores.

No entanto, neste exemplo existem 28 interações de dois fatores, mas apenas sete delas são estimáveis, uma vez que são confundidas em cadeias de quatro interações. A função lm estima todas as interações de dois fatores com A, ou seja, AB, AC, AD, AE, AF, AG e AH. As estimativas para as interações restantes de dois fatores são rotuladas como NA na saída. Referindo-se às sequências de interações de dois fatores com alias, pode-se ver que AB na verdade representa CG + DH + AB + EF e assim por diante.

modf = lm( y1 ~ (.)^2, data = culture)
summary(modf)

## 
## Call:
## lm.default(formula = y1 ~ (.)^2, data = culture)
## 
## Residuals:
## ALL 16 residuals are 0: no residual degrees of freedom!
## 
## Coefficients: (21 not defined because of singularities)
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)  7.00125        NaN     NaN      NaN
## A1           0.02250        NaN     NaN      NaN
## B1           1.53250        NaN     NaN      NaN
## C1          -0.68250        NaN     NaN      NaN
## D1          -0.26750        NaN     NaN      NaN
## E1           1.04500        NaN     NaN      NaN
## F1          -0.49750        NaN     NaN      NaN
## G1           0.72500        NaN     NaN      NaN
## H1          -1.05750        NaN     NaN      NaN
## A1:B1       -0.28375        NaN     NaN      NaN
## A1:C1        0.49625        NaN     NaN      NaN
## A1:D1       -1.09625        NaN     NaN      NaN
## A1:E1       -0.39875        NaN     NaN      NaN
## A1:F1        0.60875        NaN     NaN      NaN
## A1:G1        0.29875        NaN     NaN      NaN
## A1:H1       -0.05625        NaN     NaN      NaN
## B1:C1             NA         NA      NA       NA
## B1:D1             NA         NA      NA       NA
## B1:E1             NA         NA      NA       NA
## B1:F1             NA         NA      NA       NA
## B1:G1             NA         NA      NA       NA
## B1:H1             NA         NA      NA       NA
## C1:D1             NA         NA      NA       NA
## C1:E1             NA         NA      NA       NA
## C1:F1             NA         NA      NA       NA
## C1:G1             NA         NA      NA       NA
## C1:H1             NA         NA      NA       NA
## D1:E1             NA         NA      NA       NA
## D1:F1             NA         NA      NA       NA
## D1:G1             NA         NA      NA       NA
## D1:H1             NA         NA      NA       NA
## E1:F1             NA         NA      NA       NA
## E1:G1             NA         NA      NA       NA
## E1:H1             NA         NA      NA       NA
## F1:G1             NA         NA      NA       NA
## F1:H1             NA         NA      NA       NA
## G1:H1             NA         NA      NA       NA
## 
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:    NaN 
## F-statistic:   NaN on 15 and 0 DF,  p-value: NA

A Figura 6.5 mostra um gráfico seminormal de efeitos produzidos pela função halfnorm no pacote daewr. Neste gráfico, não há efeitos que estejam obviamente acima da linha de pontos no canto superior direito do gráfico.

No entanto, os investigadores sentiram que o aumento de três vezes na biomassa produzida na corrida 15, em comparação com a corrida 14, foi causado por algo diferente da variação aleatória nas unidades experimentais. Os principais efeitos para farelo de arroz B, sulfato de amônio E, tempo de fermentação H e a cadeia confusa de interações CF + AD + EG + BH são maiores em valor absoluto e estão nas caudas da distribuição normal dos efeitos estimados.

Se as interações de três fatores forem consideradas não significativas, os efeitos dos três efeitos principais poderiam ser interpretados como a causa dos grandes efeitos, mas não estava claro o que representa a série de interações confusas de dois fatores.

library(daewr)
cfs = coef(modf)[2:16]
names = names(cfs)
par(mar=c(4,4,1,1))
halfnorm(cfs, names, alpha = .25, refline = FALSE)

## zscore= 0.0417893 0.1256613 0.2104284 0.2967378 0.3853205 0.4770404 0.5729675 0.6744898 0.7835004 0.9027348 1.036433 1.191816 1.382994 1.644854 2.128045effp= 0.0225 0.05625 0.2675 0.28375 0.29875 0.39875 0.49625 0.4975 0.60875 0.6825 0.725 1.045 1.0575 1.09625 1.5325

grid()

Figura 6.5: Gráfico meio normal de efeitos do experimento de cultura de \(2^{8-4}\) Paecilomyces variotii.

Os autores do artigo sentiram que a experiência lhes tinha dado provas de que o factor A (o inibidor) tinha pouco efeito, e confirmaram isto citando outros relatórios publicados. Eles também sentiram que o experimento mostrou que os efeitos principais D (sulfato de magnésio) e F (nitrito de potássio) eram insignificantes.

No entanto, devido à confusão das interacções de dois factores com o segundo maior efeito (em valor absoluto) e ao facto de nada se destacar claramente no gráfico semi-normal dos efeitos, não foi possível tirar conclusões definitivas. Eles decidiram realizar outro experimento de acompanhamento de resolução V 25-1 usando os fatores B, C, E, G e H com relação definidora I = BCEGH e os fatores A, D e F mantidos constantes no ponto médio dos níveis usado no primeiro experimento.

Este foi um projeto de 16 execuções, mas se pudesse ser assumido com segurança que os efeitos principais A, D e F foram insignificantes no primeiro conjunto de dezesseis experimentos, então oito das dezesseis execuções para o projeto de acompanhamento proposto já foram concluídas .

O design 25-1 criado por FrF2 é mostrado na próxima página junto com os dados resultantes. As execuções de número 3, 4, 7, 8, 11, 12, 15 e 16 já foram concluídas no projeto 28-4 como execuções 14, 7, 6, 15, 13, 8, 12 e 16, respectivamente.

Os oito experimentos restantes foram concluídos em ordem aleatória para obter os resultados mostrados. Como este projeto tem resolução V, todos os efeitos principais e interações de dois fatores são claros e podem ser estimados se as interações de três fatores e de ordem superior puderem ser consideradas insignificantes.

culture2 = FrF2( 16, 5, factor.names = c("B", "C", "E", "G", " H"), randomize = FALSE)
y = c(3.37, 3.55, 3.78, 2.81, 5.53, 10.43, 5.35, 11.57, 2.93, 
      7.23, 3.9, 10.83, 11.69, 10.59, 4.92, 7.39)
culture2 = add.response( culture2, y )
culture2

##     B  C  E  G X.H     y
## 1  -1 -1 -1 -1   1  3.37
## 2   1 -1 -1 -1  -1  3.55
## 3  -1  1 -1 -1  -1  3.78
## 4   1  1 -1 -1   1  2.81
## 5  -1 -1  1 -1  -1  5.53
## 6   1 -1  1 -1   1 10.43
## 7  -1  1  1 -1   1  5.35
## 8   1  1  1 -1  -1 11.57
## 9  -1 -1 -1  1  -1  2.93
## 10  1 -1 -1  1   1  7.23
## 11 -1  1 -1  1   1  3.90
## 12  1  1 -1  1  -1 10.83
## 13 -1 -1  1  1   1 11.69
## 14  1 -1  1  1  -1 10.59
## 15 -1  1  1  1  -1  4.92
## 16  1  1  1  1   1  7.39
## class=design, type= FrF2

A Figura 6.6 mostra o gráfico semi-normal dos efeitos do desenho de acompanhamento. Os resultados deste experimento de acompanhamento sugerem que os efeitos principais, B-Farelo de Arroz, G-Fosfato de Sódio e E-Sulfato de Amônio junto com as interações CH (Uréia × Tempo de Fermentação) e BH (Farelo de Arroz × Tempo de fermentação) e CE ( Ureia × Sulfato de Amônio) parecem ser significativos. Dado que existem interações, os principais efeitos não devem ser interpretados isoladamente.

culture2 = cbind(culture2,y)
moda = lm(y ~ (.)^2, data = culture2)
library(daewr)
cfs = coef(moda)[2:16]
effects = cfs
names = names(cfs)
par(mar=c(4,4,1,1))
halfnorm(cfs, names, alpha = .219, refline = FALSE)

## zscore= 0.0417893 0.1256613 0.2104284 0.2967378 0.3853205 0.4770404 0.5729675 0.6744898 0.7835004 0.9027348 1.036433 1.191816 1.382994 1.644854 2.128045effp= 0.2608264 0.8827166 1.059571 1.059766 1.33376 1.626148 2.043366 3.06417 3.215274 3.349244 4.324001 4.557049 4.719495 6.968871 22.56349

grid()

Figura 6.6: Gráfico meio normal de efeitos do experimento \(2^{5-1}\) de cultura de Paecilomyces variotii.

A Figura 6.7 mostra o gráfico de interação BH. Mostra como o efeito do tempo de fermentação depende do nível de farelo de arroz. Quando há apenas 10 g/L de farelo de arroz no meio de crescimento, pode-se observar que aumentar o tempo de fermentação de 72 para 96 horas aumenta a biomassa produzida. No entanto, se houver 30 g/L de farelo de arroz no meio de crescimento, aumentar o tempo de fermentação na verdade diminui a biomassa produzida.

RiceBran = 10*((as.numeric(culture2$B)-1.5 ) / .5) + 20
FermTime = 12*((as.numeric(culture2$X.H)-1.5) / .5) + 84
par(mar=c(4,4,1,1))
interaction.plot(FermTime, RiceBran, culture2$y, type = "b", pch=c(18,24,22), leg.bty="o",
                 main="Interaction Plot for Fermentation Time and Level of Rice Bran",
                 xlab = "Fermentation Time(hrs)", ylab = "Biomass")
grid()

Figura 6.7: Gráfico de interação para o tempo de fermentação do farelo de arroz.

A Figura 6.8 mostra o gráfico de interação CE. Mostra que o efeito do sulfato de amônio na produção de biomassa depende do nível de uréia. Aqui pode ser visto que aumentar o nível de sulfato de amônio de 0,0 para 2,0 g/L causa um aumento maior na biomassa quando não há uréia adicionada aos nutrientes do que quando 2,0 g/L de uréia são adicionados aos nutrientes. A biomassa máxima ocorre quando há 2 g/L de sulfato de amônio e nenhuma uréia adicionada aos nutrientes.

6.5 Aumentando fatoriais fracionários

O último exemplo introduziu a ideia de aumentar projetos fatoriais fracionários com experimentos adicionais. Às vezes, isso consiste em um simples experimento de confirmação para validar a previsão de um modelo.

Noutros casos, podem ser realizadas experiências adicionais para confundir certos efeitos ou interações principais e aumentar as probabilidades de descobrir o modelo correto. Nesta seção serão descritos alguns procedimentos formais que permitem que isso seja feito. A Seção 6.5.1 descreve procedimentos que preservarão a propriedade de ortogonalidade ótima do projeto aumentado. A Seção 6.5.2 descreve um procedimento que reduz o número de experimentos adicionais, mas não preserva a ortogonalidade

6.5.1 Aumentando por dobramento ou planejamento de imagem espelhada

Em um planejamento fatorial fracionário de resolução III, os efeitos principais são confundidos com algumas interações de dois fatores. Se mais de um efeito parecer significativo após a análise dos dados de um projeto de resolução III, não está claro se todos os efeitos são devidos aos efeitos principais ou se alguns poderiam ser interações de dois fatores.

6.5.2 Aumentando por planejamento ideal

Na notação matricial o modelo com os termos (F, B, A, AD e CF), de a última seção, e o experimento de 16 passagens mostrado na Tabela 6.8 pode ser escrito como:

6.6 Plackett-Burman (PB) e projetos de triagem robusta modelo

Os projetos fatoriais fracionários da Resolução III 2k-p são frequentemente usados para experimentos de triagem onde o objetivo é determinar quais fatores (de uma lista montada por brainstorming) são importantes o suficiente para serem estudados com mais detalhes em experimentos de acompanhamento. No entanto, o número de execuções em um experimento fatorial fracionário 2k-p é sempre uma potência de 2, ou seja, 8, 16, 32, etc., e essas escolhas limitadas para o tamanho da execução podem ser restritivas em experimentos de triagem.

Por exemplo, para examinar 8 fatores são necessários pelo menos 16 experimentos, e para examinar 16 fatores são necessários 32 experimentos ao usar um experimento fatorial fracionário. Os designs da Resolução III Plackett e Burman (1946), ou designs PB, estão disponíveis em tamanhos de execução múltiplos de 4, ou seja, 8, 12, 16, 20, etc.

Esses projetos foram originalmente descobertos por dois estatísticos britânicos durante a Segunda Guerra Mundial, enquanto estudavam o efeito de uma série de fatores no desempenho de protótipos de fusíveis de proximidade antiaéreos. Assim como os experimentos fatoriais fracionários 2k − p, esses experimentos têm dois níveis para cada fator; e para tamanhos de execução que são potências de 2, eles são iguais a um projeto 2k − p.

Para outros tamanhos de execução, eles mantêm a propriedade desejável de ortogonalidade dos projetos 2k − p, mas não possuem geradores ou uma relação definidora. Os experimentos para tamanhos de execução de 12, 20 e 24 podem ser criados girando ciclicamente os níveis de fator para a primeira execução. A Tabela 6.9 mostra os níveis dos fatores para a primeira execução nesses experimentos.

6.7 Fatoriais de níveis mistos e matrizes ortogonais

Na fase preliminar de experimentação, onde o objetivo pode ser determinar quais fatores são importantes a partir de uma longa lista de candidatos, projetos fatoriais fracionários de dois níveis ou projetos de Plackett-Burman são frequentemente apropriados.

Se um fator tiver níveis quantitativos, os dois níveis são denotados simbolicamente por (-) e (+), onde (-) representa o nível mais baixo que o experimentador consideraria e (+) representa o nível mais alto que o experimentador consideraria.

Os altos e baixos são geralmente espalhados tanto quanto possível, a fim de acentuar o sinal ou a diferença na resposta entre os dois níveis. Se um fator tem níveis qualitativos, as designações (-) e (+) são arbitrárias, mas os dois níveis escolhidos normalmente seriam aqueles que o experimentador acredita que deveriam resultar na diferença máxima na resposta.

6.8 Projetos de triagem definitiva

Jones e Nachtsheim (2011) e Jones e Nachtsheim (2013) propuseram uma nova classe de designs de triagem que chamaram de Projetos de Triagem De nitivos ou DSDs.

No primeiro artigo eles propuseram desenhos de triagem para fatores de três níveis que seriam úteis para acessar possíveis relações curvilíneas com fatores quantitativos. Nestes projetos, os efeitos principais lineares são imparciais por efeitos quadráticos e lineares por interações lineares, e nenhuma interação quadrática ou linear por linear é completamente confundida com qualquer outra.

Os projetos de triagem definitiva de três níveis são muito eficientes e requerem apenas 2k + 1 execuções para k fatores. No segundo artigo, Jones e Nachtsheim (2013) propuseram DSDs com colunas aumentadas que podem lidar com fatores quantitativos de três níveis mais uma série de fatores de dois níveis. Esses designs ainda são definitivos no sentido de que os efeitos principais não são influenciados pelos efeitos de segunda ordem.

A função DefScreen no pacote daewr recupera DSDs de um catálogo conforme mostrado no exemplo abaixo. Na chamada para DefScreen o primeiro argumento m é o número de fatores de três níveis e o segundo argumento c é o número de fatores de dois níveis.

6.9 Exercícios

1- Considere um experimento fatorial fracional \(2^{3−1}\).
1. Modifique a chamada da função FrF2 na Seção 6.2 para criar uma lista das execuções no projeto.
2. Determine a relação definidora.
3. Determine o padrão de alias completo.
4. Examine a estrutura do alias usando FrF2.
2- Melo and cols. (2007) utilizaram um planejamento fatorial fracional \(2^{4-1}\) com gerador D = ABC para estudar os fatores que influenciam a produção de levan por fermentação aeróbica utilizando a levedura Zymomonas mobilis. Levan é um polímero de açúcar do grupo dos frutanos, que demonstrou ter atividade antitumoral contra sarcoma e carcinoma de Ehrlich em camundongos albinos suíços. Os fatores variaram no meio de fermentação e seus níveis são mostrados na tabela abaixo.

\[ \begin{array}{clcc}\hline & & \mbox{Níveis} \\ \mbox{Rótulo} & \mbox{Fator} & - & + \\\hline \mbox{A} & \mbox{Concentração inicial de sacarose (g.L}^{−1}\mbox{)} & 150 & 250 \\ \mbox{B} & \mbox{Temperatura (}^\circ \mbox{C)} & 20 & 30 \\ \mbox{C} & \mbox{Concentração inicial de extrato de levedura (g.L}^{−1}\mbox{)} & 2.0 & 5.0 \\ \mbox{D} & \mbox{Agitação (rpm)} & 50 & 100 \\\hline \end{array} \]
1. Qual é a relação definidora e a estrutura de alias completa para este projeto?
2. Qual é a resolução deste projeto?
3. As fermentações foram realizadas em lotes em frascos de pirex. Após 72 horas de fermentação, o levan produzido foi extraído do meio fermentado e seu peso seco foi determinado. Os resultados (em g.L\(^{-1}\)) para os oito experimentos, em ordem padrão, foram: 4.70, 14.67, 1.71, 3.73, 9.47, 7.61, 0.15, 4.78. A partir desses dados, calcule os sete efeitos e faça um gráfico normal de probabilidade para determinar o que é significativo.
4. Exclua os três menores efeitos e ajuste o modelo novamente. Os quatro efeitos restantes no modelo são significativos?
5. Com base no princípio da hereditariedade do efeito, o que você acha que a sequência significativa de interações de dois fatores com alias poderia representar?
6. O experimento pode ser reduzido a um fatorial completo ignorando fatores não significativos?
7. Com base no que você disse em (e) escreva uma interpretação dos efeitos significativos e da interação. Com base no seu modelo, determine os níveis de fator que produzirão o peso seco máximo de levan.
3- Use FrF2 para criar um projeto de um quarto de fração \(2^{5−2}\).
1. Use a função design.info para examinar os aliases e determinar os geradores usados por FrF2 para criar o projeto.
2. Determine a relação definidora.
3. Verifique se a estrutura de alias para este projeto pode ser obtida a partir da relação de definição que você encontrou em (b).
4. Suponha que, após a análise dos dados desta experiência, dois efeitos principais A e D pareçam ser significativos. Devido à confusão entre os efeitos principais e as interações de dois fatores, interpretar os resultados como significando que estes dois efeitos principais são os únicos efeitos significativos podem ser enganosos. Usando o princípio da hereditariedade do efeito, sugira dois modelos alternativos plausíveis que poderiam explicar os dados.
5. Liste os experimentos em uma fração dobrável que você poderia usar para aumentar os oito experimentos originais, a fim de remover o confundimento entre os efeitos principais e as interações de dois fatores.
4- Erhardt (2007) realizou um experimento fatorial fracionário \(2^{8−4}\) para determinar os fatores que afetam o tempo de voo de helicópteros de papel. O projeto padrão é mostrado na Figura 6.19 abaixo com todas as dimensões em centímetros. Os fatores e níveis (em centímetros) que ele estudou estão apresentados na tabela abaixo. O nível baixo de gramatura do papel era o papel de páginas brancas da lista telefônica e o nível alto era o papel de cópia padrão. A direção de dobra foi contra (oposta) ou com a direção de rotação.

Figura 6.19: Projeto padrão de helicóptero de papel.

\[ \begin{array}{clcc}\hline & & \mbox{Níveis} \\ \mbox{Rótulo} & \mbox{Fator} & - & + \\\hline \mbox{A} & \mbox{Comprimento do rotor} & 5.5 & 11.5 \\ \mbox{B} & \mbox{Largura do rotor} & 3.0 & 5.0 \\ \mbox{C} & \mbox{Comprimento do corpo} & 1.5 & 5.5 \\ \mbox{D} & \mbox{Comprimento do pé} & 0;0 & 2;5 \\ \mbox{E} & \mbox{Comprimento da dobra} & 5.0 & 11.0 \\ \mbox{F} & \mbox{Largura da dobra} & 1.5 & 2.5 \\ \mbox{G} & \mbox{Peso do papel} & \mbox{Página da lista telefônica} & \mbox{Papel de cópia} \\ \mbox{H} & \mbox{Dobre na direção} & \mbox{Contra} & \mbox{Com} \\\hline \end{array} \]
1. O que você recomendaria para os geradores de projeto \(2^{8−4}\)?
2. Crie o projeto recomendado em (a) e randomize a ordem das execuções. Qual é a unidade experimental?
3. Liste os aliases, até interações de três fatores, para os 15 efeitos que podem ser estimados.
4. Realize os experimentos construindo os helicópteros e cronometrando-os com um cronômetro.
5. Calcule os efeitos ou coeficientes de regressão e faça um gráfico semi-normal dos efeitos.
6. Usando o princípio da hereditariedade do efeito, tente determinar o que representam quaisquer cadeias de interações de dois fatores com alias, que parecem significativas em seu gráfico.
7. Quais fatores você incluiria em um projeto de acompanhamento para determinar a combinação de níveis de fatores que produz o tempo de voo ideal?
5- Crie um projeto IV 27−3 usando FrF2 com geradores E = ABC, F = ABD, G = ACD.
1. Determine a relação definidora para este projeto.
2. Determine as cadeias confusas de interações de dois fatores que podem ser estimadas a partir deste projeto.
3. Suponha que após a análise dos dados deste experimento, os efeitos significativos pareçam ser B, BC +AE +FG e BE +AC +DG. O que fração de dobramento que você recomendaria para determinar quais interações específicas estão fazendo com que as duas sequências de interações confusas pareçam significativas?
4. Liste os experimentos na fração dobrável que você recomenda na parte (c).
6- Considere o experimento para estudar os fatores que afetam a porcentagem de remoção de arsênico da água potável usando um filtro de areia revestido de ferro.
1. Modifique o código R na Seção 6.5.1 para produzir o projeto mostrado na Tabela 6.8.
2. Determine a relação definidora para os experimentos no primeiro bloco e mostre a confusão dos efeitos principais com cadeias de interações de dois fatores.
3. Calcule os efeitos e faça um gráfico semi-normal deles usando apenas os dados do bloco 1 da Tabela 6.8.
4. Determine a relação definidora para os experimentos combinados.
5. Calcule os efeitos, incluindo o efeito de bloco, e faça um gráfico semi-normal deles usando todos os dados da Tabela 6.8. Que interações são confundidas com o efeito de bloqueio?
7- Olsen et al. (2014) realizaram um fatorial fracionário 210-6 III de 16 execuções em 10 fatores rotulados A, B, C, D, E, F, G, H, J e K. O objetivo era identificar fatores na síntese de um Suporte de catalisador anatase modificado que afeta as propriedades nais. Os geradores para o projeto foram E = ABCD, F = BCD, G = ACD, H = CD, J = ABD e K = ABC. As propriedades de resposta medidas nos suportes catalíticos resultantes foram Área de Superfície, Diâmetro de Poro e Volume de Poro. O objetivo final era identificar fatores que permitiriam aos pesquisadores sintetizar suportes de catalisador com diferentes diâmetros de poros, mantendo a área superficial e o volume de poros tão grandes quanto possível. Os dados para as três respostas são mostrados em ordem padrão na tabela abaixo.
1. Calcule um conjunto saturado de efeitos para cada uma das três respostas e determine os aliases de até duas interações de fatores para cada efeito calculado.
2. Use métodos gráficos para determinar os efeitos importantes.
3. É possível tirar alguma conclusão? O que você recomenda que seja feito a seguir?