Verificar se as populações de Botucatu e Curitiba diferem para para um conjunto de variáveis relacionado aos hábitos e histórico das pacientes. As variáveis a serem analisadas são:
Para análise gráfica dos resultados, serão utilizados gráficos de mosaico para as respostas categóricas nominais e ordinais. Para as variáveis métricas será utilizado o histograma e o gráfico de distribuição relativa acumulada empírica.
Nas variáveis categórias, o teste chi-quadrado será empregado para testar a hipótese de independência da distribuição de frequência da resposta com relação à localidade. Para as variáveis métricas será utilizado do teste de Kolmogorov-Smirnov. Em algumas situações, pode haver uma má aproximação para aplicação dos testes mas que poderá ser resolvida no futuro. O conjunto de gráficos e testes de hipótese tem caráter exploratório.
library(gdata)
# Lê as tabelas de dados da planilha eletrônica.
da <- read.xls("estatistica.xlsx",
sheet = 1,
header = TRUE,
encoding = "latin1",
stringsAsFactors = FALSE,
check.names = TRUE)
db <- read.xls("estatistica.xlsx",
sheet = 2,
header = TRUE,
encoding = "latin1",
stringsAsFactors = FALSE,
check.names = TRUE)
# Cria coluna com o nome das localidades.
da$loc <- "Curitiba"
db$loc <- "Botucatu"
# Obtém as colunas comuns às duas localidades.
cm <- intersect(names(da), names(db))
# Junta as duas localidades em uma tabela só.
dx <- rbind(da[, cm], db[, cm])
# Corrige os nomes.
names(dx) <- gsub("[^[:alnum:]]", "", tolower(names(dx)))
# Remove colunas vazias.
i <- sapply(dx, class)
dx[, i == "logical"] <- NULL
# Remove variáveis de sigilo.
dx$nome <- NULL
dx$matricula <- NULL
# Estrutura da tabela de dados.
str(dx)
## 'data.frame': 228 obs. of 56 variables:
## $ noid : chr "C1" "C2" "C3" "C4" ...
## $ datacoleta : chr "2014-02-04" "2014-02-04" "2014-02-04" "2014-02-04" ...
## $ nugent : int 2 3 0 0 0 1 0 0 1 0 ...
## $ candida : int 0 0 0 0 0 0 0 0 0 0 ...
## $ resideem : chr "u" "u" "u" "u" ...
## $ idade : int 46 30 40 45 47 25 32 24 17 41 ...
## $ peso : num 60 61 64 69 52 48 62 65 46 64 ...
## $ altura : num 1.54 1.5 1.61 1.63 1.6 1.6 1.51 1.62 1.6 1.52 ...
## $ estadocivil : chr "u" "u" "u" "u" ...
## $ cor : chr "n" "b" "n" "b" ...
## $ escolaridade : int 4 11 9 7 6 11 15 7 9 9 ...
## $ atividaderemunerada: int 1 1 0 0 1 1 1 0 0 1 ...
## $ leitequeijo : int 1 1 1 1 1 1 1 1 1 1 ...
## $ frequencia : int 2 0 2 2 2 1 2 2 2 2 ...
## $ mamaooutros : int 1 1 1 1 1 1 1 1 1 1 ...
## $ frequencia1 : int 2 1 0 0 0 1 1 2 2 2 ...
## $ fumante : int 1 0 1 0 0 0 0 1 0 0 ...
## $ nrcigarrosdia : int 8 NA 15 NA NA NA NA 3 NA NA ...
## $ alcool : int 1 1 0 0 1 0 1 0 0 1 ...
## $ frequenciasem : int 0 0 NA NA 0 NA 0 NA NA 0 ...
## $ drogas : int 0 0 0 0 0 0 1 0 0 0 ...
## $ qual : chr "" "" "" "" ...
## $ ducha : int 0 0 0 1 0 0 0 1 0 0 ...
## $ frequencia2 : int NA NA NA 1 NA NA NA 2 NA NA ...
## $ sabonete : int 0 1 0 0 0 0 1 0 1 1 ...
## $ frequencia3 : int NA 1 NA NA NA NA 2 NA 2 2 ...
## $ outroshabitos : chr "" "" "prot diario" "" ...
## $ dataum : chr "2014-01-20" "2014-01-20" "2013-12-25" "2013-11-01" ...
## $ historiavb : int 1 1 1 0 1 0 0 0 0 1 ...
## $ nrepisodiostto : chr ">2" "2" ">10" "" ...
## $ historiadst : int 1 0 0 0 1 0 0 1 1 0 ...
## $ qual1 : chr "sifilis" "" "" "" ...
## $ nrrssem : chr "1" "3" "<1" "2" ...
## $ parceirosano : chr "1" "1" "1" "1" ...
## $ parceirorecente : int 0 0 0 0 0 0 0 0 0 0 ...
## $ atc4meses : int 0 0 0 1 0 0 1 1 1 1 ...
## $ tipo : chr "" "" "" "aco" ...
## $ camisinha : int 0 1 1 1 0 1 0 0 1 1 ...
## $ frequencia4 : int NA 2 2 2 NA 2 NA NA 2 1 ...
## $ paridade : int 1 1 1 1 1 1 1 1 0 1 ...
## $ complanteriores : int 1 1 0 0 1 1 1 0 NA 0 ...
## $ qual2 : chr "morte fetal 7m" "a/e" "" "" ...
## $ sangrato : int 1 0 1 1 1 1 0 0 0 0 ...
## $ dorrs : int 1 1 1 0 1 0 0 1 0 0 ...
## $ frequencia5 : int 0 0 2 NA 0 NA NA 1 NA NA ...
## $ corrimento : int 1 0 1 0 0 0 0 0 1 0 ...
## $ odor : int 0 0 1 0 0 0 0 0 1 0 ...
## $ prurido : int 0 0 0 0 0 0 0 0 1 0 ...
## $ ph : num 4.7 4.4 5 4.7 4.4 4.4 5.8 5 4 4.4 ...
## $ whiff : int 0 0 0 0 0 0 2 2 2 2 ...
## $ jec : int -1 0 -1 0 0 0 -1 0 -1 0 ...
## $ vulvite : int 0 0 0 0 0 0 0 0 1 0 ...
## $ outrosachados : chr "" "" "cisto parede vag" "" ...
## $ pcrchlamydia : int 0 0 0 0 0 0 0 0 1 1 ...
## $ pcrneisseria : int 0 0 0 0 0 0 0 0 0 0 ...
## $ loc : chr "Curitiba" "Curitiba" "Curitiba" "Curitiba" ...
library(latticeExtra)
# Nugent.
br <- with(dx, seq(min(nugent, na.rm = TRUE),
max(nugent, na.rm = TRUE) + 1,
by = 1) - 0.5)
histogram(~nugent | loc,
data = dx,
breaks = br,
ylab = "Porcentagem",
xlab = "Nugent")
Figura 1: Histograma para a distribuição da variável nugent em cada localidade.
ecdfplot(~nugent,
groups = loc,
auto.key = TRUE,
data = dx,
ylab = "Frequência relativa acumulada",
xlab = "Nugent")
Figura 2: Gráfico de distribuição relativa acumulada da variável nugent para cada localidade.
s <- split(dx$nugent, f = dx$loc)
ks.test(s[[1]], s[[2]])
##
## Two-sample Kolmogorov-Smirnov test
##
## data: s[[1]] and s[[2]]
## D = 0.40416, p-value = 2.092e-08
## alternative hypothesis: two-sided
# Candida.
xt <- xtabs(~loc + candida, data = dx)
addmargins(xt)
## candida
## loc 0 1 Sum
## Botucatu 97 16 113
## Curitiba 108 4 112
## Sum 205 20 225
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Candida")
Figura 3: Gráfico de mosaico para ocorrência de candida por localidade.
# Teste chi-quadrado para independência.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 6.5335, df = 1, p-value = 0.01059
# Ducha e a sua frequencia (coluna seguinte).
i <- agrep("^ducha", names(dx)) + 0:1
summary(dx[, i])
## ducha frequencia2
## Min. :0.0000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.:0.0000
## Median :0.0000 Median :0.0000
## Mean :0.1681 Mean :0.7632
## 3rd Qu.:0.0000 3rd Qu.:2.0000
## Max. :1.0000 Max. :2.0000
## NA's :2 NA's :190
# Renomeia as variáveis.
names(dx)[i] <- paste0(c("", "freq."),
names(dx)[i][1])
xt <- xtabs(~loc + ducha, data = dx)
addmargins(xt)
## ducha
## loc 0 1 Sum
## Botucatu 96 17 113
## Curitiba 92 21 113
## Sum 188 38 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Ducha")
Figura 4: Gráfico de mosaico para uso de ducha vaginal por localidade.
# Teste chi-quadrado para independência.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 0.28471, df = 1, p-value = 0.5936
i <- match(x = dx$freq.ducha, table = 0:2)
dx$freq.ducha <- c("1-2", "3-6", "7")[i]
i <- is.na(dx$freq.ducha)
dx$freq.ducha[i] <- dx$ducha[i]
xt <- xtabs(~loc + freq.ducha, data = dx)
addmargins(xt)
## freq.ducha
## loc 0 1-2 3-6 7 Sum
## Botucatu 96 11 4 2 113
## Curitiba 92 9 3 9 113
## Sum 188 20 7 11 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Frequência semanal da ducha")
Figura 5: Gráfico de mosaico para o número semanal de duchas por localidade.
# Teste chi-quadrado para independência.
chisq.test(xt)
##
## Pearson's Chi-squared test
##
## data: xt
## X-squared = 4.8825, df = 3, p-value = 0.1806
# Sabonete e a sua frequência.
i <- agrep("^sabonete", names(dx)) + 0:1
summary(dx[, i])
## sabonete frequencia3
## Min. :0.0000 Min. :0.000
## 1st Qu.:0.0000 1st Qu.:1.000
## Median :0.0000 Median :2.000
## Mean :0.4159 Mean :1.378
## 3rd Qu.:1.0000 3rd Qu.:2.000
## Max. :1.0000 Max. :2.000
## NA's :2 NA's :138
# Renomeia as variáveis.
names(dx)[i] <- paste0(c("", "freq."),
names(dx)[i][1])
xt <- xtabs(~loc + sabonete, data = dx)
addmargins(xt)
## sabonete
## loc 0 1 Sum
## Botucatu 80 33 113
## Curitiba 52 61 113
## Sum 132 94 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Uso de sabonete")
Figura 6: Gráfico de mosaico para uso de sabonete por localidade.
# Teste chi-quadrado para independência.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 13.278, df = 1, p-value = 0.0002685
i <- match(x = dx$freq.sabonete, table = 0:2)
dx$freq.sabonete <- c("1-2", "3-6", "7")[i]
i <- is.na(dx$freq.sabonete)
dx$freq.sabonete[i] <- dx$sabonete[i]
xt <- xtabs(~loc + freq.sabonete, data = dx)
addmargins(xt)
## freq.sabonete
## loc 0 1 1-2 3-6 7 Sum
## Botucatu 80 3 6 4 20 113
## Curitiba 52 1 14 12 34 113
## Sum 132 4 20 16 54 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Frequência semanal de uso de sabonente íntimo")
Figura 7: Gráfico de mosaico para frequencia semanal de uso de sabonente íntimo por localidade.
# Teste chi-quadrado para independência.
chisq.test(xt)
##
## Pearson's Chi-squared test
##
## data: xt
## X-squared = 17.769, df = 4, p-value = 0.001369
# História de VB.
xt <- xtabs(~loc + historiavb, dx)
addmargins(xt)
## historiavb
## loc 0 1 Sum
## Botucatu 62 51 113
## Curitiba 49 64 113
## Sum 111 115 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Histórico de VB")
Figura 8: Gráfico de mosaico para histórico de VB por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 2.5495, df = 1, p-value = 0.1103
# Número de episódios tratatos de VB.
i <- agrep("episodios", names(dx))
table(dx[, i - 0:1])
names(dx)[i]
mosaicplot(xtabs(~loc + nrepisodiostto, dx))
xt <- xtabs(~loc + historiadst, dx)
addmargins(xt)
## historiadst
## loc 0 1 Sum
## Botucatu 103 10 113
## Curitiba 62 51 113
## Sum 165 61 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Histórico de DST")
Figura 9: Gráfico de mosaico para histórico de DST por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 35.926, df = 1, p-value = 2.049e-09
# nr de rs/sem
i <- agrep("rssem", names(dx))
table(dx[, i])
##
## 0 1 <1 10 2 3 4 5 7
## 1 36 50 11 1 56 40 22 2 8
l <- unique(sort(dx[, i]))
n <- as.integer(gsub("\\D", "", l))
j <- grepl("<", l) * -0.1
dx[, i] <- factor(dx[, i], levels = l[order(n + j)])
# mosaicplot(xtabs(~loc + nrrssem, dx))
# Aglutinando classes para reduzir baixas frequências.
levels(dx[, i]) <- rep(c("0-1", "2-4", ">4", ""),
c(3, 3, 3, 1))
xt <- xtabs(~loc + nrrssem, dx)
addmargins(xt)
## nrrssem
## loc 0-1 2-4 >4 Sum
## Botucatu 35 70 8 0 113
## Curitiba 62 48 3 1 114
## Sum 97 118 11 1 227
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Número de relações sexuais por semana")
Figura 10: Gráfico de mosaico para o número de relações sexuais por semana por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test
##
## data: xt
## X-squared = 14.886, df = 3, p-value = 0.001917
# parceiros/ano
i <- agrep("parceiros", names(dx))
summary(dx[, i])
## parceirosano parceirorecente
## Length:228 Min. :0.0000
## Class :character 1st Qu.:0.0000
## Mode :character Median :0.0000
## Mean :0.1593
## 3rd Qu.:0.0000
## Max. :1.0000
## NA's :2
l <- unique(sort(dx$parceirosano))
n <- as.integer(gsub("\\D", "", l))
j <- grepl("<", l) * -0.1 + grepl(">", l) * 0.1
xt <- xtabs(~loc + parceirosano, dx)
addmargins(xt)
## parceirosano
## loc 0 1 2 >2 3 Sum
## Botucatu 0 2 101 8 0 2 113
## Curitiba 2 8 97 5 2 0 114
## Sum 2 10 198 13 2 2 227
dx$parceirosano <- factor(dx$parceirosano, levels = l[order(n + j)])
# mosaicplot(xt,
# main = NA,
# xlab = "Localidade",
# ylab = "Número de parceiros por ano")
# Aglutinando classes para reduzir baixas frequências.
levels(dx$parceirosano) <- rep(c("0", "1", ">1", ""),
c(1, 1, 3, 1))
xt <- xtabs(~loc + parceirosano, dx)
addmargins(xt)
## parceirosano
## loc 0 1 >1 Sum
## Botucatu 2 101 10 0 113
## Curitiba 8 97 7 2 114
## Sum 10 198 17 2 227
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Número de parceiros por ano")
Figura 11: Gráfico de mosaico para o número de parceiros ao ano por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test
##
## data: xt
## X-squared = 6.2059, df = 3, p-value = 0.102
xt <- xtabs(~loc + parceirorecente, dx)
addmargins(xt)
## parceirorecente
## loc 0 1 Sum
## Botucatu 92 21 113
## Curitiba 98 15 113
## Sum 190 36 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Parceiro novo nos últimos 2 meses")
Figura 12: Gráfico de mosaico para parceiro novo nos últimos 2 meses por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 0.82602, df = 1, p-value = 0.3634
# ATC/4 meses.
i <- agrep("atc4", names(dx))
summary(dx[, i])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0000 0.0000 1.0000 0.5265 1.0000 1.0000 2
xt <- xtabs(~loc + atc4meses, dx)
addmargins(xt)
## atc4meses
## loc 0 1 Sum
## Botucatu 62 51 113
## Curitiba 45 68 113
## Sum 107 119 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Uso de métodos contraceptivos 4 meses antes")
Figura 13: Gráfico de mosaico para ATC/4 meses por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 4.5438, df = 1, p-value = 0.03304
# tipo
i <- agrep("tipo", names(dx))
table(dx[, i])
##
## aci aco
## 109 23 96
xt <- xtabs(~loc + tipo, dx)
addmargins(xt)
## tipo
## loc aci aco Sum
## Botucatu 63 16 35 114
## Curitiba 46 7 61 114
## Sum 109 23 96 228
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Tipo")
Figura 14: Gráfico de mosaico para tipo por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test
##
## data: xt
## X-squared = 13.215, df = 2, p-value = 0.00135
# camisinha
i <- agrep("camisinha", names(dx)) + 0:1
summary(dx[, i])
## camisinha frequencia4
## Min. :0.0000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:1.000
## Median :0.0000 Median :2.000
## Mean :0.3319 Mean :1.597
## 3rd Qu.:1.0000 3rd Qu.:2.000
## Max. :1.0000 Max. :2.000
## NA's :2 NA's :156
names(dx)[i[2]] <- "freq.camisinha"
xt <- xtabs(~loc + camisinha, dx)
addmargins(xt)
## camisinha
## loc 0 1 Sum
## Botucatu 79 34 113
## Curitiba 72 41 113
## Sum 151 75 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Camisinha")
Figura 15: Gráfico de mosaico para uso de camisinha por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 0.71841, df = 1, p-value = 0.3967
xt <- xtabs(~loc + freq.camisinha, dx)
addmargins(xt)
## freq.camisinha
## loc 1 2 Sum
## Botucatu 14 20 34
## Curitiba 15 23 38
## Sum 29 43 72
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Frequencia no uso de camisinha")
Figura 16: Gráfico de mosaico para frequência uso de camisinha por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 2.9444e-31, df = 1, p-value = 1
# Sangramento no ato sexual.
i <- agrep("sangra", names(dx))
summary(dx[, i])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0000 0.0000 0.0000 0.1903 0.0000 1.0000 2
# names(dx)[i]
xt <- xtabs(~loc + freq.camisinha, dx)
addmargins(xt)
## freq.camisinha
## loc 1 2 Sum
## Botucatu 14 20 34
## Curitiba 15 23 38
## Sum 29 43 72
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Sangramento do ato sexual")
Figura 3: Gráfico de mosaico para ocorrência de candida por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 2.9444e-31, df = 1, p-value = 1
# dor/rs
i <- agrep("dorrs", names(dx)) + 0:1
summary(dx[, i])
## dorrs frequencia5
## Min. :0.0000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.:0.0000
## Median :0.0000 Median :1.0000
## Mean :0.4115 Mean :0.8602
## 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :1.0000 Max. :2.0000
## NA's :2 NA's :135
names(dx)[i[2]] <- "freq.dorrs"
xt <- xtabs(~loc + dorrs, dx)
addmargins(xt)
## dorrs
## loc 0 1 Sum
## Botucatu 61 52 113
## Curitiba 72 41 113
## Sum 133 93 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Dor na relação sexual")
Figura 17: Gráfico de mosaico para dor na relação sexual por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 1.8271, df = 1, p-value = 0.1765
# corrimento
i <- agrep("corrimento", names(dx))
summary(dx[, i])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0000 0.0000 0.0000 0.3894 1.0000 1.0000 2
# names(dx)[i]
xt <- xtabs(~loc + corrimento, dx)
addmargins(xt)
## corrimento
## loc 0 1 Sum
## Botucatu 61 52 113
## Curitiba 77 36 113
## Sum 138 88 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Corrimento vaginal")
Figura 18: Gráfico de mosaico para corrimento vaginal por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 4.1873, df = 1, p-value = 0.04073
# odor
i <- agrep("^odor", names(dx))
summary(dx[, i])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0000 0.0000 0.0000 0.2301 0.0000 1.0000 2
# names(dx)[i]
xt <- xtabs(~loc + odor, dx)
addmargins(xt)
## odor
## loc 0 1 Sum
## Botucatu 81 32 113
## Curitiba 93 20 113
## Sum 174 52 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Odor")
Figura 19: Gráfico de mosaico para odor por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 3.0223, df = 1, p-value = 0.08213
# prurido
i <- agrep("prurido", names(dx))
summary(dx[, i])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0000 0.0000 0.0000 0.1726 0.0000 1.0000 2
# names(dx)[i]
xt <- xtabs(~loc + prurido, dx)
addmargins(xt)
## prurido
## loc 0 1 Sum
## Botucatu 91 22 113
## Curitiba 96 17 113
## Sum 187 39 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Prurido")
Figura 20: Gráfico de mosaico para prurido por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test with Yates' continuity
## correction
##
## data: xt
## X-squared = 0.49582, df = 1, p-value = 0.4813
histogram(~ph | loc,
data = dx,
ylab = "Porcentagem",
xlab = "pH")
Figura 21: Histograma para a distribuição da variável pH em cada localidade.
ecdfplot(~ph,
groups = loc,
auto.key = TRUE,
data = dx,
ylab = "Frequência relativa acumulada",
xlab = "Nugent")
Figura 22: Gráfico de distribuição relativa acumulada da variável pH para cada localidade.
s <- split(dx$ph, f = dx$loc)
ks.test(s[[1]], s[[2]])
##
## Two-sample Kolmogorov-Smirnov test
##
## data: s[[1]] and s[[2]]
## D = 0.31858, p-value = 2.09e-05
## alternative hypothesis: two-sided
# Whiff test
i <- agrep("whiff", names(dx))
summary(dx[, i])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 1.000 1.022 2.000 2.000 2
# names(dx)[i]
xt <- xtabs(~loc + whiff, dx)
addmargins(xt)
## whiff
## loc 0 1 2 Sum
## Botucatu 42 32 39 113
## Curitiba 52 1 60 113
## Sum 94 33 99 226
mosaicplot(xt,
main = NA,
xlab = "Localidade",
ylab = "Teste de Whiff")
Figura 23: Gráfico de mosaico para uso de camisinha por localidade.
chisq.test(xt)
##
## Pearson's Chi-squared test
##
## data: xt
## X-squared = 34.64, df = 2, p-value = 3.007e-08
sessionInfo()
## R version 3.3.3 (2017-03-06)
## Platform: x86_64-pc-linux-gnu (64-bit)
## Running under: Ubuntu 16.04.2 LTS
##
## locale:
## [1] LC_CTYPE=pt_BR.UTF-8 LC_NUMERIC=C
## [3] LC_TIME=pt_BR.UTF-8 LC_COLLATE=en_US.UTF-8
## [5] LC_MONETARY=pt_BR.UTF-8 LC_MESSAGES=en_US.UTF-8
## [7] LC_PAPER=pt_BR.UTF-8 LC_NAME=C
## [9] LC_ADDRESS=C LC_TELEPHONE=C
## [11] LC_MEASUREMENT=pt_BR.UTF-8 LC_IDENTIFICATION=C
##
## attached base packages:
## [1] stats graphics grDevices utils datasets base
##
## other attached packages:
## [1] gdata_2.17.0 captioner_2.2.3 latticeExtra_0.6-28
## [4] RColorBrewer_1.1-2 lattice_0.20-35 rmarkdown_1.3
## [7] knitr_1.15.1
##
## loaded via a namespace (and not attached):
## [1] Rcpp_0.12.9 gtools_3.5.0 digest_0.6.12 rprojroot_1.2
## [5] grid_3.3.3 backports_1.0.5 magrittr_1.5 evaluate_0.10
## [9] highr_0.6 stringi_1.1.2 tools_3.3.3 stringr_1.2.0
## [13] yaml_2.1.14 htmltools_0.3.5 methods_3.3.3