Estatística

Distribuição de Frequência

Número total de dados (n)(n) Classe (i)(i) Número total de classes (k)(k) Limites de Classe

  • (li)(l_i) inferior

  • (Li)(L_i) superior

Determinar Número de Classes (k)(k) n50nn \leq 50 \rightarrow \sqrt n n>501+3,322lognn > 50 \rightarrow 1 + 3,322 * \log n

Amplitude do Intervalo de Classe (hi)(h_i) arredondar p/ + hi=Lilih_i = L_i-l_i

Amplitude Total(AT)(AT) delta entre maior e menor valor da amostra AT=L(max)l(min)AT = L(max) - l(min)

Amplitude Amostral (AA)(AA) delta entre maior e menor valor das classes AT=x(max)x(min)AT = x(max) - x(min)

Ponto Médio (xi)(x_i) xi=li+Li2\Large x_i = \frac{l_i+L_i}{2}

Tipos de Frequência

Frequência Simples/Absoluta (fi)(f_i) i=1kfi=n\large \displaystyle\sum_{i=1} ^{k} f_i = n

kk - último elemento a ser somado ii - primeiro elemento a ser somado fif_i - nome dos termos a serem somados

Frequência Relativa (fri)(%)(fr_i)(\%) fri=fin(100)\large fr_i = \frac{fi}{n}(·100)

Frequência Acumulada (Fac)(Fac) Fack=f1+f2+f3+...+fkFac_k = f_1 + f_2 + f_3 + ... + f_k

Frequência Acumulada Relativa (Frac)(%)(Frac)(\%) Fraci=Facn\large Frac_i = \frac{Fac}{n}


Medidas de Posição

Média Aritmética (xˉ)(\bar x)

xˉ=xin\Large \bar x = \frac{\sum x_i}{n}

  • Desvio em relação a média (di)(d_i) di=xixˉ\Large d_i = x_i - \bar x

Dados Agrupados

a) Sem intervalo de classe

xˉ=xifin\Large \bar x = \frac{\sum x_i f_i}{n}

Exemplo:

xix_i

fif_i

xifix_i f_i

0

2

0

1

6

6

2

10

20

3

12

36

4

4

16

Σ=34\Sigma = 34

Σ=78\Sigma = 78

xˉ=7834=2,292,3\bar x = \frac{78}{34} = 2,29 \rightarrow 2,3

b) Com intervalo de classe

  • Ponto Médio xi=li+Li2\Large x_i = \frac{l_i + L_i}{2}

  • Média xˉ=xifin\Large \bar x = \frac{\sum x_i f_i}{n}

Exemplo:

ii

estaturas (cm)

fif_i

xix_i

xifix_i f_i

1

150 \vdash 154

4

152

608

2

154 \vdash 158

9

156

1.404

3

158 \vdash 162

11

160

1.760

4

162 \vdash 166

8

168

1.312

Σ=32\Sigma = 32

Σ=5.084\Sigma = 5.084

xˉ=5.08433=158,87cm\bar x = \frac{5.084}{33} = 158,87 cm

Moda (Mo)(Mo)

Dados Não Agrupados

7, 8, 9, 10, 10, 10, 11, 12, 13, 15 → Amodal 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 → Bimodal

Dados Agrupados

a) Sem intervalo de classe Mo = elemento que apresenta maior frequência

Exemplo:

xix_i

fif_i

0

2

1

6

2

10

3

12

4

4

Σ=34\Sigma = 34

Mo=3Mo=3

b) Com intervalo de classe

Mo=lmo+(d1d1+d2)hmo\Large Mo = l_{mo} + (\frac{d_1}{d_1+d_2})· h_{mo}

Classe modal (mo) = classe de maior frequência

lmol{mo} = limite inferior classe modal hmoh{mo} = amplitude da classe mo d1=fmofantd_1 = f{mo} - f{ant} d2=fmofposd_2 = f{mo} - f{pos}

Exemplo:

ii

estaturas (cm)

fif_i

1

150 \vdash 154

4

2

154 \vdash 158

9

3

158 \vdash 162

11

4

162 \vdash 166

8

Σ=32\Sigma = 32

d1=119=2d_1 = 11 - 9 = 2 d2=118=3d_2 = 11 - 8 = 3 Mo=158+(22+3)4Mo = 158 + (\frac{2}{2+3})· 4 Mo=158+0,44Mo = 158 + 0,4 · 4 Mo=158+1,6Mo = 158 + 1,6 Mo=159,6cmMo = 159,6cm


Medidas Separatrizes

  • Mediana

  • Quartil

  • Decil

  • Percentil

Fórmula padrão para separatrizes: l+[nFacantf]h\Large l_\ast + [\frac{\frac{n}{\ast} - Fac_{ant}}{f_\ast}] · h_\ast

ll = limite inferior da classe separatriz FacantFac_{ant} = Fac da classe anterior a classe separatriz ff = frequência da classe separatriz hh = amplitude da classe separatriz

Mediana (Md)(Md)

Dados Não Agrupados

a) Ímpar n+12=\large \frac{n+1}{2} = posição do termo

b) Par

  1. n2\large \frac{n}{2} e n+12\large \frac{n+1}{2}

  2. média xˉ\bar x dos termos

Dados Agrupados

a) Sem Intervalo de Classe

  • PosMd=Fac>n2\Large PosM_d = Fac > \frac{n}{2}

  • elemento xix_i de maior Fac

b) Com Intervalo de Classe

PosMd=Fac>n2\Large PosM_d = Fac > \frac{n}{2}

Md=lmd+[n2Fantfmd]hmd\Large Md = l_{md} + [\frac{\frac{n}{2} - F_{ant}}{f_{md}}] · h_{md}

Exemplo:

ii

estaturas (cm)

fif_i

FacFac

1

150 \vdash 154

4

4

2

154 \vdash 158

9

13

3

158 \vdash 162

11

24

4

162 \vdash 166

8

32

Σ=32\Sigma = 32

PosMd=322=16PosM_d = \frac{32}{2} = 16 Fac3=2424>16Fac_3 = 24 \rightarrow 24 >16

Md=158+1613114Md = 158 + \frac{16-13}{11} · 4 Md=158+0,27ˉ4Md = 158 + 0,2\bar7 · 4 Md=158+1,08=159,08cmMd = 158 + 1,08 = 159,08 cm

Quartil (Qk)(Q_k)

  • Q1=25%Q_1 = 25\%

  • Q2=50%(Md)Q_2 = 50\% (Md)

  • Q3=75%Q_3 = 75 \%

Dados Não Agrupados

PosQk=kn4\Large PosQ_k = \frac{k · n}{4} k=1,2,3k = 1, 2, 3

Dados Agrupados

a) Sem Intervalo de Classe PosQk=kn4\Large PosQ_k = \frac{k · n}{4}

b) Com Intervalo de Classe PosQk=Fac>kn4\large PosQ_k = Fac > \frac{k · n}{4}

Qk=lqk+[kn4Facantfqk]hqk\Large Q_k = l_{qk} + [\frac{\frac{k · n}{4} - Fac_{ant}}{f_{qk}}] · h_{qk}

Exemplo:

peso (kg)

fif_i

FacFac

0 \vdash 5

52

52

5 \vdash 10

36

88

10 \vdash 15

30

118

15 \vdash 20

41

159

20 \vdash 25

25

184

25 \vdash 30

28

212

30 \vdash 35

18

230

Σ\Sigma = 230

PosQ3=Fac>32304=172,5PosQ_3 = Fac > \frac{3 · 230}{4} = 172,5

Q3=20+[172,515925]5Q_3 = 20 + [\frac{172,5 - 159}{25}] · 5 Q3=20+0,545Q_3 = 20 + 0,54 · 5 Q3=20+2,7Q_3 = 20 + 2,7 Q3=22,7Q_3 = 22,7

Percentil (Pk)(P_k)

PosPk=kn100\Large PosP_k = \frac {k · n}{100}

Pk=lpk+[kn100Facantfpk]hpk\Large P_k = l_{pk} + [\frac{\frac{k · n}{100} - Fac_{ant}}{f_{pk}}] · h_{pk}


Medidas de Dispersão ou Variabilidade

Variância (s2)(s²)

  • Nível de diversificação entre valores e sua média; desvio médio

Dados Não Agrupados

s2=1n[Σxi2(Σxi)2n]\Large s² = \frac{1}{n} · [{\Sigma x_i²} - \frac{(\Sigma x_i)²}{n}]

Dados Agrupados

s2=1n[Σxi2fi(Σxifi)2n]\Large s² = \frac{1}{n} · [{\Sigma x_i²f_i} - \frac{(\Sigma x_i f_i)²}{n}]

1n1\Large \frac{1}{n-1} para amostras

Exemplo:

xix_i

fif_i

xifix_i f_i

xifixıˋx_i f_i · xì

0

2

0

0

1

6

6

6

2

12

24

48

3

7

21

63

4

3

16

48

Σ=30\Sigma = 30

Σ=63\Sigma = 63

Σ=165\Sigma = 165

s2=130[16563230]s² = \frac{1}{30} · [165 - \frac{63²}{30}] s2=0,03ˉ[165132,3]s² = 0,0\bar3 · [165 - 132,3] s2=0,03ˉ32,7s² = 0,0\bar3 · 32,7 s2=1,09s² = 1,09

Desvio Padrão (S)(S)

  • Útil para compreender a dispersão dentro de um único conjunto de dados

S=s2\Large S = \sqrt s²

Propriedades em Curvas Normais

Desvio Padrão em Curvas Normais

Coeficiente de Variação (CV)(CV)

  • Grau de concentração em torno da média; proporção do desvio padrão em relação à média

  • Útil para comparar variabilidade entre diferentes conjuntos de dados ou entre diferentes momentos

CV=Sxˉ\Large CV = \frac{S}{\bar x} (100)(· 100)

CV (%)
Dispersão

< 15

baixa

\geq 15 e < 30

média

\geq 30

alta


Medidas de Assimetria

Coeficiente de Assimetria de Pearson

  • A medida que a distribuição deixa de ser simétrica, a média, moda e mediana vão se afastando, aumentando cada vez mais a diferença entre elas

As=3(xˉMd)S\Large A_s = \frac{3 · (\bar x - Md)}{S}

  • Nulo - Curva simétrica

  • Positivo - Assimetria positiva

  • Negativo - Assimetria negativa

As
Assimetria

< 0,15

fraca

\geq 0,15 e \leq 1

moderada

> 1

forte


Medidas de Curtose

  • Grau de achatamento de uma distribuição em relação a uma distribuição normal

Leptocúrtica - dados muito concentrados Mesocúrtica - curva normal Plasticúrtica - dados muito espalhados

Coeficiente Percentílico de Curtose

  • Grau de curtose; propensão a produzir extremos

C=Q3Q12(P90P10)\Large C = \frac{Q_3 - Q_1}{2 · (P_{90} - P_{10})}

C
Distribuição

= 0, 263

Mesocúrtica

< 0, 263

Leptocúrtica

> 0, 263

Plasticúrtica

Atualizado