segunda-feira, 16 de dezembro de 2019

E-90: REVISÃO - Ficha_revisão (Estatística Descritiva, Correlação, Regressão, Amostragem)

1. REVISÃO DE CONCEITOS (ESTATÍSTICA DESCRITIVA) E OUTRAS NOÇÕES BÁSICAS

1.1 - Diga o que entende por:
a) Moda
 A moda de um conjunto de valores de uma variável estatística corresponde ao valor que é mais vezes observado num determinado estudo ou, por outras palavras, ao efetivo com maior frequência absoluta.
b) Classe modal
É a classe com maior frequência
c) Distribuição amodal
Diz-se da curva de frequência que não admite máxima (moda) nem mínima (antimodal).
d) Distribuição unimodal
é a distribuição probabilística que tem uma única moda.
e) Distribuição bimodal
é uma distribuição de probabilidade contínua com duas modas diferentes.
f) Distribuição multimodal
é uma distribuição de probabilidade contínua com várias modas.
g) Mediana
é o valor que separa a metade maior e a metade menor de uma amostra.
h) Classe mediana
é aquela em que a frequência relativa acumulada atinge os 50%.
i) Quantis
são pontos estabelecidos em intervalos regulares a partir da função distribuição acumulada e de uma variável aleatória.
j) Quartis
é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população.
l) Decis
é qualquer um dos nove valores que dividem os dados ordenados de uma variável em dez partes iguais, de modo que cada parte representa 1/10 da amostra ou população.
m) Percentis
Proporção calculada em relação a uma grandeza de cem unidades (símbolo: %).


1.2 - Defina as seguintes medidas de dispersão absoluta (amplitudes e desvios)
a) Amplitude total  
é uma medida de dispersão que pode ser definida como a diferença entre o valor maior e o valor menor de um grupo de observações.
b) Intervalo de Kelley
É a diferença entre o primeiro e nono decil.
c) Amplitude interquartil
É a diferença entre o primeiro e terceiro quartil
d) Desvio médio
é uma medida da dispersão dos dados em relação à média de uma sequência, o “afastamento” em relação a essa média.
e) Variância
usado para descrever um conjunto de observações. Quando o conjunto das observações é uma população, é chamada de variância da população.
f) Desvio padrão
é definido como a raiz quadrada da variância.


1.3 - Defina as seguintes medidas de dispersão relativa
a) Coeficiente de variação (CV)
é uma medida padronizada de dispersão de uma distribuição de probabilidade ou de uma distribuição de frequências.
b) Coeficiente Interquartil (CIQ)
desenvolvido no âmbito da estatística a fim de avaliar o grau de espalhamento de dados (dispersão) em torno da medida de centralidade.


1.4 - Defina as seguintes medidas de forma (assimetria e curtose)
a) Coeficiente de assimetria
permite distinguir as distribuições assimétricas. Um valor negativo indica que a cauda do lado esquerdo da função densidade de probabilidade é maior que a do lado direito. Um valor positivo para a assimetria indica que a cauda do lado direito é maior que a do lado esquerdo.
b) Coeficiente de curtose
É uma medida de dispersão que caracteriza o "achatamento" da curva da função de distribuição.


1.5 - Defina (medidas de concentração)
Coeficiente de Gini
é um parâmetro internacional usado para medir a desigualdade de distribuição de rendimentos  entre os países.
Curva de Lorenz
É uma gráfico utilizado para representar a distribuição relativa utilizado para representar a distribuição relativa de uma variável num determinado domínio.. 


1.6 - Diga o que entende por

a) Marca da classe
possuem o mesmo tamanho.
b) Amplitude da classe
A amplitude de classe corresponde à diferença entre o limite superior e inferior.
c) Efetivo da classe
é calculada como AT = mín – máx.


1.7 - Identifique 4 métodos de divisão em classes
a) método 1
Método indutivo- dedutivo.
b) método 2
Investigação-ação.
c) método 3
Estudo de caso.
d) método 4
Investigação experimental.


2. ANÁLISE DE CORRELAÇÃO

2.1 - Interprete o significado do coeficiente de correlação de Pearson nos exercícios que realizou  (E47 a E53).
E47
O 0.1 significa que a correlação entre 2 variáveis é positiva e forte
E48
o -1,0 significa que a correlação entre 2 variáveis é negativa.
E49
o 0,89 significa que não dependem linearmente uma da outra. 
E50
o 0,80 significa que não dependem linearmente uma da outra.
E51
o 0,05 siginifica que não dependem linearmente uma da outra. 
E52
o 1 significa que existe uma correlação perfeita positiva entre as 2 variáveis.
E53
o 0,01 significa que eiste uma correlação perfeita positiva entre 2 variáveis.


2.2 - Interprete o significado do coeficiente de correlação de Spearman nos exercícios que realizou  (E54 a E57).
E54
O 0.79 significa que a correlação entre as 2 variáveis é positiva e forte. A ordem dos valores das 2 variáveis não é igual mas é semelhante, ou seja existe uma correspondência forte entre as preferências de José e maria.
E55
o 0.65 significa que a correlação entre as 2 variáveis é positiva e forte. existe uma forte correspondência entre as preferências. 
E56
o 0,96 significa que a correlação entre as 2 variáveis é positiva e forte. existe uma forte correspondência entre as preferências. 
E57
o0.01 significa que a correlação entre as 2 variáveis é positiva, e existe uma correspondência entre as preferencias.


2.3 - No E51 ao E57 os dados são de uma amostra. Pode rejeitar a Hipótese Nula (H0) para uma probabilidade de 95%? Justifique a sua resposta.  Diga se o coeficiente de correlação é significativo para uma probabilidade de 95%.
E51
Rejeita h. porque a probabilidade  de ser verdadeira é inferior ao nível de significação que o investigador defeniu ( N.S= 0,5;sig.=0.01<0.5)
E52

E53

E54

E55

E56

E57



3. ANÁLISE DE REGRESSÃO LINEAR & NÃO LINEAR

3.1 - Indique a equação da função (linear ou não linear) nos exercícios de análise de regressão que realizou  (E58 a E67).
E58 ou E61
Y=0.65x-2,59
E59 ou E62
y= 0,1609x *+ 7,2823 
E60 ou E63
y= - 1,1198x + 11,427
E64 ou E65
Y=8848,2x-1,938
E66 ou E67
y= 806,66e^0,4219x
3.2 - Indique o valor do coeficiente de determinação (r2) nos exercícios de análise de regressão que realizou  (E58 a E67).
E58 ou E61
R2= 0.82  ou 82%
E59 ou E62
R2= 0,8126
E60 ou E63
R2= 0,8835
E64 ou E65
R2= 0,9864
E66 ou E67
R2= 0,9568
3.3 - Interprete o significado do coeficiente de determinação (r2) nos exercícios de análise de regressão que realizou  (E58 a E67).
E58 ou E61
O r2= 82 significa que a variável de x explica 82% da variável y. há uma forte dependência de y em relação a x
E59 ou E62
O r2= 0,81 significa que a variável de x explica 81% da variável y. há uma forte dependência de y em relação a x
E60 ou E63
O r2= 88 significa que a variável de x explica 88% da variável y. há uma forte dependência de y em relação a x
E64 ou E65
O r2= 92 significa que a variável de x explica 92% da variável y. há uma forte dependência de y em relação a x
E66 ou E67
O r2= 92 significa que a variável de x explica 92% da variável y. há uma forte dependência de y em relação a x
3.4 - Indique o valor estimado de Y (para a 1ª unidade de análise) nos exercícios de análise de regressão que realizou  (E58 a E67).
E58 ou E61
28,04
E59 ou E62
8,26
E60 ou E63
6,94
E64 ou E65
20
E66 ou E67
1
3.5 - Indique o resíduo (para a 1ª unidade de análise) nos exercícios de análise de regressão que realizou  (E58 a E67).
E58 ou E61
-7,04
E59 ou E62
0,23
E60 ou E63
0,05
E64 ou E65
0,98
3.6 - Indique o intervalo de confiança (para a 1ª unidade de análise) nos exercícios de análise de regressão que realizou  (E58 a E67).
E61
( 14,12; 41,97)
E62
(6,42; 10,06)
E63
(4,78; 9,10)
E65
(210,3 ; 727,7)
E67
(569,5 ;2656,0)
4. AMOSTRAGEM

4.1 - Descreva/caraterize cada um dos métodos de amostragem probabilísticos (ou não dirigidos) que estudou.


1. Método de amostragem aleatória simples
é a técnica de amostragem onde todos os elementos que compõem o universo e estão descritos no marco amostral têm idêntica probabilidade de serem selecionados para a amostra.
2. Método de amostragem sistemática
é um processo muito simples e que só requer a seleção de um indivíduo aleatório. 
3. Método de amostragem estratificada (aleatória ou sistemática)
consiste em dividir toda a população ou o "objeto de estudo" em diferentes subgrupos ou estratos diferentes, de maneira que um indivíduo pode fazer parte apenas de um único estrato ou camada.
4. Método de amostragem por clusters
é objecto de selecção aleatória são os grupos naturais previamente existentes (por exemplo: escolas, turmas, hospitais, cidades, freguesias, etc.), entrevistando-se posteriormente todos os elementos pertencentes aos grupos (clusters) seleccionados.
5. Método de amostragem multi-etapas
Considera-se a população dividida em vários grupos e seleciona-se aleatoriamente alguns grupos. Dividimos esses grupos em grupos mais pequenos e selecionamos um aleatoriamente.
6. Método de amostragem multi-fásica
consiste em inquirir uma ou mais subamostras da amostra inicial com vista à obtenção de informações suplementares subordinada a objectivos teóricos (v.g., validação de hipóteses), metodológicos (v.g., aperfeiçoamento de critérios de estratificação) ou práticos (v.g., controlo dos entrevistadores).


4.2 - Descreva/caraterize cada um dos métodos de amostragem não probabilísticos (ou dirigidos) que estudou.


1. Método de amostragem por conveniência
Selecionar uma amostra conveniente
2. Método de amostragem intencional
é aquela cuja seleção é baseada no conhecimento sobre a população e o propósito do estudo.
3. Método de amostragem snowball
 utilizado em pesquisa quando os membros da população são difíceis de localizar, por exemplo: imigrantes sem visto de permanência no país.
4. Método de amostragem sequencial
 abordar pessoas em uma esquina quando elas passam, embora seja extremamente arriscado, trata-se de um método de amostragem.
5. Método de amostragem por quotas
unidades são selecionadas com base em características já especificadas que condizem com a proporção da população total.


4.3 - Identifique uma vantagem e uma limitação em cada um destes 2 tipos de MA.
1. M.A. probabilísticos ou não dirigidos
Todos os elementos da minha população apresentam uma probabilidade maior que zero para ser selecionados na amostra.
Conhecer precisamente a probabilidade para cada elemento, também chamado de probabilidade de inclusão.
2. M.A. não probabilísticos ou dirigidos
Garantir que todos os indivíduos da população tenham uma probabilidade não-nula de serem selecionados 
não permite saber a precisão.

4.4 - Estimar parâmetros da população. Interprete os resultados que obteve no E73.


1. Qual a média da idade dos indivíduos na população/universo estatístico, para uma probabilidade de 95%?
19,84; 22,16
2. Qual a média do peso dos indivíduos na população/universo estatístico, para uma probabilidade de 95%?
58,8; 61,6
3. Qual a média da altura nos indivíduos na população/universo estatístico, para uma probabilidade de 95%?
1,7949;1,8198



4.5 - Testes Estatísticos.  Interprete o significado do teste estatístico nos exercícios que realizou  (E74 a E88).
   a) Qual foi a sua decisão em relação à Hipótese Nula (H0)?
    b) Justifique a sua resposta.
E74
a)não foi rejeitada a H0
b)porque a probabilidade de H0 ser verdadeira (0,53) é superiror ao Ns(0,5) que o investigador defeniu.

E75
a)não foi rejeitada a H0
b)porque a probabilidade de H0 ser verdadeira ( 0,53) é superior ao NS ( 0,5) que o investigador defeniu.

E76
a)Foi rejeitada 
b)pois a probabidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E77
a)foi rejeitada 
b)pois a probabidade de h0 ser verdadeira ( 0,1) é inferior NS (0,5)

E78
a)foi rejeida
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E79
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E80
a)foi rejeitada 
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E81
a)foi rejeitada 
b)pois a probabilidade de h0 ser verdadeira ( 0,01) é inferior NS (0,5)

E82
a)foi rejeita
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E83
a)foi rejeitada 
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E84
a)foi rejeitada 
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)

E85
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,167) é inferior NS (0,5)

E86
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,001) é inferior NS (0,5)

E87
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,001) é inferior NS (0,5)

E88
a)foi rejeitada 
b)pois a probabilidade de h0 ser verdadeira ( 0,000) é inferior NS (0,5)

Sem comentários:

Enviar um comentário

E5: Página Web e Blogue da unidade curricular "Metodologias de Análise de Dados" (MAD), 2020-2021

Metodologias de Análise de Dados 2020 - 2021 - página web   Blogue Metodologias @ Geografia . Planeamento     IGOT - Instituto de Geografia ...