Instituto de Geografia e Ordenamento do Território - Universidade de Lisboa 2019 - 2020
Objetivos da unidade curricular e competências a adquirir
Programa
Campenhoudt, Luc Van; Quivy, Raymond &, Marquet, Jacques (2019). Manual de investigação em ciências sociais. Lisboa: Gradiva.
Cliford, Nicholas; Valentine, Gill (Eds.) (2005). Key Methods in Geography. Sage,Londres.
Ebdon, David (2004). Statistics in Geography. Blackwell, Oxford.
Flowerdew, Robin; Martin, David (2005). Methods in Human Geography. A guide for students doing research project. Longman, Harlow.
Lavrakas, Paul J. (ed.) (2008). Encyclopedia of Survey Research Methods, 2 volumes. Sage Publications, Washington.
Maroco, João (2018). Análise estatística com utilização do SPSS. Pero Pinheiro: Report Number, 7ª edição.
Martinez, Luís; Ferreira, Aristides (2008). Análise de dados com SPSS. Escolar Editora, Lisboa.
Pereira, Alexandre (2013). SPSS. Guia prático de utilização. Análise de dados para ciências sociais e psicologia. Edições Sílabo, Lisboa (8ª ed.).
Pestana, Maria Helena; Gageiro, João (2014). Análise de dados para Ciências Sociais. A complementaridade do SPSS. Edições Sílabo, Lisboa (6ª ed.).
Reis, Elisabeth; Melo, Paulo; Andrade, Rosa; Calapez, Teresa (2019). Estatística aplicada. vol. 2. Edições Sílabo, Lisboa (6ª ed.).
Silva, Carlos Nunes (Ed.) (2012). Online Research Methods in Urban and Planning Studies: Design and Outcomes. IGI-Global, Hershey, PA.
1. REVISÃO DE CONCEITOS (ESTATÍSTICA DESCRITIVA) E OUTRAS NOÇÕES BÁSICAS
| |||||
1.1 - Diga o que entende por:
| |||||
a) Moda
|
A moda de um conjunto de valores de uma variável estatística corresponde ao valor que é mais vezes observado num determinado estudo ou, por outras palavras, ao efetivo com maior frequência absoluta.
| ||||
b) Classe modal
|
É a classe com maior frequência
| ||||
c) Distribuição amodal
|
Diz-se da curva de frequência que não admite máxima (moda) nem mínima (antimodal).
| ||||
d) Distribuição unimodal
|
é a distribuição probabilística que tem uma única moda.
| ||||
e) Distribuição bimodal
|
é uma distribuição de probabilidade contínua com duas modas diferentes.
| ||||
f) Distribuição multimodal
|
é uma distribuição de probabilidade contínua com várias modas.
| ||||
g) Mediana
|
é o valor que separa a metade maior e a metade menor de uma amostra.
| ||||
h) Classe mediana
|
é aquela em que a frequência relativa acumulada atinge os 50%.
| ||||
i) Quantis
|
são pontos estabelecidos em intervalos regulares a partir da função distribuição acumulada e de uma variável aleatória.
| ||||
j) Quartis
|
é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população.
| ||||
l) Decis
|
é qualquer um dos nove valores que dividem os dados ordenados de uma variável em dez partes iguais, de modo que cada parte representa 1/10 da amostra ou população.
| ||||
m) Percentis
|
Proporção calculada em relação a uma grandeza de cem unidades (símbolo: %).
| ||||
1.2 - Defina as seguintes medidas de dispersão absoluta (amplitudes e desvios)
| |||||
a) Amplitude total
|
é uma medida de dispersão que pode ser definida como a diferença entre o valor maior e o valor menor de um grupo de observações.
| ||||
b) Intervalo de Kelley
|
É a diferença entre o primeiro e nono decil.
| ||||
c) Amplitude interquartil
|
É a diferença entre o primeiro e terceiro quartil
| ||||
d) Desvio médio
|
é uma medida da dispersão dos dados em relação à média de uma sequência, o “afastamento” em relação a essa média.
| ||||
e) Variância
|
usado para descrever um conjunto de observações. Quando o conjunto das observações é uma população, é chamada de variância da população.
| ||||
f) Desvio padrão
|
é definido como a raiz quadrada da variância.
| ||||
1.3 - Defina as seguintes medidas de dispersão relativa
| |||||
a) Coeficiente de variação (CV)
|
é uma medida padronizada de dispersão de uma distribuição de probabilidade ou de uma distribuição de frequências.
| ||||
b) Coeficiente Interquartil (CIQ)
|
desenvolvido no âmbito da estatística a fim de avaliar o grau de espalhamento de dados (dispersão) em torno da medida de centralidade.
| ||||
1.4 - Defina as seguintes medidas de forma (assimetria e curtose)
| |||||
a) Coeficiente de assimetria
|
permite distinguir as distribuições assimétricas. Um valor negativo indica que a cauda do lado esquerdo da função densidade de probabilidade é maior que a do lado direito. Um valor positivo para a assimetria indica que a cauda do lado direito é maior que a do lado esquerdo.
| ||||
b) Coeficiente de curtose
| É uma medida de dispersão que caracteriza o "achatamento" da curva da função de distribuição. | ||||
1.5 - Defina (medidas de concentração)
| |||||
Coeficiente de Gini
|
é um parâmetro internacional usado para medir a desigualdade de distribuição de rendimentos entre os países.
| ||||
Curva de Lorenz
|
É uma gráfico utilizado para representar a distribuição relativa utilizado para representar a distribuição relativa de uma variável num determinado domínio..
| ||||
1.6 - Diga o que entende por
| |||||
a) Marca da classe
|
possuem o mesmo tamanho.
| ||||
b) Amplitude da classe
|
A amplitude de classe corresponde à diferença entre o limite superior e inferior.
| ||||
c) Efetivo da classe
|
é calculada como AT = mín – máx.
| ||||
1.7 - Identifique 4 métodos de divisão em classes
| |||||
a) método 1
|
Método indutivo- dedutivo.
| ||||
b) método 2
|
Investigação-ação.
| ||||
c) método 3
|
Estudo de caso.
| ||||
d) método 4
|
Investigação experimental.
| ||||
2. ANÁLISE DE CORRELAÇÃO
| |||||
2.1 - Interprete o significado do coeficiente de correlação de Pearson nos exercícios que realizou (E47 a E53).
| |||||
E47
|
O 0.1 significa que a correlação entre 2 variáveis é positiva e forte
| ||||
E48
|
o -1,0 significa que a correlação entre 2 variáveis é negativa.
| ||||
E49
|
o 0,89 significa que não dependem linearmente uma da outra.
| ||||
E50
|
o 0,80 significa que não dependem linearmente uma da outra.
| ||||
E51
|
o 0,05 siginifica que não dependem linearmente uma da outra.
| ||||
E52
|
o 1 significa que existe uma correlação perfeita positiva entre as 2 variáveis.
| ||||
E53
|
o 0,01 significa que eiste uma correlação perfeita positiva entre 2 variáveis.
| ||||
2.2 - Interprete o significado do coeficiente de correlação de Spearman nos exercícios que realizou (E54 a E57).
| |||||
E54
|
O 0.79 significa que a correlação entre as 2 variáveis é positiva e forte. A ordem dos valores das 2 variáveis não é igual mas é semelhante, ou seja existe uma correspondência forte entre as preferências de José e maria.
| ||||
E55
|
o 0.65 significa que a correlação entre as 2 variáveis é positiva e forte. existe uma forte correspondência entre as preferências.
| ||||
E56
|
o 0,96 significa que a correlação entre as 2 variáveis é positiva e forte. existe uma forte correspondência entre as preferências.
| ||||
E57
|
o0.01 significa que a correlação entre as 2 variáveis é positiva, e existe uma correspondência entre as preferencias.
| ||||
2.3 - No E51 ao E57 os dados são de uma amostra. Pode rejeitar a Hipótese Nula (H0) para uma probabilidade de 95%? Justifique a sua resposta. Diga se o coeficiente de correlação é significativo para uma probabilidade de 95%.
| |||||
E51
|
Rejeita h. porque a probabilidade de ser verdadeira é inferior ao nível de significação que o investigador defeniu ( N.S= 0,5;sig.=0.01<0.5)
| ||||
E52
| |||||
E53
| |||||
E54
| |||||
E55
| |||||
E56
| |||||
E57
| |||||
3. ANÁLISE DE REGRESSÃO LINEAR & NÃO LINEAR
| |||||
3.1 - Indique a equação da função (linear ou não linear) nos exercícios de análise de regressão que realizou (E58 a E67).
| |||||
E58 ou E61
|
Y=0.65x-2,59
| ||||
E59 ou E62
|
y= 0,1609x *+ 7,2823
| ||||
E60 ou E63
|
y= - 1,1198x + 11,427
| ||||
E64 ou E65
|
Y=8848,2x-1,938
| ||||
E66 ou E67
|
y= 806,66e^0,4219x
| ||||
3.2 - Indique o valor do coeficiente de determinação (r2) nos exercícios de análise de regressão que realizou (E58 a E67).
| |||||
E58 ou E61
|
R2= 0.82 ou 82%
| ||||
E59 ou E62
|
R2= 0,8126
| ||||
E60 ou E63
|
R2= 0,8835
| ||||
E64 ou E65
|
R2= 0,9864
| ||||
E66 ou E67
|
R2= 0,9568
| ||||
3.3 - Interprete o significado do coeficiente de determinação (r2) nos exercícios de análise de regressão que realizou (E58 a E67).
| |||||
E58 ou E61
|
O r2= 82 significa que a variável de x explica 82% da variável y. há uma forte dependência de y em relação a x
| ||||
E59 ou E62
|
O r2= 0,81 significa que a variável de x explica 81% da variável y. há uma forte dependência de y em relação a x
| ||||
E60 ou E63
|
O r2= 88 significa que a variável de x explica 88% da variável y. há uma forte dependência de y em relação a x
| ||||
E64 ou E65
|
O r2= 92 significa que a variável de x explica 92% da variável y. há uma forte dependência de y em relação a x
| ||||
E66 ou E67
|
O r2= 92 significa que a variável de x explica 92% da variável y. há uma forte dependência de y em relação a x
| ||||
3.4 - Indique o valor estimado de Y (para a 1ª unidade de análise) nos exercícios de análise de regressão que realizou (E58 a E67).
| |||||
E58 ou E61
|
28,04
| ||||
E59 ou E62
|
8,26
| ||||
E60 ou E63
|
6,94
| ||||
E64 ou E65
|
20
| ||||
E66 ou E67
|
1
| ||||
3.5 - Indique o resíduo (para a 1ª unidade de análise) nos exercícios de análise de regressão que realizou (E58 a E67).
| |||||
E58 ou E61
|
-7,04
| ||||
E59 ou E62
|
0,23
| ||||
E60 ou E63
|
0,05
| ||||
E64 ou E65
|
0,98
| ||||
3.6 - Indique o intervalo de confiança (para a 1ª unidade de análise) nos exercícios de análise de regressão que realizou (E58 a E67).
| |||||
E61
|
( 14,12; 41,97)
| ||||
E62
|
(6,42; 10,06)
| ||||
E63
|
(4,78; 9,10)
| ||||
E65
|
(210,3 ; 727,7)
| ||||
E67
|
(569,5 ;2656,0)
| ||||
4. AMOSTRAGEM
| |||||
4.1 - Descreva/caraterize cada um dos métodos de amostragem probabilísticos (ou não dirigidos) que estudou.
| |||||
1. Método de amostragem aleatória simples
|
é a técnica de amostragem onde todos os elementos que compõem o universo e estão descritos no marco amostral têm idêntica probabilidade de serem selecionados para a amostra.
| ||||
2. Método de amostragem sistemática
|
é um processo muito simples e que só requer a seleção de um indivíduo aleatório.
| ||||
3. Método de amostragem estratificada (aleatória ou sistemática)
|
consiste em dividir toda a população ou o "objeto de estudo" em diferentes subgrupos ou estratos diferentes, de maneira que um indivíduo pode fazer parte apenas de um único estrato ou camada.
| ||||
4. Método de amostragem por clusters
|
é objecto de selecção aleatória são os grupos naturais previamente existentes (por exemplo: escolas, turmas, hospitais, cidades, freguesias, etc.), entrevistando-se posteriormente todos os elementos pertencentes aos grupos (clusters) seleccionados.
| ||||
5. Método de amostragem multi-etapas
|
Considera-se a população dividida em vários grupos e seleciona-se aleatoriamente alguns grupos. Dividimos esses grupos em grupos mais pequenos e selecionamos um aleatoriamente.
| ||||
6. Método de amostragem multi-fásica
|
consiste em inquirir uma ou mais subamostras da amostra inicial com vista à obtenção de informações suplementares subordinada a objectivos teóricos (v.g., validação de hipóteses), metodológicos (v.g., aperfeiçoamento de critérios de estratificação) ou práticos (v.g., controlo dos entrevistadores).
| ||||
4.2 - Descreva/caraterize cada um dos métodos de amostragem não probabilísticos (ou dirigidos) que estudou.
| |||||
1. Método de amostragem por conveniência
|
Selecionar uma amostra conveniente
| ||||
2. Método de amostragem intencional
|
é aquela cuja seleção é baseada no conhecimento sobre a população e o propósito do estudo.
| ||||
3. Método de amostragem snowball
|
utilizado em pesquisa quando os membros da população são difíceis de localizar, por exemplo: imigrantes sem visto de permanência no país.
| ||||
4. Método de amostragem sequencial
|
abordar pessoas em uma esquina quando elas passam, embora seja extremamente arriscado, trata-se de um método de amostragem.
| ||||
5. Método de amostragem por quotas
|
unidades são selecionadas com base em características já especificadas que condizem com a proporção da população total.
| ||||
4.3 - Identifique uma vantagem e uma limitação em cada um destes 2 tipos de MA.
| |||||
1. M.A. probabilísticos ou não dirigidos
|
Todos os elementos da minha população apresentam uma probabilidade maior que zero para ser selecionados na amostra.
Conhecer precisamente a probabilidade para cada elemento, também chamado de probabilidade de inclusão.
| ||||
2. M.A. não probabilísticos ou dirigidos
|
Garantir que todos os indivíduos da população tenham uma probabilidade não-nula de serem selecionados
não permite saber a precisão.
| ||||
4.4 - Estimar parâmetros da população. Interprete os resultados que obteve no E73.
| |||||
1. Qual a média da idade dos indivíduos na população/universo estatístico, para uma probabilidade de 95%?
|
19,84; 22,16
| ||||
2. Qual a média do peso dos indivíduos na população/universo estatístico, para uma probabilidade de 95%?
|
58,8; 61,6
| ||||
3. Qual a média da altura nos indivíduos na população/universo estatístico, para uma probabilidade de 95%?
|
1,7949;1,8198
| ||||
4.5 - Testes Estatísticos. Interprete o significado do teste estatístico nos exercícios que realizou (E74 a E88).
a) Qual foi a sua decisão em relação à Hipótese Nula (H0)?
b) Justifique a sua resposta.
| |||||
E74
|
a)não foi rejeitada a H0
b)porque a probabilidade de H0 ser verdadeira (0,53) é superiror ao Ns(0,5) que o investigador defeniu.
| ||||
E75
|
a)não foi rejeitada a H0
b)porque a probabilidade de H0 ser verdadeira ( 0,53) é superior ao NS ( 0,5) que o investigador defeniu.
| ||||
E76
|
a)Foi rejeitada
b)pois a probabidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E77
|
a)foi rejeitada
b)pois a probabidade de h0 ser verdadeira ( 0,1) é inferior NS (0,5)
| ||||
E78
|
a)foi rejeida
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E79
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E80
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E81
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,01) é inferior NS (0,5)
| ||||
E82
|
a)foi rejeita
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E83
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E84
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,0) é inferior NS (0,5)
| ||||
E85
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,167) é inferior NS (0,5)
| ||||
E86
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,001) é inferior NS (0,5)
| ||||
E87
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,001) é inferior NS (0,5)
| ||||
E88
|
a)foi rejeitada
b)pois a probabilidade de h0 ser verdadeira ( 0,000) é inferior NS (0,5)
|
Metodologias de Análise de Dados 2020 - 2021 - página web Blogue Metodologias @ Geografia . Planeamento IGOT - Instituto de Geografia ...