+ - 0:00:00
Notes for current slide
Notes for next slide

Kvantitativa forskningsprocessen & beskrivande statistik

Enes Al Weswasi

Kriminologiska institutionen, Stockholms universitet


deskriptiv-statistik.netlify.app

1

Översikt

1. Kvantitativa forskningsprocessen

2. Datanivåer och variabeltyper

3. Univariat beskrivande statistik

4. Grafisk resultatpresentation

2

Kvantitativa forskningsprocessen

3

Kvantitativa forskningsprocessen

Kvantitativa metod är ett samlingsbegrepp metoder för insamling av siffermässig data eller kvantifiering av data till siffror. Statistiska beräkningar används som bearbetningsmetoder.

4

Operationalisering

Att göra ett begrepp som vi ämnar att studera mätbart för att på så sätt kunna lagra informationen i form av variabler. Grunden till empirisk forskning. Att göra ett begrepp mätbara kräver att vi först tydligt definier begreppet.

Vad betyder brottslighet och hur mäter vi brottslighet?

Vad betyder självkontroll och hur mäter vi självkontroll?

5

Operationalisering

6

Operationalisering

7

Variabel

Defineras som ett fenomen vars värde kan variera från observation till observation. Motsatsen till en variabel är en konstant.

Analysenhet är den eller de enheter som du analyserar i din studie

8

Variabel

Defineras som ett fenomen vars värde kan variera från observation till observation. Motsatsen till en variabel är en konstant.

Analysenhet är den eller de enheter som du analyserar i din studie

9

Variabel

Defineras som ett fenomen vars värde kan variera från observation till observation. Motsatsen till en variabel är en konstant.

Analysenhet är den eller de enheter som du analyserar i din studie

10

Dataset

  • En samling data (eller variabler) som behandlas tillsammans för ett bestämt ändamål i ett datorprogram.
11

Dataset

  • En samling data (eller variabler) som behandlas tillsammans för ett bestämt ändamål i ett datorprogram.

  • Data som numerisk information (även om informationen uttrycks i bokstäver).

11

Dataset

12

Dataset

13

Dataset

14

15

Variabeltyper och datanivåer

16

Datanivå

  • Variablernas matematiska karaktär.
  • lägre nivåer har siffrorna betydelser som är egentiligen bara etiketter.
  • högsta mätnivåer har siffrorna numeriska betydelser och kan anlyseras på en mängd olika sätt.
  • Det är viktigt att veta vilken typ av variabel som du använder, så att du kan välja rätt statistiska test, centralmått, spridningsmått och grafisk presentation.
17

Fiktivt dataset

18

Nominal

Icke-numeriska kategorier som representerar något annat än siffror.

Kategorierna kan ej rangordnas.

19

Nominal

Icke-numeriska kategorier som representerar något annat än siffror.

Kategorierna kan ej rangordnas.

Kan tilldelas ett numeriskt värde för statistiska ändamål.

Det förekommer tillfällen då dessa värden är sorterade. Detta betyder dock ej att siffrorna kan användas för matematiska beräkningar.

20

Nominalvariabler i datasetet

21

Ordinal

Kategorier kan rangordnas från hög till låg, mer eller mindre

Värdet har bara betydelse i förhållande till andra värden

Kan inte summera eller subtrahera dessa värden

22

Ordinal

Kategorier kan rangordnas från hög till låg, mer eller mindre

Värdet har bara betydelse i förhållande till andra värden

Kan inte summera eller subtrahera dessa värden

23

Intervall

Ekvidistans - lika avstånd mellan värdena.

Med dessa variabler kan man utföra alla tänkbara matematiska beräkningar.

24

Kvot

Ekvidistans - lika avstånd mellan värdena.

Med dessa variabler kan man utföra alla tänkbara matematiska beräkningar.

Har en absolut/meningsfull nollpunkt.

25

Två olika typer av intervall/kvot-variabler

Diskret variabel - grundläggande måttenhet som inte kan delas.

26

Två olika typer av intervall/kvot-variabler

Diskret variabel - grundläggande måttenhet som inte kan delas.

  • Antal brottmålsdomar

  • Befolkning

  • Antal syskon

  • Antal skilsmässor

26

Två olika typer av intervall/kvot-variabler

Diskret variabel - grundläggande måttenhet som inte kan delas.

  • Antal brottmålsdomar

  • Befolkning

  • Antal syskon

  • Antal skilsmässor

Kontinuerlig variabel - kan i teorin vara oändligt delbar.

26

Två olika typer av intervall/kvot-variabler

Diskret variabel - grundläggande måttenhet som inte kan delas.

  • Antal brottmålsdomar

  • Befolkning

  • Antal syskon

  • Antal skilsmässor

Kontinuerlig variabel - kan i teorin vara oändligt delbar.

  • Ålder

  • Tid i fängelse

26

Datanivåer

27

Antal anmälda brott under en månad på SU.

Vilken datanivå?

28

Beskrivande statistik

29

Beskrivande statistik

Två typer av statistik:

  • Beskrivande statistik är en gren inom statistiken som går ut på att beskriva och sammanfatta en samling data eller variabler. Data kan till exempel beskrivas med hjälp av centralmått och spridningsmått.

  • Den beskrivande statistiken skiljer sig från inferentiell statistik, som går ut på att dra generella slutsatser om en population med hjälp av stickprov.

30

Beskrivande statistik

Univariat - sammanfattar eller beskriver fördelningen av en variabel

31

Beskrivande statistik

Univariat - sammanfattar eller beskriver fördelningen av en variabel

Bivariat - beskriver förhållandet mellan två variabler

31

Beskrivande statistik

Univariat - sammanfattar eller beskriver fördelningen av en variabel

Bivariat - beskriver förhållandet mellan två variabler

Multivariat - beskriver förhållandet mellan tre eller flera variabler

31

Univariat beskrivande statistik

Sammanfatta information om enstaka variabler.

Presentera resultat på ett lättförståeligt sätt.

Information såsom dess mittpunkt (centralmått) och dess spridning (spridningsmått).

32

Absolut frekvens

Antal förekomster av enskilda variabelvärden.

## Brottstyp n
## 1 Annat 4
## 2 Inbrott 1
## 3 Misshandel 3
## 4 Snatteri 3
33

Absolut frekvens

Problematiska vid numeriska variabler.

34

Absolut frekvens

## Ålder n
## 1 14 1
## 2 15 1
## 3 16 1
## 4 17 3
## 5 18 5
## 6 19 19
## 7 20 16
## 8 21 26
## 9 22 32
## 10 23 41
## 11 24 61
## 12 25 68
## 13 26 82
## 14 27 92
## 15 28 98
## 16 29 90
## 17 30 85
## 18 31 76
## 19 32 61
## 20 33 42
## 21 34 37
## 22 35 25
## 23 36 17
## 24 37 10
## 25 38 4
## 26 39 2
## 27 40 1
## 28 41 3
## 29 45 1
35

Absolut frekvens

Intervall- och kvotvariablervariabler kan kodas om till ordinala variabler.

Vi offrar vissa detaljer för att få en tydligare tabell.

Exempelvis till åldersspann:

  • Åldersspann 0-15 år gammal

  • Åldersspann 16-25 år gammal

  • Åldersspann 26-40 år gammal

  • Åldersspann >40 år gammal

36

Absolut frekvens

## Ålder_kategorier n
## 1 0-15 2
## 2 16-25 272
## 3 26-40 722
## 4 >40 4
37

Absolut frekvens

Av 1 846 personer med elektronisk fotboja så återföll 746 i brott.

Svårt att intuitivt förstå förhållandet mellan de som återföll och de som ej återföll.

38

Andel (också kallad relativ frekvens)

Lättare om man beskriver det som:

  • Andel av personer med fotboja som återföll i brott var 0.4.
39

Andel (också kallad relativ frekvens)

a = andel

f = frekvens/antal fall i någon kategori

N = antalet fall i alla kategorier

a=fN

40

Andel (också kallad relativ frekvens)

Av 1 846 personer med elektronisk fotboja så återföll 746 i brott.

a = 746 / 1 846

a = 0.4041

Andel av personer med fotboja som återföll i brott var 0.4.

a=fN

41

Andel i procent

Effektivaste sättet att beskriva förhållanden är:

~40 procent av personer med fotboja återföll i brott.

42

Andel i procent

p = procent

f = frekvens/antal fall i någon kategori

N = antalet fall i alla kategorier

p=fN100

43

Andel i procent

Av 1 846 personer med elektronisk fotboja återföll 746 i brott.

p = (746 / 1 846) x 100

p = 0.4041 x 100

p = 40.41

~40 procent av personer med fotboja återföll i brott.

p=fN100

44

Frekvensfördelning , andel och procent i tabell

45

Beskrivande statistik: Centralmått

46

Centralmått

Tre typer av centralmått:

  • Typvärde

  • Median

  • Medelvärde

Används för att beskriva urvalets tyngdpunkt.

Ditt val av centralmått beror på datanivån för variabel som du analyserar.

47

Typvärde

Det värde som förekommer flest gånger.

Typvärde kan användas för variabler på alla datanivåer.

Det är dock det enda centralmåttet som går att använda för nominala variabler.

Exempel: Vilket är typvärdet i följande urval?

  • 70, 82, 90, 98, 82
48

Typvärde

Det värde som förekommer flest gånger.

Typvärde kan användas för variabler på alla datanivåer.

Det är dock det enda centralmåttet som går att använda för nominala variabler.

Exempel: Vilket är typvärdet i följande urval?

  • 70, 82, 90, 98, 82
49

Typvärde

Vilket värde är vårt typvärde i brottsdatasetet?

50

Median

Den exakta mitten av en fördelning av värden.

Hälften av urvalet hamnar över medianen, den andra hälften under.

För att hitta medianen så måste du först rangordna värdena från lägst till högst.

Användas för intervall- och kvotvariabler men framförallt ordinala variabler.

51

Medelvärde

Det mest använda centralmåttet.

Används för intervall- och kvotvariabler.

Kan användas för ordinala skalor men med försiktighet vid.

Exempel:

  • Genomsnittliga resultatet på ett prov

  • Genomsnittliga antalet barn per kvinna

  • Genomsnittliga längden på ett fängelsestraff

52

Medelvärde

Medelvärdet representeras vanligen av symbolen (på svenska ”x-tak”, på engelska ”x-bar”).

Kan också uttryckas med bokstaven m.

För att räkna ut medelvärdet summerar du alla värden och dividerar därefter med antalet värden.

x¯

53

Medelvärde

Genomsnittlig våldsutsatthet under ett år:

2, 3, 4, 6, 6, 6, 8, 9, 10, 11, 14, 16, 18

x¯=(2+3+4++14+16+18)/13

x¯=112/13

x¯=8,6

Genomsnittligt våldsutsatthet är 8,6.

x¯=xN

54

Centralmått

Med undantag för nominala variabler så är det upp till dig att bestämma vilket centralmått som fungerar bäst.

Till stor del så beror detta på vilken fråga du försöker besvara.

Kom ihåg att ditt val kommer att få konsekvenser.

Dina egna fördomar och åsikter kan påverka ditt val av mått.

55

Vilket centralmått spelar roll

56

Vilket centralmått spelar roll - Ungdomsbrottslighet?

Åldersfördelning bland 25 intagna.

55 19 18 16 19 16 15 18 20 20 19 16 23 15 17 16 20 55 18 65 16 18 17 19 18

Typvärde = 16

Median = 18

Medelvärde = 23

57

Vilket centralmått spelar roll - Ungdomsbrottslighet?

Åldersfördelning bland 25 intagna.

55 19 18 16 19 16 15 18 20 20 19 16 23 15 17 16 20 55 18 65 16 18 17 19 18

Typvärde = 16

Median = 18

Medelvärde = 23

58

Grafisk resultatpresentation

59

Stapeldiagram

Används främst för kategoriska variabler

## Brottstyp n
## 1 Annat 437
## 2 Inbrott 253
## 3 Misshandel 174
## 4 Snatteri 636
60

Stapeldiagram

61

Stapeldiagram

62

Stapeldiagram

63

Histogram

Används främst för numeriska variabler.

64

Histogram

65

Histogram

66

Histogram

67

Linjediagram

Används främst för numeriska variabler.

68

Linjediagram

69

Linjediagram

70

Linjediagram

71

Linjediagram

72

Oändligt med sätt att sammanfatta data

https://www.data-to-viz.com/

73

Sammanfattning

Kvantitativa forskningsprocessen - Från hypotes till resultatpresentation

Datanivåer och variabeltyper - Nominal, Ordinal, Intervall, Kvot

Univariat beskrivande statistik - Frekvenser och andelar samt centralmått

Grafisk resultatpresentation - Olika typer av figurer beroende på datanivå

74

Översikt

1. Kvantitativa forskningsprocessen

2. Datanivåer och variabeltyper

3. Univariat beskrivande statistik

4. Grafisk resultatpresentation

2
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow