Søjlediagram vs. Histogram
I statistik er det vigtigt at opsummere og præsentere dataene. Det kan gøres enten numerisk ved hjælp af beskrivende mål eller grafisk ved hjælp af cirkeldiagrammer, søjlediagrammer og mange andre grafiske repræsentationsmetoder.
Hvad er et søjlediagram?
Søjlediagram er en af de vigtigste grafiske repræsentationsmetoder i statistik. Det bruges til at vise distinkte værdier af de kvalitative data på en vandret akse og de relative frekvenser (eller frekvenser eller procenter) af disse værdier på en lodret akse. En søjle med dens højde/længde proportional med den relative frekvens repræsenterer hver enkelt værdi, og søjlerne er placeret på en måde, så de ikke rører hinanden. Et søjlediagram med ovenstående konfiguration er den mest almindelige og er kendt som et lodret søjlediagram eller et søjlediagram. Men det er også muligt at ombytte akserne; i så fald er stregerne vandrette.
Søjlediagrammet blev første gang brugt i bogen "The Commercial and Political Atlas" fra 1786 af William Playfair. Siden da er søjlediagram blevet et af de vigtigste værktøjer til at repræsentere kategoriske data. Brugen af søjlediagrammer kan udvides til at repræsentere mere komplekse kategoriske data, såsom tidsudviklingsvariabler (valgsvar), grupperede data og mere.
Hvad er et histogram?
Histogrammet er en anden vigtig grafisk repræsentation af data, og det kan betragtes som en udvikling fra søjlediagrammet. I et histogram vises klasserne af de kvantitative data på den vandrette akse, og frekvensen (eller den relative frekvens eller procenter) af klasserne vises på y-aksen. En lodret streg repræsenterer norm alt frekvensen (eller relative frekvens eller procenter) af klassen, hvis højde er lig med dens størrelse. I modsætning til de almindelige søjlediagrammer er søjlerne placeret, så de rører hinanden.
Variablen i X-aksen kan enten være grupperet med enkeltværdier eller grænsegrupperet. For enkeltværdigruppering bruges særskilte værdier af observationerne til at mærke søjlerne, med hver sådan værdi centreret under sin søjle. Til grænsegruppering eller skærepunktsgruppering bruges lavere klassegrænser (eller tilsvarende lavere klasse skærepunkter) til at mærke søjlerne. Klassemærker eller klassemidter centreret under stregerne kan også bruges.
En af de største forskelle ligger i den variabel, der bruges i X-aksen. I histogrammet er variablen en kvantitativ variabel og kan enten være kontinuerlig eller diskret. Og det kan bruges til at repræsentere tæthedsoplysninger om datasættene. I dette tilfælde kan de anvendte intervaller på x-aksen variere fra den ene til den anden, og på y-aksen er frekvenstætheden markeret. Hvis X-aksens interval er 1, så er histogrammet lig med det relative frekvensplot.
Hvad er forskellen mellem søjlediagram og histogram?
• Først og fremmest er et histogram en udvikling fra søjlediagrammet, men det er ikke identisk med et søjlediagram. Histogrammer er en type søjlediagrammer, men søjlediagrammer er bestemt ikke histogrammer.
• Søjlediagrammer bruges til at plotte kategoriske eller kvalitative data, mens histogrammer bruges til at plotte kvantitative data med dataintervallerne grupperet i bins eller intervaller.
• Søjlediagrammer bruges til at sammenligne variabler, mens histogrammer bruges til at vise fordelinger af variabler
• Søjlediagrammer har mellemrum mellem to søjler, mens histogrammer ikke har mellemrum mellem søjlerne. (Årsagen er, at x-aksen i søjlediagrammer er diskrete kategoriske værdier, mens den i histogrammer enten er diskret eller kontinuert kvantitativ).
• Histogrammer bruges til at illustrere tætheden af en variabel i intervaller; i dette tilfælde repræsenterer området af søjlen variablens frekvens.