Skip to main content

Co to jest rozkład histogramu?

Rozkład histogramu w statystykach odnosi się do wzorców, kształtów i lokalizacji jednoczynnikowych pasków danych na histogramie.Jak i gdzie dystrybuowane są pręty, można wykorzystać do analizy i wyciągania wniosków dotyczących danych.Analiza rozkładu histogramu jest ważna w identyfikowaniu cech, takich jak normalność danych, rozkłady multimodalne i wypaczone dane.

Histogram to jednoznaczny wyświetlacz danych, który wykorzystuje prostokąty proporcjonalne w obszarze do klas lub częstotliwości wizualnie pokazywania funkcji danych.Punkty danych w histogramie są uporządkowane do pojemników, a sam rozkład histogramu jest wizualnym przybliżeniem rozkładu częstotliwości lub funkcji gęstości prawdopodobieństwa.Kształt rozkładu może się zmienić w zależności od liczby pojemników.

Analiza rozkładu histogramu jest często wykorzystywana jako jakościowa kontrola normalności danych.Chociaż istnieją analityczne metody określania normalności, można zastosować histogramy, aby zapewnić szybką, zdrowa sprawdzenie rozsądku, aby zaoszczędzić czas.Jeśli dane histogramu pojawiają się z grubsza i wyśrodkowane na średniej, przyjmuje się, że dane są normalne.Chociaż szybki i stosunkowo łatwy, tego rodzaju kontrola jakościowa jest subiektywna i należy zastosować metody analityczne, jeśli wymagany jest wyższy standard dokładności.

Określenie, czy zestaw danych wykazuje skośność jest kolejnym sposobem zastosowania analizy rozkładu histogramu.Skośność danych jest zdefiniowana jako wyraźna asymetria w danych.Ujemne skośne lub skośne po lewej stronie są widoczne w zestawach danych o bardzo niewielu niskich wartościach.Pozytywne skośne lub skośne po prawej stronie występują w zestawach danych z kilkoma wysokimi wartościami.Obserwowanie rozkładu histogramu może ujawnić wartości odstające i wypaczone dane.

Oprócz ujawnienia charakterystyki danych o jednym trybie, kształt histogramu może również ujawnić charakterystykę danych multimodalnych.Multimodalne zestawy danych zawierają więcej niż jeden tryb i charakteryzują się rozkładami częstotliwości, które mają więcej niż jeden pik lub maksima.Przynależności polityczne w mieście, sondaże opinii zatwierdzają i wielkości ciał pszczół to przykłady zestawów danych, które mogą być multimodalne.Obserwowanie kształtu histogramu i odnotowanie różnych pików w danych multimodalnych może często zapewnić badaczowi większy wgląd niż proste obliczenia statystyczne jednoczynnikowe.

Analiza histogramów i rozkład danych są wysoce zależne od wybranych rozmiarów BIN.W praktyce liczba pojemników można oszacować, przyjmując pierwiastek kwadratowy liczby obserwacji, chociaż można zastosować inne rozmiary pojemników.Na przykład nauczyciel może wybrać analizę ocen testowych, wybierając rozmiary pojemników, które odzwierciedlają oceny liter.