Histogram

Wstęp

Histogram jest uważany za jeden z siedmiu podstawowych narzędzi doskonalenia jakości, którego zastosowanie w statystyce jest bardzo szerokie. Dzięki histogramowi możemy graficznie przedstawić rozkład badanej cechy (np. wymiaru, wagi, temperatury itp.) i przez to lepiej zrozumieć analizowany proces lub jego wyroby.

Co to jest histogram?

Histogram jest to wykres przedstawiający rozkładu badanej cechy (np. szerokości wyrobu) w formie pewnej ilości prostokątów, umieszczonych na osi współrzędnych X-Y. Szerokość prostokąta (W) reprezentuje pewien zakres wartości badanej cechy, natomiast wysokość prostokąta (H) reprezentuje ilość przypadków (częstotliwość), gdy badana cecha zawiera się w danym zakresie. Poniższy rysunek przedstawia przykładowy histogram.

Histogram

Powyższy histogram przedstawia wyniki pomiaru długości 53 metalowych prętów po procesie ich cięcia na wymiar 100mm +/- 3mm.

Jak rozumieć pojedynczy prostokąt?

Prostokąt zaznaczony na kolor żółty przedstawia 10 elementów (H) o długości zawierających się w zakresie od 99.75 do 100.25 natomiast prostokąt w kolorze zielonym reprezentuje 9 prętów o długości znajdującej się w zakresie 99.25 - 99.75.

Jak przygotować histogram?

Zebranie wyników pomiarowych

  1. Należy zebrać minimum 50 pomiarów, aby histogram mógł w miarę dobrze odwzorować badaną cechę w całej populacji. Oczywiście im więcej wyników zostanie zebrane, tym bardziej histogram będzie podobny do badanej populacji, dlatego zalecam pobieranie większej liczny próbek o ile to tylko możliwe.
  2. Pobierając próbki należy zadbać o to, aby pobierać próbki w sposób losowy.
  3. Oczywiście należy upewnić się, czy metoda pomiaru danej cechy jest poprawna.

Ustalenie ilości przedziałów (ilości prostokątów)

  1. Ustal rozstęp (ang. "range") dla całej pobranej próbki (wszystkich wyników). Rozstęp to wynik odejmowania najmniejszej wartości z próbki od wartości największej.
    histogram - jak obliczyć?
  2. Określ liczbę potrzebnych przedziałów (ang. "bins"). Nie jest to łatwe zadanie gdyż, nie ma jednego sposobu na określenie ilości przedziałów. Stosuje się wiele różnych metod:
    1. Liczba przedziałów (k) to pierwiastek kwadratowy z ilości obserwacji zaokrąglony do najbliższej liczby całkowitej [1].
      histogram - ilość przedziałów?
    2. Drugim rozwiązaniem jest dzielenie wg normy DIN 55302, korzystając z poniższej tabeli [2]:
      Ilość próbek
      n
      Ilość przedziałów
      k
      do 50nie możliwe
      do 100nie mniej niż 10
      do 1000nie mniej niż 13
      do 10000nie mniej niż 16
    3. W literaturze amerykańskiej spotykana też jest taka tabela [1]:
      Ilość próbek
      n
      Ilość przedziałów
      k
      do 505 - 7
      50 - 996 - 10
      100 - 2507 - 12
      powyżej 25010 - 20
    4. Norma CNOMO Norm E41.32.110N (PSA - Peugeot, Citröen, Renault) zaleca następujący sposób [2]:
      histogram - metoda CNOMO

Obliczenie szerokości przedziałów

Szerokość przedziału (W) możemy obliczyć na podstawie następującego wzoru:

histogram - szerokość przedziału

gdzie k to uprzednio obliczona ilość przedziałów a R to także uprzednio obliczony rozstęp.

Szerokość przedziału (W) należy zaokrąglić w górę do takie samego miejsca po przecinku, co zebrane dane pomiarowe.

Określenie wartości dla poszczególnych przedziałów

Dolną granicę dla pierwszego przedziału możemy określić jako minimalną wartość z danych pomiarowych. Jego górna granica to początek kolejnego przedziału. Kolejne przedziały wyznaczamy kolejno dodając do siebie szerokości przedziałów (W).

Należy pamiętać, aby przedziały wzajemnie się wykluczały, czyli inaczej mówiąc obserwacje, które znajdują się "na granicy przedziałów" mogą należeć tylko do jednego z nich.

Poniższa tabela zawiera przykładowe zestawienie poszczególnych przedziałów dla k=7, w=0,8 i najmniejszej wartości w obserwacjach = 97,5

PrzedziałZakres przedziałuIlość obserwacji w przedziale
197,50 - 98,29
298,30 - 99,09
399,10 - 99,98
499,90 - 100,69
5100,70 - 101,49
6101,50 - 102,29
7102,30 - 103,09

Określenie ilości obserwacji w danym przedziale

Po określeniu zakresów policz ile wyników pomiarów (obserwacji) należy do poszczególnych przedziałów. Każdą obserwacje zaznacza jedną pionową kreską I

PrzedziałZakres przedziałuIlość obserwacji w przedziale
197,50 - 98,29III
298,30 - 99,09IIIIII
399,10 - 99,98IIIIIIIIIIII
499,90 - 100,69IIIIIIIIIIIIIIII
5100,70 - 101,49IIIIIIIIII
6101,50 - 102,29IIIII
7102,30 - 103,09I

To co otrzymaliśmy to właśnie histogram.

W swojej pracy stosuję oprogramowane Minitab 15, gdzie wykonanie histogramu jest bardzo proste i nie muszę tracić czasu na obliczenia i wykonywanie wykresu. Dodatkowo w Minitab 15 można całkiem wygodnie zmieniać parametry histogramu, porównywać wiele histogramów ze sobą oraz przyporządkować odpowiedni model matematyczny do badanego rozkładu.

Zapraszam do zapoznanie się z możliwościami, jakie oferuje Minitab 15 - pobierz oprogramowanie

Histogram - jak analizować?

Średnia

Średnia (ang "mean") pozwala nam na oszacowanie, gdzie jest środek analizowanego zbioru obserwacji. Dzięki temu możemy lepiej zrozumieć, jaka jest średnia wartość cechy i ewentualnie porównać ją ze średnia w innych histogramach o podobnej lub nieco innej zmienności. Poniższy wykres przedstawia dwa histogramy o tej samej ilości obserwacji (53), podobnej zmienności lecz o innej średniej. Dla wykresu A średnia wynosi 100.1 natomiast dla wykresu B średnia wynosi 102.1

histogram - środek procesu

Zmienność

Szerokość histogramu odzwierciedla stopień zmienności badanej cechy. Im szerszy jest histogram tym większa jest zmienność, im węższy histogram tym zmienność jest mniejsza. Zmienność najczęściej jest opisywana za pomocą odchylenia standardowego oznaczonego literą s lub σ (grecka litera sigma). Czasami stosuje się też oznaczenie StDev (ang. "standard deviation").

Im większe jest odchylenie standardowe tym większa jest zmienność danej cechy.

Poniższy wykres przedstawia dwa histogramy o tej samej liczbie obserwacji i średniej ale o różnej zmienności. Wykres A jest szerszy od wykresu C. Odchylenie standardowe dla A wynosi σ = 1.078 natomiast wykres C ma odchylenie standardowe równe σ = 0.575.

histogram - środek procesu

Kształt

W naturze (w przyrodzie) większość cech, które chcielibyśmy opisać za pomocą histogramu ma rozkład normalny o ile nie występują jakieś zaburzenia, które zmieniają ten rozkład na inny niż normalny. Te zaburzenia określa się mianem "przyczyn specjalnych" (ang. "special cause").

Aby przeczytać cały artykuł musisz się zalogować. Jeżeli nie posiadasz konta Zarejestruj się.
Rejestracja i dostęp do większości artykułów jest darmowy
Autor: Zbigniew Huber
Dodano dnia: 2007-12-10
Odnośniki:
  1. M. Brassard, D.Ritter "Pomocnik Pamięci" Wydanie 1, GOAL/QPC, Methuen MA USA, 1994
  2. E.Dietrich, A.Schulze "Metody Statystyczne w kwalifikacji środków pomiarowych maszyn i procesów produkcyjnych" Wydanie 1, Notika System, 2000