Tworzenie tabel częstości w LibreOffice Calc
- Autor: Mirosław Zalewski
- 18 czerwca 2013
- Możliwość komentowania Tworzenie tabel częstości w LibreOffice Calc została wyłączona
Tabela częstości jest jednym z najpowszechniej stosowanych sposobów prezentacji rozkładu zmiennej. Artykuł opisuje, jak stworzyć ją przy pomocy LibreOffice Calc.
Przede wszystkim będziemy potrzebowali zbioru danych. Ja wykorzystam dość prosty arkusz zawierającą tylko dwie kolumny. W jednej umieszczony został identyfikator wiadomości, w drugiej — jej długość (w znakach). Plik do pobrania.
Nasza praca opierać się będzie na funkcji CZĘSTOŚĆ. Przyjmuje ona dwa argumenty. Pierwszym jest zakres komórek z danymi. Drugim — zakres komórek z klasami danych. Dla każdej z komórek w drugim zakresie funkcja liczy, ile wartości w zbiorze danych jest mniejszych lub równych. Ujmując rzecz bardziej formalnie, liczby określone w zakresie klas oznaczają górne granice zbiorów prawostronnie domkniętych.
Tak więc naszym pierwszym zadaniem jest stworzenie listy klas. W wielu przypadkach interwały mogą być równe i wystarczy wpisać po prostu 10, 20, 30 itd.
Jednak w moim pliku rozkład koncentruje się wokół najniższych wartości. Dlatego pierwsza klasa będzie zawierała najkrótsze wiadomości, liczące do 10 znaków. Druga trochę dłuższe, do 100 znaków. Następnych dziewięć przedziałów będzie miało równe rozpiętości; górna granica będzie zwiększana o 100 znaków. Ostatnia kategoria obejmie wiadomości dłuższe niż 1001 znaków.
Chociaż przedziały klasowe wyrażone w ten sposób są odpowiednie dla arkusza kalkulacyjnego, większość ludzi będzie miało kłopoty z ich zrozumieniem. Dlatego w kolumnie po prawej stronie przygotujemy bardziej czytelne etykiety. Wykorzystamy do tego funkcję o wszystko mówiącej nazwie ZŁĄCZ.TEKSTY. Do komórki F2 wpisujemy formułę:
=ZŁĄCZ.TEKSTY(E1+1;"-";E2)
Kopiujemy ją w dół kolumny. Należy pamiętać o tym, że ostatni przedział jest otwarty — jego etykietę musimy wpisać ręcznie.
Wreszcie możemy przejść do głównego punktu programu, czyli wykonania tabeli częstości. W komórce G2 wprowadzamy formułę:
=CZĘSTOŚĆ(B2:B7755;E2:E12)
Ponieważ jest to formuła macierzowa, zatwierdzamy ją klawiszami Ctrl + Shift + Enter.
Otrzymany wynik zawiera o jedną komórkę więcej, niż liczył zakres klas. Wynika to z faktu, iż funkcja CZĘSTOŚĆ w ostatniej komórce podaje informację o tym, ile wartości nie zostało zaklasyfikowanych do żadnej z kategorii.
Tabelę warto jeszcze uzupełnić o kolumnę zawierającą odsetki.
W tym celu najpierw dodamy wiersz podsumowania. Przy pomocy funkcji SUMA obliczymy liczbę wszystkich wysłanych wiadomości:
=SUMA(G2:G13)
Następnie w komórce H2 umieszczamy formułę obliczającą, jaki procent ogółu wiadomości stanowi dana klasa (należy zwrócić uwagę na adresowanie bezwzględne):
=G2/$G$14*100
Kopiujemy ją do pozostałych komórek w kolumnie. Wszystkim z nich zmieniamy format w taki sposób, aby ograniczyć wyświetlaną liczbę miejsc po przecinku.
Tak przygotowaną tabelę częstości możemy skopiować do dokumentu tekstowego albo wykorzystać do stworzenia wykresu rozkładu zmiennej.