Tabele przestawne
- Autor: Mirosław Zalewski
- 3 września 2013
- komentarzy 5
Tabele przestawne umożliwiają zestawianie, analizowanie i porównywanie dużych ilości danych. Artykuł na przykładach opisuje ich tworzenie, modyfikowanie, dostosowywanie układu oraz usuwanie. W ramach zakończenia przygotowano listę zadań, których samodzielne wykonanie pozwoli przećwiczyć przedstawione zagadnienia.
Spis treści
- Wprowadzenie
- Tworzenie tabeli przestawnej
- Modyfikowanie tabeli przestawnej
- Sortowanie tabeli przestawnej
- Grupowanie liczb
- Wykonywanie kilku obliczeń
- „Nurkowanie” w danych i wyodrębnianie wierszy spełniających kryteria
- Grupowanie tekstu
- Tabela przestawna a zmienny zbiór danych
- Usuwanie tabeli przestawnej
- Zamiast podsumowania
Wprowadzenie
Ujmując rzecz najprościej, jak to możliwe, tabele przestawne pozwalają przedstawić duży zbiór danych w bardziej przystępnej formie. Dzięki nim arkusz liczący kilka tysięcy wierszy można przekształcić w tabelę, która zmieści się na połowie kartki A4. Łączenie danych w grupy oraz dokonywanie obliczeń przebiega w pełni automatycznie, dzięki czemu oszczędzamy czas i unikamy błędów. Z kolei łatwość zmiany układu gotowego zestawienia powoduje, że na te same dane możemy spoglądać z różnych punktów widzenia.
Oczywiście ze wszystkich tych zalet będziemy mogli skorzystać tylko wtedy, gdy posiadamy zbiór danych. Najważniejsze, aby w pierwszym jego wierszu znajdowały się etykiety kolumn. Warunek ten spełnia lista pracowników fikcyjnej korporacji, którą wykorzystam w dalszej części artykułu.
Rozmaitym funkcjom tabel przestawnych przyjrzymy się poszukując odpowiedzi na następujące pytania:
- Ilu ludzi pracuje w każdym z działów?
- W którym dziale bardziej opłaca się być specjalistą — marketingu czy księgowości?
- Jak wygląda wykres zarobków w dziale marketingu, z podziałem na stanowiska?
- Jak wygląda rozkład płci osób zatrudnionych w każdym roku? W którym roku zatrudniono względnie najwięcej kobiet? W którym najmniej?
- Jakie są relatywne różnice w zarobkach na poszczególnych stanowiskach w każdym z działów?
Tworzenie tabeli przestawnej
Najpierw umieszczamy kursor gdziekolwiek w obrębie zbioru danych, a następnie wybieramy z menu Dane → Tabela przestawna → Utwórz....
Pojawi się nowe okno. Przy jego pomocy możemy określić, skąd LibreOffice ma zaczerpnąć dane do powstającej tabeli. Zazwyczaj chcemy pozostawić wartość domyślną (Bieżące zaznaczenie), więc po prostu klikamy OK.
Naszym oczom ukaże się właściwe okno konstruowania tabeli przestawnej. Składa się ono z czterech części: schematycznej reprezentacji tabeli (po lewej stronie); listy kolumn w bazie danych (mniej więcej w środku); przycisków uruchamiających akcje (z których najważniejszy jest Opcje...; po prawej) oraz opcji określających zasady konstruowania i działania tabeli wynikowej (domyślnie ukryte, pojawiające się po wciśnięciu przycisku Więcej).
Tabelę projektujemy przeciągając przyciski ze środkowej części okna na wybrane obszary po lewej.
Najważniejszy jest obszar danych — przy jego pomocy określamy obliczenia do wykonania. Wpierw definiujemy dane do wykorzystania, a następnie klikamy przycisk Opcje... po prawej stronie (lub klikamy dwukrotnie nazwę kolumny w obszarze danych). W nowym oknie możemy wybrać działanie do wykonania.
Obszar wierszy i kolumn służy do dzielenia zbioru danych na grupy — każda unikatowa wartość w wybranej kolumnie w bazie danych oznacza jedną grupę. W każdej z grup wykonane zostaną wszystkie obliczenia określone w obszarze danych. Również tutaj możemy otworzyć okienko z opcjami, przy czym ich zestaw jest inny niż w przypadku pól umieszczonych na obszarze danych.
Obszar strony pozwala w wygodny sposób określić warunki, które muszą spełniać wiersze wykorzystane do obliczeń w tabeli. Przyjrzymy się temu w dalszej części artykułu.
Ponadto warto zauważyć, że obszary wierszy, kolumn i strony są na swój sposób połączone — dany przycisk może znajdować się wyłącznie na jednym z nich. Obszar danych jest nie tylko od nich niezależny, ale również dopuszcza kilkukrotne umieszczenie tego samego przycisku (co oznacza wykonanie różnych obliczeń na tym samym zestawie danych).
Brzmi skomplikowanie? Zatem przekonajmy się, że wcale takie nie jest!
Nasze pierwsze zadanie polega na poznaniu liczby pracowników w każdym z działów. W pierwszej kolejności przeciągamy przycisk dział na obszar wierszy, aby podzielić cały zbiór na grupy. Następnie przeciągamy dowolny przycisk na obszar danych. Zauważmy, że wokół jego nazwy znajduje się ramka. Wskazuje ona, że jest on obecnie aktywny, i to właśnie jego dotyczy przycisk Opcje... po prawej. Klikamy go. Pojawi się nowe okno, w którym możemy zdefiniować działanie do wykonania. Wybieramy Liczba i klikamy OK w obu otwartych oknach.
Przed nami pojawi się niewielka tabela. Jej pierwsza kolumna zawiera nazwy poszczególnych działów, a druga — liczbę pracowników.
Modyfikowanie tabeli przestawnej
Odpowiedź na drugie pytanie będzie możliwa po porównaniu średnich zarobków specjalistów w dwóch wybranych działach.
Pierwszym krokiem jest zmodyfikowanie naszej tabeli w taki sposób, aby uwzględniała także stanowiska. W tym celu klikamy prawym przyciskiem myszy gdziekolwiek w jej obrębie i wybieramy z menu Edycja układu....
Dzielenie danych na podgrupy
Pojawi się znane nam już okno. W pierwszej kolejności usuwamy dotychczasową zawartość obszaru danych, przeciągając przycisk na środkową część okna lub zaznaczając go i klikając Usuń. Następnie wprowadzamy nową — przeciągamy przycisk płaca, klikamy Opcje... i z listy w nowym oknie wybieramy średnią. Na końcu przeciągamy przycisk stanowisko na obszar wierszy.
W efekcie uzyskaliśmy tabelę, w której poszczególne stanowiska zostały wyodrębnione w ramach działów.
LibreOffice zachowuje się tak, gdy w obszarze wierszy znajdzie się więcej niż jeden przycisk. Każdy kolejny (idąc z góry na dół) oznacza wyodrębnienie podgrup w ramach jednej grupy wyższego rzędu. Takich poziomów grupowania możemy utworzyć dowolnie wiele, chociaż odbywa się to kosztem wielkości i czytelności tabeli wynikowej. Podgrupy możemy tworzyć także w obszarze kolumn — wtedy hierarchia przebiega od lewej do prawej.
Ponieważ nasza tabela powstała na podstawie tylko dwóch rodzajów grup, możemy ją przedstawić w czytelniejszy sposób — umieszczając nazwy stanowisk w kolumnach. W tym celu należy złapać szare pole z napisem stanowisko i przeciągnąć je w lewo. Kursor myszy z pionową belką sygnalizuje, że wybrane pole zostanie przeniesione do obszaru kolumn.
Jednocześnie widzimy, skąd tabele przestawne wzięły swoją nazwę. Każdy z elementów struktury tabeli możemy dowolnie przenosić pomiędzy obszarem kolumn, wierszy oraz stron; przeciągnięcie elementu poza obszar tabeli spowoduje jego usunięcie. Jeżeli już po utworzeniu tabeli uznamy, że jej układ nie jest odpowiedni, możemy go zmienić bez konieczności otwierania dodatkowego okna.
Na koniec jeszcze krótka uwaga, jak czytać stworzoną tabelę. W każdej komórce znajduje się średnia z wierszy spełniających kryteria określone zarówno w wierszu, jak i w kolumnie. Np. komórka B7 na ilustracji powyżej pokazuje średnie zarobki koordynatorów w dziale księgowości. Komórka C9 to średnie zarobki młodszych specjalistów w dziale obsługi klienta.
Ukrywanie zbędnych wyników
Nasza tabela jest na tyle mała, że bez trudu odczytamy z niej informacje niezbędne do udzielenia odpowiedzi na zadane pytanie. Jednak łatwo sobie wyobrazić o wiele bardziej skomplikowane zestawienie, liczące kilkanaście wierszy (działów) i kolumn (stanowisk). W takich sytuacjach warto wyeksponować określone dane, ukrywając niepożądane komórki.
Aby to zrobić, należy kliknąć strzałkę w dół na szarym polu z nazwą kolumny wykorzystanej do wyodrębnienia grup. Pojawi się niewielkie okienko, za pomocą którego możemy wybrać widoczne wartości; sposób jego działania jest identyczny jak w przypadku okienka autofiltru.
Tak więc klikamy na pole stanowisko i odznaczamy wszystkie pozycje oprócz specjalista. Następnie otwieramy okienko dla pola dział, gdzie zaznaczamy Księgowość i Marketing.
Od teraz tabela powinna zawierać wyłącznie informacje niezbędne do udzielenia odpowiedzi na postawione pytanie.
Istnieją jeszcze dwa sposoby na wyświetlenie tylko tych informacji, których naprawdę potrzebujemy. Ponieważ efekty ich działania są praktycznie identyczne, większości użytkowników wystarczy znajomość tylko jednej z omówionych technik. W związku z tym niecierpliwym czytelnikom polecam przejście bezpośrednio do rozwiązania trzeciego zadania, gdzie zapoznają się z możliwościami sortowania tabel przestawnych.
Obszar strony
Jak pamiętamy, interesują nas średnie zarobki w różnych działach, ale na porównywalnym stanowisku. Tabelę możemy więc zaprojektować w taki sposób, aby uwzględniała wyłącznie specjalistów. Służy do tego obszar strony.
Przede wszystkim musimy przywrócić tabelę do stanu sprzed ukrycia części komórek. Następnie klikamy na nią prawym przyciskiem myszy i wybieramy z menu Edycja układu.... Przycisk stanowisko przenosimy z obszaru kolumn na obszar strony.
W tabelach wykorzystujących grupowanie, filtrowanie przy pomocy obszaru strony czasem prowadzi do niespodziewanych wyników (#63998). Błąd ten występuje tylko w wersjach od 4.0.0 do 4.0.4, włącznie.
Po zatwierdzeniu zmian zauważymy, że nasza tabela liczy tylko dwie kolumny, a nad nią pojawiło się szare pole z napisem stanowisko. Komórka na prawo od niego zawiera strzałkę w dół, której kliknięcie otwiera nowe okno. Przy jego pomocy możemy określić, które wiersze mają być brane pod uwagę podczas konstruowania tabeli. (Nawiasem mówiąc, okno to zostało przeprojektowane w wersji 4.0.0 pakietu. We wcześniejszych możliwe było wybranie tylko jednej wartości z listy).
Klikamy więc na wspomnianą strzałkę i odznaczamy wszystkie pozycje oprócz specjalista.
Filtrowanie
Kolejnym sposobem na skonstruowanie tabeli wyłącznie przy pomocy wierszy spełniających określone kryteria jest filtrowanie.
Wpierw powinniśmy usunąć z układu tabeli pole stanowisko. W ten sposób otrzymamy proste zestawienie średnich zarobków w każdym z działów.
Następnie klikamy przycisk Filtr nad tabelą przestawną. Pojawi się nowe okno. Za jego pomocą możemy określić warunki, które muszą spełniać wiersze, aby zostały użyte do utworzenia tabeli. Nas oczywiście interesują wyłącznie te, w których stanowisko jest równe specjalista.
Po zatwierdzeniu zmian nasza tabela będzie przedstawiała średnie zarobki specjalistów w każdym z działów.
Aby usunąć filtr, należy ponownie otworzyć jego okno i ze wszystkich list rozwijanych w kolumnie Nazwa pola wybrać - brak -.
Różnice między ukrywaniem, obszarem strony a filtrowaniem
Wszystkie opisane powyżej techniki — ukrywanie zbędnych wartości, obszar strony oraz filtrowanie — prowadzą do tego samego wyniku. Czym się w takim razie różnią?
Przede wszystkim widocznością. Ukrycie części komórek oraz wykorzystanie obszaru strony skutkuje wyraźną informacją zwrotną. Inaczej ma się sprawa z filtrem — aby sprawdzić, czy został nałożony, trzeba otworzyć specjalne okno.
Po drugie, ukrywanie komórek oraz obszar strony pozwalają na stopniowe wprowadzanie zmian (dla każdego zbioru grup osobno). Z kolei okno filtru zostało zaprojektowane w taki sposób, aby przyspieszać definiowanie wszystkich warunków jednocześnie. Tak więc aby sprawnie korzystać z filtru, powinniśmy już na wstępie wiedzieć, co tak naprawdę chcemy uzyskać.
Z drugiej strony, gdy mamy jasno określony cel, to właśnie filtr oferuje najkrótszą drogę do niego. Pozostałe techniki wymagają tyle samo lub więcej kliknięć myszką.
Nie bez znaczenia pozostaje również zakres możliwości. Z nie do końca jasnego powodu okienko filtru umożliwia wybranie tylko trzech kryteriów doboru wierszy. Bardziej skomplikowane formuły filtrowania są możliwe tylko przy wykorzystaniu pozostałych technik.
Koniec końców, różnice te zazwyczaj można pominąć. Żaden ze sposobów nie jest wyraźnie lepszy niż pozostałe. W związku z tym najlepiej wypróbować każdy z nich i pozostać przy tym, który najbardziej nam odpowiada.
Sortowanie tabeli przestawnej
Trzecie zadanie polega na przygotowaniu wykresu średnich zarobków na każdym ze stanowisk w dziale marketingu. Przede wszystkim musi więc przygotować tabelę przestawną ukazującą potrzebne informacje. Ja wykorzystam grupowanie dwupoziomowe i w każdym z działów wyodrębnię poszczególne stanowiska; zachęcam jednak do wypróbowania technik opisanych powyżej.
Po utworzeniu tabeli zaznaczamy odpowiednie komórki i wybieramy z menu Wstaw → Wykres....
W moim przypadku zauważalny jest ten sam problem, z którym zetknęliśmy się podczas pracy z sumami częściowymi — pierwsza kolumna dotyczy koordynatorów, których zarobki są największe. Akurat tutaj tylko zaburza to estetykę wykresu, ale gdyby kolumn było więcej, mogłoby nawet utrudniać poprawne odczytanie danych.
Niedogodności tej możemy się pozbyć poprzez odpowiednie uporządkowanie danych. Istnieją dwa na to sposoby — ręczny i automatyczny. Przyjrzymy się im po kolei, a potem zwrócimy uwagę na różnice między nimi.
Sortowanie ręczne, jak sama nazwa wskazuje, polega na samodzielnym określeniu kolejności wierszy. W tym celu należy zaznaczyć etykiety wierszy, a potem przeciągnąć je w inne miejsce. Oczywiście zmian możemy dokonywać tylko w obrębie danej grupy — nie można więc przenieść specjalistów z działu księgowości nad koordynatorów z działu marketingu.
Aby zaznaczyć tylko jedną komórkę, należy przytrzymać klawisz Ctrl, a następnie kliknąć na nią lewym przyciskiem myszy.
Niestety, Calc nie pozwala na przesunięcie komórki pod ostatnią w danej grupie. Jeżeli więc chcę umieścić koordynatorów na końcu listy, muszę to zrobić na około — zaznaczając wszystkie komórki ze specjalistami i przeciągając je nad pierwszą.
Sortowanie automatyczne jest odrobinę bardziej skomplikowane. Przede wszystkim musimy otworzyć okno zmiany układu tabeli przestawnej. Następnie wybieramy przycisk określający grupy, których kolejność chcemy zmienić (w moim przypadku — stanowisko) i klikamy Opcje....
W oknie, które się pojawi, możemy określić sposób obliczania sum częściowych. Ponieważ nie są nam one potrzebne, ponownie klikamy Opcje....
Dopiero w tym oknie znajdziemy ustawienia sortowania; znajdują się one w jego górnej części. Z listy rozwijanej wybieramy Średnia - płaca, a obok zaznaczamy Rosnąco. Zamykamy wszystkie trzy okna przy pomocy przycisku OK.
Najważniejsza różnica pomiędzy omówionymi sposobami sortowania widoczna jest w tabelach przedstawiających grupowanie wielopoziomowe. Otóż wykorzystanie metody ręcznej skutkuje identycznym ułożeniem etykiet we wszystkich wyodrębnionych grupach. Tymczasem metoda automatyczna sortuje każdą z wyróżnionych grup niezależnie od pozostałych.
W naszym przypadku obie metody dadzą taki sam efekt. Polecam jednak zmienić dane źródłowe w taki sposób, aby któryś ze specjalistów zarabiał bardzo dużą kwotę (rzędu miliona złotych). Wtedy sortowanie automatyczne utworzy tabelę, której ręczne skonstruowanie nie jest możliwe.
Grupowanie liczb
Odpowiedź na czwarte pytanie będzie możliwa po zestawieniu ze sobą liczby kobiet i mężczyzn przyjętych do pracy w każdym roku. W tym celu musimy utworzyć nową tabelę przestawną.
W obszarze wierszy umieszczamy data zatrudnienia a w obszarze kolumn płeć. Na obszar danych możemy przeciągnąć dowolny przycisk; w jego ustawieniach musimy zmienić rodzaj działania na Liczba.
Ponieważ Calc uznał każdą unikatową datę za osobną grupę, powstała tabela liczy stanowczo zbyt dużo wierszy. Naszym pierwszym zadaniem jest więc zredukowanie ich liczby.
W tym celu umieszczamy kursor gdziekolwiek w obrębie kolumny A i z menu wybieramy Dane → Konspekt → Grupuj....
Pojawi się nowe okno. Za jego pomocą możemy utworzyć własne kategorie grupowania danych. Wystarczy określić wartość początkową, końcową oraz szerokość przedziałów. Arkusz potrafi również wykryć, że ma do czynienia z godzinami lub datami — proponuje wtedy dodatkowe opcje podziału (na godziny, dni, kwartały itp.).
Ponieważ chcemy uwzględnić wszystkie lata działalności firmy, początek i koniec przedziału ustawiamy Automatycznie. W dolnej części wybieramy Odstępy, a na liście po prawej stronie zaznaczamy tylko Lata. Gdybyśmy dodatkowo zaznaczyli inną pozycję, wtedy utworzymy grupowanie wielopoziomowe (np. po zaznaczeniu Miesiące każdy rok zostanie podzielony na poszczególne miesiące). Klikamy OK.
Teraz, gdy tabela jest o wiele czytelniejsza, widoczny jest jej drugi problem — przedstawia ona liczby bezwzględne, których porównywanie może prowadzić do błędnych wniosków. Weźmy na przykład lata 1995 i 1999. Zestawienie pokazuje, że w 1995 zatrudniono więcej kobiet niż w roku 1999 (12 do 10); ale to w 1999 zatrudniono mniej osób. Kobiety stanowiły 66% nowych pracowników w roku 1999, ale tylko 60% w 1995. Okazuje się więc, że to 1999 był bardziej „przychylny” dla kobiet.
Aby ustrzeć się pułapek tego typu, liczby w tabeli powinniśmy zastąpić miarami względnymi. Efekt ten uzyskamy bez wykorzystania choćby jednej formuły, jeżeli zagłębimy się w ustawienia pozycji na obszarze danych.
Otwieramy więc okno edycji układu tabeli. Klikamy dwukrotnie na jedyny przycisk w obszarze danych, a w nowym oknie klikamy Więcej.
Pojawią się trzy listy rozwijane. Chociaż wyglądają niepozornie, razem tworzą jeden z najbardziej skomplikowanych elementów projektowania tabeli przestawnej. Jego opanowanie wymaga trochę praktyki, dlatego polecam poeksperymentować z doborem różnych parametrów i samodzielnie przekonać się, jak wpływają one na zawartość tabeli. Wszystkie opcje są — lepiej lub gorzej — opisane w pomocy programu.
My chcemy odnieść liczbę ludzi każdej z płci do ogólnej liczby nowych pracowników w danym roku. Dlatego z listy rozwijanej Typ wybieramy % przez wiersz. Pozostałe listy są nieaktywne, więc jedynie zatwierdzamy zmiany w obu oknach.
Tabela jest już praktycznie skończona. Jednak nadal możemy mieć wobec niej pewne zastrzeżenie — otóż nie ułatwia nam ona znalezienia odpowiedzi na dalszą część postawionego pytania (w których latach zatrudniono względnie najwięcej i najmniej kobiet). Możemy to zmienić porządkując wiersze w kolejności rosnącej względem wartości w drugiej kolumnie.
Naturalnym krokiem wydaje się zmiana ustawień sortowania w ustawieniach obszaru wierszy, tak jak to zrobiliśmy podczas przygotowywania wykresu zarobków w dziale marketingu. Niestety, tak zmodyfikowana tabela nie będzie szczególnie pomocna — Calc zignoruje procenty, a weźmie pod uwagę liczby absolutne.
Dlatego musimy skorzystać z ogólnego mechanizmu sortowania. Wpierw zaznaczamy obszar, w którym chcemy zmienić kolejność (zakres A6:D24). Następnie wybieramy z menu Dane → Sortuj.... W nowym oknie dobieramy klucz oraz kierunek sortowania (kolumna B, rosnąco); upewniamy się również, że na karcie Opcje odznaczone jest pole Zakres zawiera etykiety kolumn.
Po zatwierdzeniu zmian nasza tabela będzie dokładnie taka, jak tego chcieliśmy. Bez trudu odczytamy z niej, iż relatywnie najwięcej kobiet zatrudniono w 2013 roku, a relatywnie najmniej w 1997.
Wykonywanie kilku obliczeń
Ostatnie zadanie wymaga od nas wykonania większości z działań, które omówiliśmy do tej pory; przy okazji zobaczymy, jak będzie wyglądała tabela, gdy na obszarze danych umieścimy więcej niż jeden przycisk.
Przede wszystkim musimy zaprojektować nową tabelę. Ponownie zestawimy ze sobą dział (obszar wierszy) ze stanowisko (obszar kolumn). W obszarze danych umieszczamy płaca, po czym klikamy przycisk Opcje.... W nowym oknie wybieramy średnią, a w części Więcej kolejno: Różnica z, stanowisko oraz - poprzedni element -.
Zatrzymajmy się na chwilę przy tych ustawieniach. Kazaliśmy LibreOffice przedstawić różnice pomiędzy wartością obliczoną w danej komórce a punktem odniesienia zdefiniowanym przy pomocy pozostałych dwóch list.
Za pomocą pierwszej z nich wybieramy kolumnę z bazy danych. Chociaż dostępne są wszystkie z nich, działanie będzie miało sens tylko wtedy, gdy wybierzemy jedną z umieszczonych w obszarze wierszy lub kolumn tabeli przestawnej.
Druga pozwala określić konkretną grupę w ramach kolumny. Pierwsze dwie opcje — - poprzedni element - oraz - następny element - — mają szczególne znaczenie. Powodują one, że punktem odniesienia jest komórka w bezpośrednim sąsiedztwie „aktualnej”, zgodnie z poniższą tabelą:
poprzedni element | następny element | |
---|---|---|
obszar wierszy | powyżej | poniżej |
obszar kolumn | na lewo | na prawo |
Możemy zamknąć okno ustawień pola płaca, ale nie zamykamy jeszcze okna układu tabeli.
Przechodzimy do ustawień pola stanowisko w obszarze kolumn, gdzie nakazujemy sortowanie wartości rosnąco według Średnia - płaca. W ten sposób tabela wynikowa będzie łatwiejsza do odczytania. Nie mogliśmy tego zrobić wcześniej, ponieważ obszar danych był pusty.
Zatwierdzamy zmiany we wszystkich otwartych oknach.
Powstała tabela ukazuje różnice pomiędzy średnimi zarobkami na określonym stanowisku a średnimi zarobkami na stanowisku niższym w hierarchii. Pierwsza kolumna jest pusta, ponieważ zawiera pozycje umiejscowione najniżej. Druga kolumna pokazuje, o ile więcej zarabiają specjaliści od młodszych specjalistów (gdyby któraś z liczb była ujemna, znaczyłoby to, że specjaliści zarabiają mniej niż młodsi specjaliści). Trzecia kolumna zawiera informacje o tym, o ile więcej zarabiają starsi specjaliści od specjalistów. Wreszcie czwarta przedstawia różnice pomiędzy koordynatorami a starszymi specjalistami.
Tak przygotowane zestawienie daje nam pewne informacje na temat opłacalności awansu w tej firmie. Jednak podane różnice są wyrażone w liczbach bezwzględnych, a te — jak pamiętamy z odpowiedzi na czwarte pytanie — czasami dają fałszywy obraz rzeczywistości. Dlatego warto spojrzeć na nasze dane z trochę odmiennej perspektywy.
Ponownie otwieramy okno edycji układu tabeli i przeciągamy płacę na obszar danych (tak, aby były dwie). Wciskamy Opcje.... W nowym oknie powtórnie wybieramy średnią, zaś w części Więcej — % różnica z, stanowisko oraz - poprzedni element -. Zatwierdzamy zmiany.
Dopiero teraz widzimy, że wraz z przemieszczaniem się na wyższe szczeble firmowej drabiny, relatywna korzyść z awansu (w odniesieniu do dotychczasowej pensji) maleje; biorąc pod uwagę tylko i wyłącznie aktualną pensję, bardziej „opłaca” się awansować z młodszego specjalisty na specjalistę, niż ze starszego specjalisty na koordynatora.
„Nurkowanie” w danych i wyodrębnianie wierszy spełniających kryteria
Dotychczas tabele przestawne wykorzystywaliśmy wyłącznie do odnajdywania odpowiedzi na postawione pytania. Jednak mogą one posłużyć również do wstępnej analizy danych i przygotowywania zestawień ad hoc.
Powróćmy do naszej pierwszej tabeli, przedstawiającej liczbę pracowników w każdym z działów. Przypuśćmy, że chcielibyśmy sprawdzić strukturę płci w zarządzie.
Okazuje się, że możemy to zrobić bez zmiany układu tabeli. Wystarczy bowiem kliknąć na etykietę „Zarząd” w pierwszej kolumnie. Pojawi się nowe okno — za jego pomocą określamy, na jakie podgrupy ma zostać podzielona nasza kategoria pracowników. My oczywiście klikamy płeć i zatwierdzamy zmiany. Teraz możemy kliknąć dwukrotnie na nazwę innego działu, aby poznać rozkład płci jego pracowników.
Klikając dwukrotnie na komórkę z danymi utworzymy nowy arkusz zawierający wszystkie wiersze, które zostały wykorzystane do obliczenia przedstawionej wartości. Jest to szczególnie przydatne wtedy, gdy chcemy wykonać jakąś niestandardową operację matematyczną na wybranej grupie.
Grupowanie tekstu
Poszukując odpowiedzi na czwarte pytanie, zmniejszyliśmy liczbę wierszy w tabeli przestawnej przy pomocy grupowania automatycznego. Okazuje się, że grupy o arbitralnie ustalonym składzie możemy tworzyć również dla danych tekstowych.
W tym celu należy zaznaczyć pożądane elementy (najlepiej klikając na nie, gdy trzymamy klawisz Ctrl) i wybrać z menu Dane → Konspekt → Grupuj. Wszystkie wybrane wiersze zostaną zgrupowane. Operację powtarzamy dla pozostałych interesujących nas grup.
Tabela przestawna a zmienny zbiór danych
Wszystkie nasze zadania zakładały, że źródłowy zbiór danych jest niezmienny. Jednak siła tabel przestawnych tkwi w tym, że przy ich pomocy można regularnie analizować dynamiczny zbiór danych. Dzięki temu raz zaprojektowana tabela może nam służyć przez długi czas.
Musimy przy tym zwrócić uwagę na dwie kwestie.
Po pierwsze, tabela nie odświeża się automatycznie. Dlatego zmiany wprowadzone w danych źródłowych nie znajdują w niej odzwierciedlenia natychmiast. Musimy kliknąć na którąś z komórek w tabeli prawym przyciskiem myszy i wybrać z menu Odśwież.
Po drugie, tabela nie rozszerza automatycznie zakresu danych, na których pracuje. Jeżeli więc do naszej bazy wyłącznie dodajemy nowe wiersze, musimy otworzyć okno zmiany układu tabeli i w części Więcej ręcznie dostosować zawartość pola Wybór od.
Usuwanie tabeli przestawnej
Gdy uznamy, że tabela przestawna nie jest nam już potrzebna, zapewne zechcemy ją usunąć. Możemy to zrobić na kilka sposobów.
Podstawowym jest umieszczenie kursora gdziekolwiek w jej obrębie i wybranie z menu Dane → Tabela przestawna → Usuń.
Możemy także kliknąć prawym przyciskiem myszy na którąś z jej komórek i wybrać z menu kontekstowego Usuń.
Inne podejście wykorzystuje fakt, że tabela przestawna jest jedynie specjalnie przygotowanym zestawem komórek. Możemy więc zaznaczyć je wszystkie (nie zapomnijmy o polu filtrowania na górze!) i wybrać z menu Edycja → Usuń zawartość (klawisz Backspace). W nowym oknie powinniśmy zaznaczyć pozycję Usuń wszystko.
Ponieważ domyślnie tabela jest tworzona w nowym arkuszu, możemy po prostu go usunąć. W ten sposób wymażemy z pliku wszelkie o niej informacje.
Zamiast podsumowania
Tabele przestawne są niezwykle obszernym tematem i żaden artykuł, nawet tak długi jak ten, nie jest w stanie poruszyć wszystkich zagadnień z nimi związanych.
Jednak dla czytelników, którzy dopiero poznają możliwości tabel przestawnych, ważniejsze od poznania najdrobniejszych szczegółów ich funkcjonowania jest nabranie ogólnego obycia w pracy z nimi. Dlatego artykuł kończę listą zadań do samodzielnego wykonania. Odpowiedzi na wszystkie z pytań wymagają utworzenia tylko jednej tabeli.
Pytania do arkusza zawierającego listę pracowników fikcyjnej korporacji:
- W którym miesiącu najwięcej osób podpisuje umowę na czas nieokreślony?
- Ile kobiet zatrudniono w 2005 roku w dziale obsługi klienta?
- Na jakich stanowiskach pracuje najwięcej osób zatrudnionych na umowę zlecenie?
- W którym dziale odsetek osób zatrudnionych na umowę na czas określony jest najwyższy?
- Jaką część całości wydatków na pensje pracowników stanowią zarobki koordynatorów w zarządzie?
Pytania do arkusza zawierającego listę laureatów Nagrody Nobla:
- Ile nagród przyznano w każdej z dziedzin? W którym roku przyznano pierwszą nagrodę w dziedzinie, w której liczba nagród jest najmniejsza?
- Ile lat mieli fizycy w roku otrzymania nagrody Nobla? Podaj średnią oraz stwórz wykres dla pięcioletnich przedziałów. (Odpowiedź na to pytanie wymaga utworzenia nowej kolumny w bazie danych).
- Kto może pochwalić się wieloma nagrodami Nobla? (Odpowiedź na to pytanie wymaga utworzenia nowej kolumny lub wykorzystania funkcji WYSZUKAJ.PIONOWO, szczegółowo opisanej w ostatniej części artykułu o tworzeniu dziennika ucznia).
Super artykuł, wielkie podziękowania dla Autora
Wielkie dzięki, bardzo obrazowe opracowanie podstaw tabel, rozkminiam ten temat na open office akurat, ale analogia jest bardzo ścisła!
Bardzo mi się przydało, dziękuję:)
1. Dlaczego nie ma sortowania naturalnego w tabelach ?
2. Dlaczego nie można wyłączyć wszelkich formuł (sumy, średnie itp) – chcę mieć wykaz wszystkich elementów w danej kategorii przedzielonych średnikiem lub czymś innym (w excelu jest), nie chcę dokonywać na nich żadnych obliczeń.
Bardzo potrzebuję zrobić tabelę przestawną, ale mam problem mój office’a nie ma mozliwości ustawienia grupowania, grupuje tylko po kolumnach lub wierszach. Rozumiem też że róznica może wynikać ze środowiska. Ja działam na Win 7, a Pan na linuxie.. Może zna Pan rozwiązanie na moj problem?