Cel próbkowania w audycie
Audytor ma do czynienia z wyborem próby (badanie wyrywkowe) podczas badania dużego zbioru danych (dużej populacji), który nie jest możliwy do weryfikacji w całości, lub gdy weryfikacja w całości jest zbyt czasochłonna i niekonieczna. Podczas wyboru próby istotne jest, aby po weryfikacji wybranej próby możliwe było wypowiedzenie się lub wnioskowanie o całym zbiorze danych. Można to osiągnąć dobierając próbę na kilka sposobów, tj. próbkowanie celowe, próbkowanie statystyczne, próbkowanie quasi-statystyczne lub jakiekolwiek połączenie tych trzech (najczęściej spotykane w praktyce), jako że nie są one wzajemnie wykluczające się. W pozostałej części artykułu omówione zostaną dokładniej metody doboru próby według trzech wymienionych sposobów.
Próba celowa
Dobór próby celowej polega na określeniu przez audytora kryteriów doboru próby z populacji. Przykładami kryteriów mogą być np.: istotność danej pozycji w populacji (np. populacja: przychody per kontrahent, próba: kontrahent odpowiadający za największy przychód), nietypowość/nielogiczność danej pozycji (także kilku pozycji) w porównaniu do pozostałej części populacji, gdy oczekujemy typowych pozycji (np. populacja: przychody per kontrahent, próba: kontrahent z ujemnymi przychodami), ryzyko dla danej pozycji (zidentyfikowane na podstawie profesjonalnego osądu audytora lub wcześniej wykonanych procedur). Możliwe jest również łączenie różnych kryteriów, np. wybór największej z nietypowych pozycji (np. populacja: zobowiązania per dostawca, próba: odbiorca z największym saldem zobowiązań). Wadami celowego doboru próby jest to, że nie można łatwo ekstrapolować wniosków na całą populację podlegającą badaniu. Zaletami doboru celowego jest oprócz szybkości i łatwości doboru próby również wykorzystywanie profesjonalnego osądu audytora (w zależności od doświadczenia i kwalifikacji, może być to również wada).
Próbkowanie statystyczne
Próba statystyczna, zgodnie z Międzynarodowym Standardem Rewizji Finansowej 530, wykazuje następujące cechy: wybór pozycji próbki następuje losowo oraz do oceny wyników badania próby, w tym do pomiaru ryzyka próbkowania, stosuje się rachunek prawdopodobieństwa. Metoda, która nie posiada dwóch powyżej wymienionych cech jest uznawana za próbkowanie quasi-statystyczne. Zaletami próbkowania statystycznego jest to, że wnioskowanie może być, z dużą dozą prawdopodobieństwa, uogólniane na całą badaną populację (oczywiście w zależności od wielkości próby). Inną zaletą takiego wyboru próby jest fakt, że jest to wybór próby z zminimalizowanymi możliwościami manipulacji przy próbkowaniu, oraz łatwą do udowodnienia obiektywnością doboru próby. Główną wadą próbkowania statystycznego jest to, że nie jest w pełni wykorzystywana wiedza o populacji. W ramach próbkowania statystycznego wyróżniane są najczęściej następujące metody:
Wybór losowy
Wybór losowy jest to taki dobór próby, w którym wszystkie pozycje populacji mają znane (oznacza to, że populacja jest znana i ściśle określona) i równe szanse dostania się do próby. Dzięki takiemu próbkowaniu audytor może spodziewać się, że wybrana próba jest dobrym odzwierciedleniem populacji i wniosek wynikający z badania próby może zostać uogólniony na całą populację. W praktyce do przeprowadzenia wyboru losowego przydatne mogą okazać się generatory liczb losowych (np. w arkuszu Excel można zastosować funkcję ‘los()’ zwracającą losową liczbę z przedziału 0-1; aby przedział zdefiniować od ‘a’ do ‘b’, funkcja powinna wyglądać następująco ‘los()*(b-a)+a’[1]). Na podstawie wyniku z generatora liczb losowych wybiera się taką pozycję do próby.
Wybór systematyczny
Wybór systematyczny polega na wyborze pozycji z populacji równo oddalonych od siebie. Oznacza to, że co któraś, szczegółowo określona pozycja z populacji powinna zostać wybrana do próby. Punktem startowym do takiego wyboru powinien być punkt losowy z zakresu badanej populacji. Schematem pomocnym do wyboru próby w sposób systematyczny jest:
- Określenie próby, w tym także jej wielkości.
- Określenie wielkości próby.
- Określenie punktu startowego w sposób losowy.
- Określenie interwału (odległości pomiędzy poszczególnymi pozycjami dobranymi do próby).
- Określenie próby na podstawie punktu startowego oraz interwału.
Przykład stosowania próbkowania systematycznego:
- Próba wybierana jest z faktur numerowanych od FV/2015/0001 do FV/2015/1000, przy czym ostatnie cztery cyfry w numeracji faktur określają numer porządkowy faktury i są niepowtarzalne. Oznacza to, że naszą populację tworzy dokładnie 1000 faktur.
- Na podstawie narzędzi statystycznych, w celu uzyskania odpowiedzi na temat prawidłowości badanej populacji, określono wielkość próby na 100.
- W sposób losowy, przy wykorzystaniu generatora liczb losowych określono, że losowym punktem startowym jest 182.
- Z uwagi na fakt, że pozycje z populacji wybrane do próby mają znajdować się w równych odległościach od siebie, co dziesiąta1000/100) pozycja jest wybrana do próby (wielkość populacji / wielkość próby = interwał).
- Do próby wybrano pozycje 182, 192, 202,…, 972, 982, 992. Dodatkowo do próby wybrane powinny być pozycje z populacji mniejsze o interwał od punktu startowego (o ile są nadal w populacji), tj. 172, 162, 152,…, 22, 12, 2. W całości próba składa się z 100 pozycji.
Próbkowanie systematyczne jest prostsze do stosowania niż próbkowanie losowe, w szczególności dla dużej populacji i/lub dużej próby. Wadą próbkowania systematycznego jest to, że nie można go zastosować w sytuacji, kiedy w populacji występuje cykliczność lub gdy jest ona w jakiś sposób ułożona.
Wybór oparty o jednostki pieniężne (ang. monetary unit sampling)
Wybór próby oparty o jednostki pieniężne jest metodą wykorzystywaną najczęściej przez biegłych rewidentów przy badaniu sprawozdań finansowych. W tej metodzie każda jednostka pieniężna jest oddzielną jednostką próbkowania (np. saldo należności o wartości 1.230.000, 00 zł zawiera 1.230.000 jednostek próbkowania). Najłatwiejszym sposobem wytłumaczenia działania wyboru opartego o jednostki pieniężne jest pokazanie przykładu zastosowania:
- Określenie interwału w oparciu o dzielenie populacji (badane saldo) przez wielkość próby (1.230.000 / 100 = 12.300).
- Ułożenie populacji w jakimś określonym porządku (np. alfabetyczny, w kolejności wielkości salda etc.).
- Wybranie losowego numeru z przedziału pomiędzy jednostką próbkowania, a interwałem (od 1 do 12.300). Dla przykładu liczbą losową jest 934.
- Pierwszą pozycją w próbie jest pozycja, przy której przekraczana jest liczba losowa, 934 (patrząc na wartość skumulowaną). Jak widać w poniżej załączonej tabeli, pierwszy dostawca ABC ma saldo 246, więc nie jest dobierany do próby, ale przy drugim dostawcy saldo skumulowane wynosi 1.591, co przekracza 934, więc dostawca BCD jest dobrany do próby. Do 934 dodawana jest wartość interwału, czyli 12.300, co daje 13.234. Saldo skumulowane przy dostawcy CDE wynosi 2.488, co jest poniżej 13.234, więc dostawca CDE nie jest dobierany do próby, natomiast dostawca DEF już tak, gdyż saldo skumulowane przy nim wynosi 15.395, co jest większe niż 13.234. Do 13.234 dodawana jest wartość interwału (12.300), co daje 25.534. Wartość ta jest przekraczana przy dostawcy FGH, więc jest on dobrany do próby. Następną analizowaną wartością jest 37.834 (25.534 + interwał), która ponownie przekraczana jest przy dostawcy FGH, więc jest on ponownie dodany do próby. Oznacza to, że dla dostawcy FGH, dwukrotnie dodanego do próby, weryfikowane są dwie transakcje, które składają się na saldo tego dostawcy.
odbiorca
|
saldo
|
saldo skumulowane
|
próba
|
ABC
|
246,00
|
246,00
|
|
BCD
|
1 345,00
|
1 591,00
|
(1) 934,00
|
CDE
|
897,00
|
2 488,00
|
|
DEF
|
12 907,00
|
15 395,00
|
(2) 13 234,00
|
EFG
|
9 986,00
|
25 381,00
|
|
FGH
|
23 897,00
|
49 278,00
|
(3) 25 534,00 (4) 37 834,00
|
Próbkowanie quasi-statystyczna
Próbkowanie quasi-statystyczne pozbawione jest zalety próbkowania statystycznego, dla którego każda pozycja z populacji ma takie samo prawdopodobieństwo wystąpienia w próbie. W przypadku próbkowania quasi-statystycznego próba jest całkowicie wynikiem osądu audytora, co może być zagrożeniem dla obiektywności doboru próby i w efekcie uniemożliwiać wnioskowanie na jej podstawie. Jednocześnie próbkowanie quasi-statystyczne jest dużo łatwiejsze i szybsze do stosowania. W ramach próbkowania quasi-statystycznego wyróżniane są najczęściej następujące metody:
Wybór przypadkowy
Wybór przypadkowy jest metodą próbkowania bez określonego sposobu lub techniki. Istotne jest, aby przy wykorzystywaniu próbkowania przypadkowego do wyboru próby, audytor nie był stronniczy lub przewidywalny. Unikanie włączania do próby pozycji, które mogą sprawić kłopot przy weryfikacji lub których weryfikacja jest czasochłonna może uniemożliwić uzyskanie dobrych efektów próbkowania oraz weryfikacji.
Wybór blokowy
Wybór blokowy polega na wybraniu sąsiadujących elementów, np. wszystkie pozycje z populacji od 210 do 240 lub wszystkie pozycje z okresu od 2015-01-10 do 2015-01-30. Wybór blokowy nie jest często wykorzystywaną techniką doboru próby, gdyż umożliwia wnioskowanie tylko o elementach z wybranego bloku. W sytuacji, gdy ta technika jest stosowana, należy zastanowić się czy wiele różnych bloków pozycji populacji nie powinno być wybranych.
Podsumowanie
Próbkowanie jest istotną częścią efektywnego audytu, jednak nie każda metoda doboru próby może być wykorzystywana w każdych okolicznościach, dlatego istotna jest wiedza o różnych metodach próbkowania, co pozwoli dobrać metodę do danej sytuacji.
Wzór dokumentu 1 - Minimalna wielkość próby w badaniu
Podana wartość informuje o tym, ile należy zbadać pozycji w populacji, aby uzyskać 5% wartość błędu maksymalnego, przy ustalonym poziomie ufności do wyniku (99%, 95% lub 90%) i przy ustalonej wielkości populacji.
wielkość populacji \ poziom ufności
|
99%
|
95%
|
90%
|
100,00
|
87
|
79
|
73
|
250,00
|
182
|
151
|
130
|
500,00
|
285
|
217
|
176
|
750,00
|
352
|
254
|
199
|
1 000,00
|
399
|
278
|
213
|
2 000,00
|
498
|
322
|
238
|
3 000,00
|
543
|
341
|
248
|
4 000,00
|
569
|
350
|
253
|
5 000,00
|
586
|
357
|
257
|
6 000,00
|
597
|
361
|
259
|
7 000,00
|
606
|
364
|
260
|
8 000,00
|
613
|
367
|
262
|
9 000,00
|
618
|
368
|
263
|
10 000,00
|
622
|
370
|
263
|
100 000,00
|
659
|
383
|
270
|
1 000 000,00
|
663
|
384
|
270
|
10 000 000,00
|
663
|
384
|
271
|
Wzór dokumentu 2 – Tabele liczb losowych
A. Tabela liczb losowych wygenerowana w arkuszu Excel przy wykorzystaniu funkcji ‘los()’ dla poszczególnych zakresów:
zakres
|
1.
|
2.
|
3.
|
4.
|
5.
|
6.
|
7.
|
8.
|
9.
|
10.
|
1-100
|
13
|
37
|
22
|
90
|
44
|
40
|
85
|
65
|
22
|
27
|
1-250
|
50
|
135
|
184
|
153
|
25
|
6
|
234
|
132
|
166
|
212
|
1-500
|
419
|
93
|
237
|
495
|
80
|
74
|
90
|
202
|
428
|
305
|
1-750
|
513
|
81
|
719
|
116
|
733
|
546
|
77
|
587
|
140
|
496
|
1-1000
|
880
|
304
|
385
|
568
|
510
|
51
|
330
|
17
|
514
|
877
|
1-2000
|
1019
|
841
|
415
|
1124
|
1642
|
956
|
1835
|
1871
|
616
|
1109
|
1-3000
|
2139
|
785
|
1699
|
1868
|
1245
|
589
|
1163
|
709
|
2311
|
2031
|
1-4000
|
3153
|
2252
|
1510
|
3313
|
1204
|
2019
|
3419
|
3109
|
211
|
3195
|
1-5000
|
2128
|
1373
|
3183
|
2412
|
2240
|
2314
|
4919
|
4141
|
2762
|
1792
|
1-10000
|
5096
|
6020
|
1213
|
7481
|
4824
|
2715
|
4956
|
6918
|
5699
|
7937
|
B. Tabela 200 5-cyfrowych liczb losowych wygenerowanych przez firmę RAND w 1955 na podstawie generatora impulsów bitowych:
10097
|
32533
|
76520
|
13586
|
34673
|
54876
|
80959
|
09117
|
39292
|
74945
|
37542
|
04805
|
64894
|
74296
|
24805
|
24037
|
20636
|
10402
|
00822
|
91665
|
08422
|
68953
|
19645
|
09303
|
23209
|
02560
|
15953
|
34764
|
35080
|
33606
|
99019
|
02529
|
09376
|
70715
|
38311
|
31165
|
88676
|
74397
|
04436
|
27659
|
12807
|
99970
|
80157
|
36147
|
64032
|
36653
|
98951
|
16877
|
12171
|
76833
|
66065
|
74717
|
34072
|
76850
|
36697
|
36170
|
65813
|
39885
|
11199
|
29170
|
31060
|
10805
|
45571
|
82406
|
35303
|
42614
|
86799
|
07439
|
23403
|
09732
|
85269
|
77602
|
02051
|
65692
|
68665
|
74818
|
73053
|
85247
|
18623
|
88579
|
63573
|
32135
|
05325
|
47048
|
90553
|
57548
|
28468
|
28709
|
83491
|
25624
|
73796
|
45753
|
03529
|
64778
|
35808
|
34282
|
60935
|
20344
|
35273
|
88435
|
98520
|
17767
|
14905
|
68607
|
22109
|
40558
|
60970
|
93433
|
50500
|
73998
|
11805
|
05431
|
39808
|
27732
|
50725
|
68248
|
29405
|
24201
|
52775
|
67851
|
83452
|
99634
|
06288
|
98083
|
13746
|
70078
|
18475
|
40610
|
68711
|
77817
|
88685
|
40200
|
86507
|
58401
|
36766
|
67951
|
90364
|
76493
|
29609
|
11062
|
99594
|
67348
|
87517
|
64969
|
91826
|
08928
|
93785
|
61368
|
23478
|
34113
|
65481
|
17674
|
17468
|
50950
|
58047
|
76974
|
73039
|
57186
|
40218
|
16544
|
80124
|
35635
|
17727
|
08015
|
45318
|
22374
|
21115
|
78253
|
14385
|
53763
|
74350
|
99817
|
77402
|
77214
|
43236
|
00210
|
45521
|
64237
|
96286
|
02655
|
69916
|
26803
|
66252
|
29148
|
36936
|
87203
|
76621
|
13990
|
94400
|
56418
|
09893
|
20505
|
14225
|
68514
|
46427
|
56788
|
96297
|
78822
|
54382
|
14598
|
[1] Funkcje w arkuszu Excel bazują na algorytmach, więc generowane liczby nie są w pełni losowe. Generatory liczb losowych, np. random.org (https://www.random.org/) są uznawane za „bardziej losowe”, których losowość oparta jest na innych, niedeterministycznych czynnikach, np. dla przytoczonego random.org losowość oparta jest o szum atmosferyczny (ang. atmosferic noise). Dla celów próbkowania w audycie funkcje w arkuszu Excel są bardzo często uznawana za wystarczająco losowe.