Cel próbkowania w audycie

Audytor ma do czynienia z wyborem próby (badanie wyrywkowe) podczas badania dużego zbioru danych (dużej populacji), który nie jest możliwy do weryfikacji w całości, lub gdy weryfikacja w całości jest zbyt czasochłonna i niekonieczna. Podczas wyboru próby istotne jest, aby po weryfikacji wybranej próby możliwe było wypowiedzenie się lub wnioskowanie o całym zbiorze danych. Można to osiągnąć dobierając próbę na kilka sposobów, tj. próbkowanie celowe, próbkowanie statystyczne, próbkowanie quasi-statystyczne lub jakiekolwiek połączenie tych trzech (najczęściej spotykane w praktyce), jako że nie są one wzajemnie wykluczające się. W pozostałej części artykułu omówione zostaną dokładniej metody doboru próby według trzech wymienionych sposobów.

Próba celowa

Dobór próby celowej polega na określeniu przez audytora kryteriów doboru próby z populacji. Przykładami kryteriów mogą być np.: istotność danej pozycji w populacji (np. populacja: przychody per kontrahent, próba: kontrahent odpowiadający za największy przychód), nietypowość/nielogiczność danej pozycji (także kilku pozycji) w porównaniu do pozostałej części populacji, gdy oczekujemy typowych pozycji (np. populacja: przychody per kontrahent, próba: kontrahent z ujemnymi przychodami), ryzyko dla danej pozycji (zidentyfikowane na podstawie profesjonalnego osądu audytora lub wcześniej wykonanych procedur). Możliwe jest również łączenie różnych kryteriów, np. wybór największej z nietypowych pozycji (np. populacja: zobowiązania per dostawca, próba: odbiorca z największym saldem zobowiązań). Wadami celowego doboru próby jest to, że nie można łatwo ekstrapolować wniosków na całą populację podlegającą badaniu. Zaletami doboru celowego jest oprócz szybkości i łatwości doboru próby również wykorzystywanie profesjonalnego osądu audytora (w zależności od doświadczenia i kwalifikacji, może być to również wada).

Próbkowanie statystyczne

Próba statystyczna, zgodnie z Międzynarodowym Standardem Rewizji Finansowej 530, wykazuje następujące cechy: wybór pozycji próbki następuje losowo oraz do oceny wyników badania próby, w tym do pomiaru ryzyka próbkowania, stosuje się rachunek prawdopodobieństwa. Metoda, która nie posiada dwóch powyżej wymienionych cech jest uznawana za próbkowanie quasi-statystyczne. Zaletami próbkowania statystycznego jest to, że wnioskowanie może być, z dużą dozą prawdopodobieństwa, uogólniane na całą badaną populację (oczywiście w zależności od wielkości próby). Inną zaletą takiego wyboru próby jest fakt, że jest to wybór próby z zminimalizowanymi możliwościami manipulacji przy próbkowaniu, oraz łatwą do udowodnienia obiektywnością doboru próby. Główną wadą próbkowania statystycznego jest to, że nie jest w pełni wykorzystywana wiedza o populacji. W ramach próbkowania statystycznego wyróżniane są najczęściej następujące metody:

Wybór losowy

Wybór losowy jest to taki dobór próby, w którym wszystkie pozycje populacji mają znane (oznacza to, że populacja jest znana i ściśle określona) i równe szanse dostania się do próby. Dzięki takiemu próbkowaniu audytor może spodziewać się, że wybrana próba jest dobrym odzwierciedleniem populacji i wniosek wynikający z badania próby może zostać uogólniony na całą populację. W praktyce do przeprowadzenia wyboru losowego przydatne mogą okazać się generatory liczb losowych (np. w arkuszu Excel można zastosować funkcję ‘los()’ zwracającą losową liczbę z przedziału 0-1; aby przedział zdefiniować od ‘a’ do ‘b’, funkcja powinna wyglądać następująco ‘los()*(b-a)+a’[1]). Na podstawie wyniku z generatora liczb losowych wybiera się taką pozycję do próby.

Wybór systematyczny

Wybór systematyczny polega na wyborze pozycji z populacji równo oddalonych od siebie. Oznacza to, że co któraś, szczegółowo określona pozycja z populacji powinna zostać wybrana do próby. Punktem startowym do takiego wyboru powinien być punkt losowy z zakresu badanej populacji. Schematem pomocnym do wyboru próby w sposób systematyczny jest:

  1. Określenie próby, w tym także jej wielkości.
  2. Określenie wielkości próby.
  3. Określenie punktu startowego w sposób losowy.
  4. Określenie interwału (odległości pomiędzy poszczególnymi pozycjami dobranymi do próby).
  5. Określenie próby na podstawie punktu startowego oraz interwału.

Przykład stosowania próbkowania systematycznego:

  1. Próba wybierana jest z faktur numerowanych od FV/2015/0001 do FV/2015/1000, przy czym ostatnie cztery cyfry w numeracji faktur określają numer porządkowy faktury i są niepowtarzalne. Oznacza to, że naszą populację tworzy dokładnie 1000 faktur.
  2. Na podstawie narzędzi statystycznych, w celu uzyskania odpowiedzi na temat prawidłowości badanej populacji, określono wielkość próby na 100.
  3. W sposób losowy, przy wykorzystaniu generatora liczb losowych określono, że losowym punktem startowym jest 182.
  4. Z uwagi na fakt, że pozycje z populacji wybrane do próby mają znajdować się w równych odległościach od siebie, co dziesiąta1000/100) pozycja jest wybrana do próby (wielkość populacji / wielkość próby = interwał).
  5. Do próby wybrano pozycje 182, 192, 202,…, 972, 982, 992. Dodatkowo do próby wybrane powinny być pozycje z populacji mniejsze o interwał od punktu startowego (o ile są nadal w populacji), tj. 172, 162, 152,…, 22, 12, 2. W całości próba składa się z 100 pozycji.

Próbkowanie systematyczne jest prostsze do stosowania niż próbkowanie losowe, w szczególności dla dużej populacji i/lub dużej próby. Wadą próbkowania systematycznego jest to, że nie można go zastosować w sytuacji, kiedy w populacji występuje cykliczność lub gdy jest ona w jakiś sposób ułożona.

Wybór oparty o jednostki pieniężne (ang. monetary unit sampling)

Wybór próby oparty o jednostki pieniężne jest metodą wykorzystywaną najczęściej przez biegłych rewidentów przy badaniu sprawozdań finansowych. W tej metodzie każda jednostka pieniężna jest oddzielną jednostką próbkowania (np. saldo należności o wartości 1.230.000, 00 zł zawiera 1.230.000 jednostek próbkowania). Najłatwiejszym sposobem wytłumaczenia działania wyboru opartego o jednostki pieniężne jest pokazanie przykładu zastosowania:

  1. Określenie interwału w oparciu o dzielenie populacji (badane saldo) przez wielkość próby (1.230.000 / 100 = 12.300).
  2. Ułożenie populacji w jakimś określonym porządku (np. alfabetyczny, w kolejności wielkości salda etc.).
  3. Wybranie losowego numeru z przedziału pomiędzy jednostką próbkowania, a interwałem (od 1 do 12.300). Dla przykładu liczbą losową jest 934.
  4. Pierwszą pozycją w próbie jest pozycja, przy której przekraczana jest liczba losowa, 934 (patrząc na wartość skumulowaną). Jak widać w poniżej załączonej tabeli, pierwszy dostawca ABC ma saldo 246, więc nie jest dobierany do próby, ale przy drugim dostawcy saldo skumulowane wynosi 1.591, co przekracza 934, więc dostawca BCD jest dobrany do próby. Do 934 dodawana jest wartość interwału, czyli 12.300, co daje 13.234. Saldo skumulowane przy dostawcy CDE wynosi 2.488, co jest poniżej 13.234, więc dostawca CDE nie jest dobierany do próby, natomiast dostawca DEF już tak, gdyż saldo skumulowane przy nim wynosi 15.395, co jest większe niż 13.234. Do 13.234 dodawana jest wartość interwału (12.300), co daje 25.534. Wartość ta jest przekraczana przy dostawcy FGH, więc jest on dobrany do próby. Następną analizowaną wartością jest 37.834 (25.534 + interwał), która ponownie przekraczana jest przy dostawcy FGH, więc jest on ponownie dodany do próby. Oznacza to, że dla dostawcy FGH, dwukrotnie dodanego do próby, weryfikowane są dwie transakcje, które składają się na saldo tego dostawcy.

odbiorca

saldo

saldo skumulowane

próba

ABC

246,00

246,00

 

BCD

1 345,00

1 591,00

(1) 934,00

CDE

897,00

2 488,00

 

DEF

12 907,00

15 395,00

(2) 13 234,00

EFG

9 986,00

25 381,00

 

FGH

23 897,00

49 278,00

(3) 25 534,00
(4) 37 834,00

Próbkowanie quasi-statystyczna

Próbkowanie quasi-statystyczne pozbawione jest zalety próbkowania statystycznego, dla którego każda pozycja z populacji ma takie samo prawdopodobieństwo wystąpienia w próbie. W przypadku próbkowania quasi-statystycznego próba jest całkowicie wynikiem osądu audytora, co może być zagrożeniem dla obiektywności doboru próby i w efekcie uniemożliwiać wnioskowanie na jej podstawie. Jednocześnie próbkowanie quasi-statystyczne jest dużo łatwiejsze i szybsze do stosowania. W ramach próbkowania quasi-statystycznego wyróżniane są najczęściej następujące metody:

Wybór przypadkowy

Wybór przypadkowy jest metodą próbkowania bez określonego sposobu lub techniki. Istotne jest, aby przy wykorzystywaniu próbkowania przypadkowego do wyboru próby, audytor nie był stronniczy lub przewidywalny. Unikanie włączania do próby pozycji, które mogą sprawić kłopot przy weryfikacji lub których weryfikacja jest czasochłonna może uniemożliwić uzyskanie dobrych efektów próbkowania oraz weryfikacji.

Wybór blokowy

Wybór blokowy polega na wybraniu sąsiadujących elementów, np. wszystkie pozycje z populacji od 210 do 240 lub wszystkie pozycje z okresu od 2015-01-10 do 2015-01-30. Wybór blokowy nie jest często wykorzystywaną techniką doboru próby, gdyż umożliwia wnioskowanie tylko o elementach z wybranego bloku. W sytuacji, gdy ta technika jest stosowana, należy zastanowić się czy wiele różnych bloków pozycji populacji nie powinno być wybranych.

Podsumowanie

Próbkowanie jest istotną częścią efektywnego audytu, jednak nie każda metoda doboru próby może być wykorzystywana w każdych okolicznościach, dlatego istotna jest wiedza o różnych metodach próbkowania, co pozwoli dobrać metodę do danej sytuacji.

Wzór dokumentu 1 - Minimalna wielkość próby w badaniu

Podana wartość informuje o tym, ile należy zbadać pozycji w populacji, aby uzyskać 5% wartość błędu maksymalnego, przy ustalonym poziomie ufności do wyniku (99%, 95% lub 90%) i przy ustalonej wielkości populacji.

wielkość populacji \ poziom ufności

99%

95%

90%

100,00

87

79

73

250,00

182

151

130

500,00

285

217

176

750,00

352

254

199

1 000,00

399

278

213

2 000,00

498

322

238

3 000,00

543

341

248

4 000,00

569

350

253

5 000,00

586

357

257

6 000,00

597

361

259

7 000,00

606

364

260

8 000,00

613

367

262

9 000,00

618

368

263

10 000,00

622

370

263

100 000,00

659

383

270

1 000 000,00

663

384

270

10 000 000,00

663

384

271

Wzór dokumentu 2 – Tabele liczb losowych

A. Tabela liczb losowych wygenerowana w arkuszu Excel przy wykorzystaniu funkcji ‘los()’ dla poszczególnych zakresów:

zakres

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

1-100

13

37

22

90

44

40

85

65

22

27

1-250

50

135

184

153

25

6

234

132

166

212

1-500

419

93

237

495

80

74

90

202

428

305

1-750

513

81

719

116

733

546

77

587

140

496

1-1000

880

304

385

568

510

51

330

17

514

877

1-2000

1019

841

415

1124

1642

956

1835

1871

616

1109

1-3000

2139

785

1699

1868

1245

589

1163

709

2311

2031

1-4000

3153

2252

1510

3313

1204

2019

3419

3109

211

3195

1-5000

2128

1373

3183

2412

2240

2314

4919

4141

2762

1792

1-10000

5096

6020

1213

7481

4824

2715

4956

6918

5699

7937

B. Tabela 200 5-cyfrowych liczb losowych wygenerowanych przez firmę RAND w 1955 na podstawie generatora impulsów bitowych:

10097

32533

76520

13586

34673

54876

80959

09117

39292

74945

37542

04805

64894

74296

24805

24037

20636

10402

00822

91665

08422

68953

19645

09303

23209

02560

15953

34764

35080

33606

99019

02529

09376

70715

38311

31165

88676

74397

04436

27659

12807

99970

80157

36147

64032

36653

98951

16877

12171

76833

66065

74717

34072

76850

36697

36170

65813

39885

11199

29170

31060

10805

45571

82406

35303

42614

86799

07439

23403

09732

85269

77602

02051

65692

68665

74818

73053

85247

18623

88579

63573

32135

05325

47048

90553

57548

28468

28709

83491

25624

73796

45753

03529

64778

35808

34282

60935

20344

35273

88435

98520

17767

14905

68607

22109

40558

60970

93433

50500

73998

11805

05431

39808

27732

50725

68248

29405

24201

52775

67851

83452

99634

06288

98083

13746

70078

18475

40610

68711

77817

88685

40200

86507

58401

36766

67951

90364

76493

29609

11062

99594

67348

87517

64969

91826

08928

93785

61368

23478

34113

65481

17674

17468

50950

58047

76974

73039

57186

40218

16544

80124

35635

17727

08015

45318

22374

21115

78253

14385

53763

74350

99817

77402

77214

43236

00210

45521

64237

96286

02655

69916

26803

66252

29148

36936

87203

76621

13990

94400

56418

09893

20505

14225

68514

46427

56788

96297

78822

54382

14598

[1] Funkcje w arkuszu Excel bazują na algorytmach, więc generowane liczby nie są w pełni losowe. Generatory liczb losowych, np. random.org (https://www.random.org/) są uznawane za „bardziej losowe”, których losowość oparta jest na innych, niedeterministycznych czynnikach, np. dla przytoczonego random.org losowość oparta jest o szum atmosferyczny (ang. atmosferic noise). Dla celów próbkowania w audycie funkcje w arkuszu Excel są bardzo często uznawana za wystarczająco losowe.