A kiadványban használt fogalmak megegyeznek a KSH által általánosan használt fogalmakkal. A nonprofit szervezetek tevékenységcsoportok szerinti besorolása a nemzetközi gyakorlatban használatos osztályozási rendszer (International Classification of Nonprofit Organization) adaptálásával készült. A szervezeteket fő tevékenységük szerint 18 főcsoportba, 65 csoportba, illetve 248 alcsoportba soroltuk (nonprofit szervezetek osztályozási rendszere, NSZOR16). A Központi Statisztikai Hivatal számítógépes nyilvántartást (NPREG) vezet az önálló jogi személyként bejegyzett nonprofit szervezetekről. Ebben valamennyi szervezet neve, címe, tevékenységi kódja, képviselőjének neve és címe szerepel. A nyilvántartást az évenkénti kérdőíves adatfelvétel visszaérkezett bizonylatainak segítségével, az újonnan bejegyzett szervezetek hivatalos bírósági nyilvántartásából (Országos Bírósági Hivatal), valamint más regiszterekből (gazdálkodó szervezetek regisztere) származó adatok felhasználásával rendszeresen aktualizáltuk, és átvezettük a szervezetek megszűnésével, illetve szünetelésével kapcsolatos információkat.
A 2021-ben végrehajtott adatgyűjtés egy teljes körű (OSAP 1156) adatfelvételből állt. Az adatszolgáltatást a KSH-ELEKTRA elektronikus adatgyűjtési rendszeren keresztül kellett teljesítenie nyilvántartásunkban szereplő valamennyi, előzetes információink szerint működőnek feltételezett nonprofit szervezetnek. Az adatszolgáltatóknak ebben az évben kétféle kérdőívet küldtünk, egy egyszerűsített, és egy bővebb változatot. Ez utóbbit az úgy nevezett „kiemelt kör” kapta, amelybe tartoztak az új szervezetek, nonprofit gazdasági szervezetek, egyesülések, a származtatott jogi személyekkel rendelkező szervezetek, illetve ezek leányszervezetei, a tavalyi adataik alapján kiemelt nagy, vagy államháztartásba sorolt szervezetek. A maradék szervezeti halmazból véletlen mintavétellel kiválasztott mintegy 5000 szervezet szintén részletes kérdőívet kapott, a többi pedig egyszerűsítettet. A kb. 70 000 címzettből hozzávetőlegesen 13 000 ezer a kiemeltek száma.
Az adatfeldolgozás két szakaszban történt: először ellenőriztük és tisztítottuk a válaszoló szervezetek adatait, majd ezekből a későbbiekben ismertetett eljárással teljes körű adatállományt képeztünk. Megvizsgáltuk, és szükség esetén javítottuk azoknak a szervezeteknek az adatait, amelyeknek valamelyik fontos jellemzője (bevétel, kiadás, foglalkoztatottak száma stb.) az átlaghoz képest jelentős mértékben eltért, valamint azokét, amelyeknek mutatói az előző évi adataikhoz viszonyítva változtak. A lehetséges inkonzisztenciákat, számszaki eltéréseket már az adatrögzítő programba beépített ellenőrzésekkel is szűrtük, míg az ilyen szinten nem kezelhető hibákat (pl. volt foglalkoztatott, de nem volt bér jellegű kifizetés) további számítógépes algoritmusokkal vizsgáltuk és javítottuk.
A 2020-as adatfelvétel során az adatszolgáltatásra felszólított 67 471 önálló (és 1006 származtatott) jogi személy szervezet közül 40 848 (illetve 359) szervezet töltött ki értékelhető kérdőívet és végzett az év során valamilyen tényleges tevékenységet. 6798 önálló szervezetről derült ki a válaszaik alapján, hogy megszűntek, szüneteltetik tevékenységüket, vagy még nem működtek, tehát ezek a szervezetek kikerültek az elemzési sokaságból, míg a maradék, 19 825 szervezetről – a működőnek tekinthető 60 673 nonprofit szervezet 33 százalékáról – nem volt semmilyen információnk.Ezek alapján tehát a teljes elérési arány (vagyis a célsokaságból valamilyen információt közlő szervezetek aránya) 71, a működőnek tekinthető szervezetek közül a válaszadási arány pedig 67% volt.[1]
A szektor egészét jellemző, az adatlapok alapján előállítható statisztikai mutatókat a válaszoló szervezetek ellenőrzött és javított tényadataiból becsültük, azoknak a sokaság egészére vonatkozó teljes körű információknak a felhasználásával, amelyek a nonprofit szervezetek számítógépes nyilvántartásából rendelkezésre álltak. A teljeskörűsítés nem súlyozásos technikával történt, hanem oly módon, hogy az összes szervezetről meglévő adatok alapján kialakítottunk egy dinamikus ún. „hot-deck” imputálási módszert, amire a továbbiakban reprezentációs vagy donorkereső módszerként fogunk hivatkozni. Ennek lényege, hogy a nem válaszoló, de a regiszterből ismert jellemzőkkel rendelkező szervezetek hiányzó adatait a nyilvántartás szerint hozzájuk hasonló, de válaszoló szervezettől vettük át.
A reprezentációs módszert a 2004-es adatok feldolgozása során 2006-ban jelentősen átalakítottuk a korábbi évekhez képest. A felhasznált módszer egy dinamikus ún. „hot-deck” eljárás lett, aminek működési mechanizmusa a következő. A programban nyolc különböző szint volt, és ennek minden szintjén különböző mélységű cellastruktúrákat hoztunk létre. A nem válaszoló szervezeteknek a program próbált a lehető legmagasabb szinten donort találni (olyan szervezetet, amely válaszolt, és ugyanabba a cellába tartozott), ha ez nem sikerült, akkor lejjebb lépett. A módszer arra az előfeltevésre épült, hogy a szervezeteket jellemző módon meghatározza, hogy milyen tevékenységi területen működnek, milyen a jogi formájuk (ezen belül van-e tagságuk vagy nincs), az ország melyik részén és milyen jellegű településen (község, város, megyeszékhely, Budapest, illetve szűkítetten Budapest vagy vidék) vannak bejegyezve. A módszer szintjei prioritási sorrendben a következők voltak:
- NSZOR-csoport (248 alcsoport), jogi forma, településtípus, megye
- NSZOR-csoport (248 alcsoport), jogi forma, településtípus, régió
- NSZOR-csoport (248 alcsoport), jogi forma, településtípus
- NSZOR-csoport (18 főcsoport), jogi forma, településtípus, megye
- NSZOR-csoport (18 főcsoport), jogi forma, településtípus, régió
- NSZOR-csoport (18 főcsoport), jogi forma, településtípus
- NSZOR-csoport (248 alcsoport), tagsági forma, településtípus
- NSZOR-csoport (18 főcsoport), tagsági forma, főváros–vidék.
Az eljárás következőképpen illusztrálható. Ha például volt egy nem válaszoló szervezet, amely a regiszterinformációk szerint egy Vas megyei faluban, alapítványi formában működött, és lelkisegítség-nyújtással foglalkozott, akkor donorként az algoritmus első szintjén csak olyan szervezetet kaphatott, ami ugyanezekkel a jellemzőkkel bírt. Amennyiben a program nem talált neki donort az első szinten, akkor a második szinten kezdett el keresni egy hasonló jellemzőkkel bíró szervezetet, azzal a különbséggel, hogy a településtípust már nem tekintette meghatározó jellemzőnek. Ha netán a szervezet eljutott a 8. szintre anélkül, hogy megfelelő donort kapott volna, akkor végeredményben bármilyen egészségügyi válaszoló nonprofit szervezet a donorja lehetett. A program lefutása során a nem válaszoló szervezetek döntő hányada a legfelső három szinten kapott megfelelő donort, és csak nagyon kevés szervezetnél volt jellemző, hogy az összekapcsolási sorrend szerint egy viszonylag távoli „reprezentáns” lett a donorszervezet.
Azért, hogy egy adott donorszervezet ne legyen sokszor felhasználva az eljárásban, létrehoztunk egy ún. maximalizációs számot. Ennek segítségével meg lehetett határozni, hogy egy szervezet hányszor szerepelhet donorként az összekapcsolás során. A maximalizációs szám kiszámítása úgy történt, hogy megvizsgáltuk, az adott főcsoportban (18 főcsoport szerinti NSZOR-felosztás) összesen hány szervezet van, és azt elosztottuk az adott főcsoport válaszoló szervezeteinek számával. Az adott szervezetre kiszámolt maximalizációs számból kivontunk egyet és felkerekítettük egész számra (pl. 2,36-1 -> 2) – ennyiszer lehetett az adott donort felhasználni az összekapcsolás során. Annak érdekében, hogy a donorkiválasztás semmilyen formában ne függjön össze az adatbázis fizikai elrendezésével, az algoritmus futtatása előtt véletlenszerűen sorba rendeztük adatainkat.
Az eljárásból kihagytuk a szervezetek azon csoportját, amit az ún. kiemelt szervezetek alkottak, olyanok, amelyek bizonyos adatai az átlagnál lényegesen nagyobbak voltak. Ezek körét öt mutató alapján határoztuk meg (összes bevétel > 500 millió forint és/vagy az 1%-os szja-felajánlás > 5 millió forint és/vagy a Nemzeti Együttműködési Alapból (NEA) származó támogatás > 5 millió forint és/vagy a számított főállású foglalkoztatottakSzámított főállású foglalkoztatotti létszám: a főállású teljes munkaidőben foglalkoztatottak száma, hozzáadva a főállású részmunkaidőben foglalkoztatottak számának felét és a nem főállású foglalkoztatottak számának egytizedét, valamint a közfoglalkoztatottak teljes éves munkateljesítményét napi nyolc órás főállású munkaidős foglalkoztatotti létszámra átszámítva.[3] száma > 400 fő és/vagy a közfoglalkoztatottak száma > 100 fő). Erre azért volt szükség, mert ezek a szervezetek önmagukban is képesek befolyásolni a szektor legfontosabb mutatóit. Ha egy szervezet bármelyik mutató mentén átlépte a küszöbértéket, akkor bekerült a kiemelt szervezetek közé, ami azt jelentette, hogy bár nem vett részt donorként a pótlásban, de adatai természetesen szerepeltek a 2020-as statisztikákban. Szintén kihagytuk az önálló szervezeti egységekkel rendelkező szervezeteket is.Az önálló szervezeti egységgel rendelkező szervezetek esetében a leányszervezeteik is kaptak kérdőívet, ezek adatait az anyaszervezet adataiba integráltuk. [4] Így összesen 881 szervezet nem lehetett donor.
A fenti módszertani elvek mentén kialakítottunk egy olyan adatbázist, amely a válaszoló szervezetek rekordjai mellett tartalmazta a nem válaszolók adatait is, olyan formában, hogy a regiszterben szereplő adataik mellett megjelent a reprezentáns szervezettől átvett valamennyi hiányzó információ. A reprezentációs módszer révén lehetőség nyílt arra, hogy részletesebb, a valóságot regionális, megyei szinten is jobban tükröző adatok jöjjenek létre.
[1]:↑ Ezek alapján tehát a teljes elérési arány (vagyis a célsokaságból valamilyen információt közlő szervezetek aránya) 71, a működőnek tekinthető szervezetek közül a válaszadási arány pedig 67% volt.
[2]:↑ A korábbi évek módszertanának leírása a Nonprofit szervezetek Magyarországon, 2003 című kiadványban, az új módszer kialakításának menete pedig a Nonprofit szervezetek Magyarországon, 2004 címűben szerepel.
[3]:↑ Számított főállású foglalkoztatotti létszám: a főállású teljes munkaidőben foglalkoztatottak száma, hozzáadva a főállású részmunkaidőben foglalkoztatottak számának felét és a nem főállású foglalkoztatottak számának egytizedét, valamint a közfoglalkoztatottak teljes éves munkateljesítményét napi nyolc órás főállású munkaidős foglalkoztatotti létszámra átszámítva.
[4]:↑ Az önálló szervezeti egységgel rendelkező szervezetek esetében a leányszervezeteik is kaptak kérdőívet, ezek adatait az anyaszervezet adataiba integráltuk.