A BUSZI-2 anonimizálása
A BUSZI-2 felvételeinek anonimizálása során az ombudsman útmutatása szerint jártunk el.
A BUSZI-2 az 1992. évi adatvédelmi törvény értelmében személyes és különleges adatokat is tartalmaz, melyek alapján a beszélők azonosíthatóak. Az anonimizálás célja az, hogy az érintett és az adat közti kapcsolat helyreállítását kizárja a megfelelő adatok törlésével. Emellett szem előtt tartottuk azt is, hogy a BUSZI szociolingvisztikai interjúként csak akkor tud jól funkcionálni, ha a beszélők egyes kutatási szempontból szükséges jellemzőit meghagyjuk - ilyen fontos jellemző például a születési hely, illetve az a hely, ahol az adatközlő a gyermekkorát töltötte. Az ilyen, szociolingvisztikai szempontból kiemelkedően fontos adatokat tehát meghagytuk, ám a beszélő anonimitását így is igyekeztünk biztosítani.
Az a cél vezérelt bennünket, hogy minden tulajdonnév mechanikus törlése, illetve kisípolása helyett csak annyi, az adatközlőre utaló információt töröltünk, amelyek meghagyása veszélyeztette volna az adatközlő anonimitását.
A lejegyzett interjúknál a következőképpen jártunk el: több külföldi korpusz anonimizálási módszertanát megvizsgálva igyekeztünk a lehető legjobb stratégiát kialakítani. Mivel az interjúk nagyban eltérnek egymástól, minden interjút önállóan kezeltünk. Minden anonimizált adatot az adott információ kategóriájának címkéjével helyettesítettünk, a kapcsolódó toldalékokat pedig meghagytuk.
Például:
tm: december kilenc ■ ööö kollégium a színhelye ■ az interjúnak. Budapesti interjú kvóta. ■ Be akarja mondani a nevét mar= vagy a marad a ka= marad inkább névtelenül? |
ak: Jó mondom, mondhatom. |
tm: Akko tessék. |
ak: [#szemelynev]nak hívnak. |
Jellemzően töröltük a következő adatokat: személynevek, adatközlő születési éve, munkahely és a munkahely címe, adatközlő jelenlegi és korábbi iskoláinak neve, az adatközlő lakhelye (utca).
Nem töröltük viszont általában a következőket: születési hely, az adatközlő rokonainak adatai, az adatközlő lakhelye (kerület/ városrész).
A lejegyzések anonimizálása után a törölt információkat a hangfájlokból is töröltük, helyükre a törölt résszel megegyező hosszúságú szinuszjelet (sípolást) illesztettünk, majd a hangfájlokat az ombudsman utasításainak megfelelően a hangmagasság megváltoztatásával torzítottuk.