Search
Close this search box.

Analys: När behandlas personuppgifter under ett AI-systems livscykel och vilka dataskyddsrisker uppstår som följd?

Personuppgifter kan behandlas i olika faster av ett AI-systems livscykel. Det är vanligt förekommande att personuppgifter behandlas för att träna AI-modellen (som förenklat sagt kan likställas med motorn av AI-systemet). Samtidigt kan en AI-modell tränas utan att använda personuppgifter. Användning av personuppgifter krävs vanligtvis inte när en robot ska lära sig att sortera sopor. Däremot krävs normalt personuppgifter för att träna AI-system för ansiktsigenkänning, analys av röntgenbilder eller känsloigenkänning.

I denna artikel analyserar vi vanligt förekommande personuppgiftsbehandlingar under ett AI-systems livscykel. Vi analyserar även olika typer av dataskyddsrisker som kan uppstå i samband med dessa behandlingar.

Utvecklingsfasen

Under utvecklingsfasen av ett AI-system kan det även förekomma andra behandlingsåtgärder avseende data innehållandes personuppgifter. Ett exempel på en sådan åtgärd är att definiera vilka data som behövs för att träna AI-modellen på ett sätt som säkerställer att resultaten uppnår en tillräckligt hög kvalitetsnivå. Omfattande åtgärder vidtas avseende förbehandling av data innehållandes personuppgifter såsom att samla in, sammanställa, strukturera, rensa och transformera data på olika sätt. Vidare är det vanligt att dela upp data som har förbehandlats på detta sätt i olika datamängder i syfte att möjliggöra verifiering och validering av AI-modellen, till exempel för att fastställa med vilken felmarginal AI-modellen producerar sina resultat.

Även information som senare kan användas för att följa upp olika typer av händelser som har inträffat under utvecklingsprocessen sparas. Detta behövs bland annat för att kunna visa att utvecklingsprocessen uppfyller rättsliga krav som till exempel Privacy by Design och Privacy by Default enligt dataskyddsförordningen (GDPR) och data governance enligt AI-förordningen. Även sådan information kan innehålla personuppgifter som till exempel identifierare i logguppgifter eller personuppgifter i träningsdata som bevaras för att kunna visa regelefterlevnad.

Användningsfasen

Personuppgifter behandlas även under användningsfasen av ett AI-system. En personuppgiftsbehandling som ofta glöms bort under denna fas uppstår i samband med att AI-systemet distribueras. Eftersom en utlämning av personuppgifter räknas som en behandling i GDPR:s mening innebär tillgänggörandet av ett AI-system till tredje parter i många fall att personuppgifter lämnas ut då AI-modellen som tränas med data kommer ihåg den (på en teknisk nivå är detta det avsedda beteendet). När en AI-modell tränas med data innehållandes personuppgifter sparas en representation av denna data i modellen. Detta möjliggör för användaren av ett AI-system att rekonstruera eller härleda personuppgifter som sparas i AI-modellen även när den inte har tillgång till AI-modellens underliggande källkod.

AI-modellers minne leder till dataskyddsrisker

Att AI-modellen minns personuppgifter som den tränats med leder till olika typer av risker, däribland risken för otillåten eller obehörig delning av personuppgifter som i sin tur kan leda till personuppgiftsincidenter. Därutöver kan AI-modellens minne även leda till utmaningar i samband med att personuppgifter ska raderas från AI-modellen, till exempel när en registrerad vill utöva sin rätt att bli raderad.

Graden av minnens exakthet varierar dock bland olika typer av AI-modeller och beror även på hur en AI-modell har tränats. Detta kan även användas för att skydda personuppgifterna som AI-modellen minns. Exempel på åtgärder är att välja en typ av AI-modell och en träningsmetod som begränsar denna typ av risk. Risken kan minskas ytterligare genom att minimera personuppgifterna i träningsdata till ett absolut minimum. Detta kan uppnås genom att bland annat pseudonymisera personuppgifter eller ta bort icke relevanta uppgifter. Vidare kan anonymiserade personuppgifter eller syntetiska data användas istället för personuppgifter. Ytterligare en åtgärd för riskminimering är att begränsa användarens möjlighet att få tillgång till AI-systemets underliggande AI-modell i syfte att förhindra att den kan extrahera personuppgifter från modellen.

Automatiserat beslutsfattande och profilering

Det finns andra behandlingsåtgärder i samband med AI-systems användning, särskilt när inputdata omfattar personuppgifter. Vanligt förekommande är åtgärder avseende automatiserat beslutsfattande eller profilering. Exempel på automatiserat beslutsfattande är AI-system som analyserar röntgenbilder i syfte att ställa diagnos, fatta beslut avseende kreditprövningar eller fatta beslut avseende ärenden som hanteras av en myndighet. Ett exempel på profilering är ett AI-system som analyserar användarbeteende av medlemmar i ett socialt nätverk för att tillhandahålla dessa direktanpassad reklam.

Kontinuerlig träning

Det är vanligt att AI-system använder inputdata som analyseras under själva användningen för att fortlöpande förbättra AI-modellen. Detta innebär att användarens data används för att kontinuerligt träna AI-komponenten. Om AI-komponenten tillhandahålls som en molntjänst kommer den som använder AI-komponenten fortlöpande dela personuppgifter med AI-komponentens övriga användare.

Raderingsfasen

Personuppgifter behandlas i samband med att AI-systemet tas ur bruk och all data inklusive personuppgifter raderas. Men även när en användare av ett AI-system eller en av dennes registrerade begär att bli raderad innebär detta en behandling av personuppgifter. Att radera personuppgifter från ett AI-system kan vara förknippat med problem som till exempel att kvalitén av resultaten minskar. I många fall kan det till och med vara omöjligt att radera personuppgifter från ett AI-systems minne.

Slutsatser

Det är vanligt att personuppgifter behandlas under ett AI-systems hela livscykel vilket i sådana fall innebär att GDPR blir tillämplig under AI-systemets hela livscykel. Detta innebär bland annat att regelverkets krav på Privacy by Design och Privacy by Default aktualiseras, likväl som kraven på att göra en konsekvensbedömning avseende dataskydd (DPIA) och säkerställa en lämplig säkerhetsnivå under AI-systemets hela livscykel.

Därtill kommer krav som ställs enligt den kommande AI-förordningen, inklusive bland annat krav på data governance. Kraven på data governance innebär bland annat att AI-system med hög risk som använder AI-modeller som har tränats med data ska utvecklas på grundval av tränings-, validerings- och testningsdataset som uppfyller de kvalitetskriterier som avses i AI-förordningen. Därutöver ställer AI-förordningen särskilda krav på cybersäkerhet. Dessa krav omfattar bland annat en skyldighet att utforma och granska AI-system med hög risk för att vara motståndskraftiga mot försök att påverka deras användning, beteende och prestanda och att äventyra deras säkerhetsegenskaper av antagonistiska tredje parter. Dessutom måste AI-system med hög risk genomgå en bedömning av cybersäkerhetsrisker för att säkerställa efterlevnad av reglerna i AI-förordningen.

För att undvika ökade kostnader och överraskningar, gör utvecklare och användare av AI-system klokt att kartlägga regelverkens krav i god tid innan utvecklingen eller användningen av systemet påbörjas. En lämplig tidpunkt för att göra detta vid utvecklingen av ett AI-system är design- och analysfasen. För användaren bör en lämplig tidpunkt vara upphandlingen av AI-systemet eller, ännu bättre, förberedelserna därtill.

Mer information

Källa: Artikeln baseras på material från kursen GDPR – Artificiell intelligens och personuppgifter (distanskurs).

Relaterade nyheter

Områden

I fokus

Länder

Taggar

Populära kurser

Expertis

Gå kurs med oss

07 MAR

AI – Introduktion till artificiell intelligens

Kursen ger dig de rättsliga förutsättningarna för utveckling, upphandling och användning av AI.

14 MAR

Cybersäkerhet - Introduktion till NIS2-direktviet

En genomgång av de viktigaste reglerna i NIS2-direktivet och kompletterande svensk lagstiftning.

21 MAR

AI - Introduktion till AI-förordningen

En genomgång av de viktigaste reglerna i den nya AI-förordningen och hur du kan använda AI-system på ett lagenligt sätt.