Anonimiseren van data

Afstudeerstage, Meewerkstage
Deventer
Geplaatst 7 maanden geleden

Anonimiseren van data

Om het risico van datalekken en (onbedoeld) misbruik te ondervangen willen wij kunnen beschikken over geanonimiseerde datasets voor test-, verificatie- en instructiedoeleinden, help jij ons mee?

Jouw opdracht bij Topicus

Een sociale samenleving waarin iedereen, op zijn eigen manier, goed kan functioneren. Dat is wat Topicus Overheid wil realiseren. Vanuit maatschappelijke betrokkenheid en met passie voor techniek, zijn wij een partner voor gemeenten, zorginstellingen, wijkteams en burgers. We verbinden betrokkenen, ondersteunen de samenwerking en vergroten de zelfredzaamheid van onze burgers waardoor wij als één team het verschil kunnen maken.

Gidso is het SAAS platform van Topicus Overheid waarmee gemeenten de uitvoering van de WMO en Jeugdwet ondersteunen. WMO staat voor Wet Maatschappelijke Ondersteuning. Iedere inwoner kan als hij hulp nodig heeft naar de gemeente stappen en uitleggen wat zijn probleem is. Vervolgens zal de gemeente, in zo goed mogelijk overleg met de inwoner, dieper ingaan op de hulpvraag en een voorstel voor concrete ondersteuning doen. Als de gemeente en de hulp vragende inwoner een keuze voor een bepaalde soort van ondersteuning hebben gemaakt, zal een leverancier gevraagd worden bijvoorbeeld thuiszorg, een traplift, of iets anders te leveren.

In dit hele proces is het belangrijk dat er een goed samenspel tussen gemeente, inwoner en zorgleveranciers is. Om dit alles mogelijk te maken moet veel informatie worden verzameld, opgeslagen en bewerkt. Een groot deel van de data is vertrouwelijk en persoonlijk van aard. De regelgeving rondom het verwerken van al deze data is strikt. Het beschikbaar maken van gegevens moet beperkt zijn tot specifieke mensen of functionarissen, moet een duidelijk omschreven doel dienen en de data mag niet langer bewaard worden dan strikt nodig is voor het uitvoeren van de taken.

Bij Topicus hebben we hier iedere dag mee te maken. Om het risico van datalekken en (onbedoeld) misbruik te ondervangen willen wij kunnen beschikken over geanonimiseerde datasets voor test-, verificatie- en instructiedoeleinden. Het genereren van een realistische grote dataset uit het niets is lastig. Immers, echte data heeft kenmerken die met algoritmen nauwelijks na te bootsen zijn. Daarnaast bevat data fouten en is het vaak nodig datasets in de tijd met elkaar te vergelijken.

Jij gaat een methode ontwikkelen om startend vanuit bestaande Gidso datasets realistische geanonimiseerde datasets te genereren. De informatie mag op geen enkele wijze te herleiden zijn naar echte personen, terwijl de eigenschappen van de datasets in verregaande mate behouden moeten blijven om ze bruikbaar te maken voor de genoemde doeleinden. De geanonimiseerde data moet direct te gebruiken zijn in Gidso, waarbij indices en queries onveranderd moeten blijven. Dit vereist dat je kennis hebt van relationele database management systemen (wij gebruiken Postgres) en SQL onder de knie hebt.
Je opdracht zal uit de volgende elementen bestaan:

  • analyseren van de structuur en andere eigenschappen van een aantal bestaande datasets
  • uitdenken van een methode om de datasets te anonimiseren
  • (meehelpen bij) het implementeren van deze methode
  • anonimiseren van een aantal datasets en de validiteit van het resultaat aantonen
  • verzorgen van goede documentatie waarmee Topicus verder kan
  • presenteren van de resultaten aan de Topicus collega’s

Tijdens de uitvoering van de opdracht werk jij samen met onze analisten en software developers. Je begeleider is een analist of senior developer. De standplaats voor deze opdracht is Enschede, met zo nu en dan werkzaamheden bij collega’s in Deventer.

Vereiste ervaring en skills

Jouw gedrevenheid en een leergierige instelling zijn voor ons het allerbelangrijkst. Ervaren collega’s helpen je vervolgens om jouw afstudeer/stageopdracht goed te doorlopen. Maar, om succesvol te kunnen zijn is een goede basis natuurlijk wel belangrijk. Dit betekent dat jij:

  • Een derde- of vierdejaars hbo-/wo- Bèta-student bent;
  • Kennis hebt van SQL;
  • En communicatief vaardig bent.

Wat kun je van Topicus verwachten?

Omdat we graag willen dat jij je meteen thuis voelt, organiseren we in het begin van jouw afstudeerperiode een lunch voor jou en jouw collega-studenten. Zo leer je meteen mensen kennen en weet je met wie je na werktijd leuke dingen kunt ondernemen.

Natuurlijk word je tijdens je stage-/ afstudeeropdracht ook begeleid door meerdere Topicanen, in aanvulling op de begeleiding vanuit je opleiding. Zit jouw tijd bij Topicus er bijna op dan staat het Topicus Studentencongres op de planning, waar jij een presentatie geeft over de opdracht die je hebt uitgevoerd. Ook andere stagiaires en afstudeerders betreden die dag het podium, dus er wordt volop kennis gedeeld. Het congres is een perfecte manier om je presentatie skills te upgraden, zeker omdat je samen met de andere studenten vooraf een training presentatietechniek mag volgen.

En dat is nog niet alles! Je ontvangt bij ons een vergoeding van € 500,- bruto per maand en ook de secundaire arbeidsvoorwaarden zijn aantrekkelijk. Bekijk hieronder de unieke benefits.

Vacature kenmerken

CategorieData Solutions Development, Development
Solliciterenhttps://www.werkenbijtopicus.nl/stages/anonimiseren_van_data-overheid-enschede/solliciteer-nu

Online solliciteren