Hva er av anonymisering
Av anonymisering er en teknikk i data mining som identifiserer kryptert eller generalisert informasjon på nytt. Av anonymisering, også referert til som omidentifikasjon av data, kryssreferanser anonymisert informasjon med andre tilgjengelige data for å identifisere en person, gruppe eller transaksjon.
BREAKING NED Av-anonymisering
Den teknologikyndige epoken forstyrrer raskt den tradisjonelle måten å gjøre ting på tvers av ulike sektorer i økonomien. De siste årene har finansnæringen sett mange digitale produkter introdusert til sin sektor av fintech-selskaper. Disse innovative produktene har fremmet økonomisk inkludering der flere forbrukere har tilgang til finansielle produkter og tjenester til en lavere pris enn tradisjonelle finansinstitusjoner tillater. Økningen i implementeringen av teknologi har ført til en økning i innsamling, lagring og bruk av data. Teknologiske verktøy som sosiale medieplattformer, digitale betalingsplattformer og smarttelefonteknologi har avduket massevis av data som brukes av forskjellige selskaper for å forbedre samhandlingen med forbrukerne. Dette massevis av data kalles big data, og er en grunn til bekymring hos enkeltpersoner og regulerende myndigheter som ber om flere lover som beskytter identiteten og personvernet til brukerne.
Hvordan de-anonymisering fungerer
I en periode med big data der sensitiv informasjon om en brukers online aktiviteter deles øyeblikkelig gjennom cloud computing, har dataanonymer blitt brukt for å beskytte brukernes identitet. Anonymisering maskerer personlig identifiserbar informasjon (PII) for brukere som handler i forskjellige felt som helsetjenester, sosiale medier-plattformer, e-handel, etc. PII inkluderer informasjon som fødselsdato, personnummer (SSN), postnummer og IP adresse. Behovet for å maskere de digitale løypene som er etterlatt av online aktiviteter har ført til implementering av anonymiseringsstrategier som kryptering, sletting, generalisering og forstyrrelse. Selv om dataforskere bruker disse strategiene for å skille sensitiv informasjon fra de delte dataene, bevarer de fremdeles den opprinnelige informasjonen, og åpner dermed dører for muligheten for gjenidentifisering.
Av-anonymisering reverserer prosessen med anonymisering ved å matche delte, men begrensede datasett med datasett som er lett tilgjengelige online. Data gruvearbeidere kan deretter hente litt informasjon fra hvert tilgjengelig datasett for å sette sammen en persons identitet eller transaksjon. For eksempel kan en datavelver hente et datasett som deles av et telekommunikasjonsselskap, et nettsted for sosiale medier, en e-handelsplattform og et offentlig tilgjengelig tellingsresultat for å bestemme navn og hyppige aktiviteter for en bruker.
Hvordan de-anonymisering brukes
Gjenidentifisering kan være vellykket når ny informasjon blir gitt ut, eller når anonymiseringsstrategien som er implementert ikke gjøres ordentlig. Med et stort antall data og begrenset tidsbruk per dag, implementerer dataanalytikere og gruvearbeidere snarveier kjent som heuristikk når de skal ta beslutninger. Mens heuristikker sparer verdifull tid og ressurser på å kombinere gjennom et datasett, kan det også skape hull som kan utnyttes hvis feil heuristisk verktøy ble implementert. Disse hullene kan identifiseres av datagruver som søker å av anonymisere et datasett for enten lovlige eller ulovlige formål.
Personlig identifiserbar informasjon hentet ulovlig fra de-anonymiseringsteknikker kan selges på underjordiske markedsplasser, som også er en form for anonymiseringsplattformer. Informasjon som faller i gale hender kan brukes til tvang, utpressing og trusler som fører til bekymringer for personvern og enorme kostnader for virksomheter som blir offer.
Av anonymisering kan også brukes lovlig. For eksempel ble Silk Road-nettstedet, en underjordisk markedsplass for ulovlige stoffer, arrangert av et anonymisert nettverk kalt Tor, som bruker en løkstrategi for å tilsløre IP-adressene til brukerne. Tor-nettverket er også vertskap for et par andre ulovlige markeder som handler med våpen, stjålne kredittkort og sensitiv bedriftsinformasjon. Med bruk av komplekse de-anonymiseringsverktøy sprakk og slo ned FBI Silk Road og nettsteder som driver med barnepornografi.
Suksess med gjenidentifiseringsprosesser har bevist at anonymitet ikke er garantert. Selv om banebrytende anonymiseringsverktøy ble implementert i dag for å maskere data, kan dataene bli identifisert på nytt i løpet av et par år etter hvert som ny teknologi og nye datasett blir tilgjengelige.
