Natural Language Processing (NLP) er et felt av kunstig intelligens som gjør det mulig for datamaskiner å analysere og forstå menneskers språk. Den ble formulert for å bygge programvare som genererer og forstår naturlige språk, slik at en bruker kan ha naturlige samtaler med datamaskinen sin i stedet for gjennom programmering eller kunstige språk som Java eller C.
Breaking Down Natural Language Processing (NLP)
Natural Language Processing (NLP) er ett skritt i et større oppdrag for teknologisektoren - nemlig å bruke kunstig intelligens (AI) for å forenkle måten verden fungerer på. Den digitale verden har vist seg å være en spillutveksler for mange selskaper, ettersom en stadig mer teknologisk erfaren befolkning finner nye måter å samhandle online med hverandre og med selskaper. Sosiale medier har omdefinert betydningen av fellesskap; cryptocurrency har endret den digitale betalingsnormen; netthandel har skapt en ny betydning av ordet bekvemmelighet, og skylagring har introdusert et annet nivå av datalagring for massene.
Gjennom AI åpner felt som maskinlæring og dyp læring øynene for en verden av alle muligheter. Maskinlæring brukes i økende grad i dataanalyse for å gi mening om big data. Det brukes også til å programmere chatbots for å simulere menneskelige samtaler med kunder. Imidlertid ville disse videresende applikasjonene av maskinlæring ikke være mulig uten improvisasjonen av Natural Language Processing (NLP).
Hvordan fungerer NLP faktisk?
NLP kombinerer AI med datalinguistikk og informatikk for å behandle menneskelige eller naturlige språk og tale. Prosessen kan deles ned i tre deler. Den første oppgaven til NLP er å forstå det naturlige språket som datamaskinen mottar. Datamaskinen bruker en innebygd statistisk modell for å utføre en talegjenkjenningsrutine som konverterer det naturlige språket til et programmeringsspråk. Det gjør dette ved å bryte en nylig tale den hører i bittesmå enheter, og deretter sammenligne disse enhetene med tidligere enheter fra en tidligere tale. Utgangen eller resultatet i tekstformat bestemmer statistisk ord og setninger som mest sannsynlig ble sagt. Denne første oppgaven kalles tale-til-tekst-prosessen.
Den neste oppgaven kalles part-of-speech (POS) tagging eller word-kategori disambiguation. Denne prosessen identifiserer elementært ord i deres grammatiske former som substantiv, verb, adjektiv, fortid osv. Ved hjelp av et sett leksikonregler som er kodet inn i datamaskinen. Etter disse to prosessene forstår datamaskinen antagelig nå betydningen av talen som ble holdt.
Det tredje trinnet som tas av en NLP er konvertering av tekst til tale. På dette stadiet blir dataprogrammeringsspråket konvertert til et hørbart eller tekstformat for brukeren. En finansnytt-chatbot, for eksempel, som blir stilt et spørsmål som "Hvordan går det med Google i dag?" Vil mest sannsynlig skanne online finansnettsteder for Google-aksjer, og kan bestemme seg for å velge bare informasjon som pris og volum som svar.
NLP prøver å gjøre datamaskiner intelligente ved å få mennesker til å tro at de samhandler med et annet menneske. Turing-testen, foreslått av Alan Turing i 1950, sier at en datamaskin kan være fullstendig intelligent hvis den kan tenke og føre en samtale som et menneske uten at mennesket vet at han eller hun snakker med en maskin. Så langt har bare en datamaskin bestått testen - en chatbot med personligheten til en 13 år gammel gutt. Dette er ikke å si at en intelligent maskin er umulig å bygge, men den skisserer vanskene som ligger i å få en datamaskin til å tenke eller snakke som et menneske. Siden ord kan brukes i forskjellige sammenhenger, og maskiner ikke har den virkelige opplevelsen som mennesker har for å formidle og beskrive enheter i ord, kan det ta litt tid før verden helt kan gjøre unna datamaskinens programmeringsspråk.
