FOI Totalförsvarets forskningsinstitut: Den semantiska webben – Konsten att skilja en lada från en Lada

Konsten att skilja en lada från en Lada

En googlande nätsurfare skiljer lätt en lada från en Lada. Men det klarar inte maskinen. Nätets sökmotorer kräver en människa som tolkar. I det nätverksbaserade försvarets underrättelsesystem ska maskiner kunna tolka informationen. Framtidens underrättelsedimmor ska skingras med hjälp av smarta hyperlänkar och en brittisk präst från 1700-talet.

Av Martin Eklöf , Pontus Hörling, Robert Suzic och Choong-Ho Yi

Så länge det har funnits krig har det funnits militär underrättelsetjänst. Från 1900-talets början blev underrättelsetjänsten viktig även i fredstid. Vilka resurser och avsikter fanns på andra sidan? I dag har hotbilden breddats. Underrättelsetjänsten sysslar inte enbart med militära ting. Snarare har detta sjunkit i bakgrunden efter kalla krigets slut. Däremot gäller gamla sanningar. Det krävs mycket arbete för att samla in underrättelser och uppgifterna ska helst vara säkra. Är uppgiften osäker ska man kunna veta om det och inte behandla den som säker. Vilket det finns färska exempel på.

Kraven på underättelsetjänst är hårda. Det gäller människor och maskiner. I det nätverksbaserade försvaret (NBF) ingår den nätverksbaserade underrättelsetjänsten (NBU). Det kan tyckas vara en enkel match. I stället för att lägga pussel och gömma mikrofilm i skoklacken kan man göra som alla andra – gå ut på nätet. Som vi ska se här, är det inte så enkelt.

NBU ska utgöra en datorintensiv miljö med hög tilltro, vars tjänster producerar användaranpassad information för att möta krav från användare i varierande situationer, såväl nationellt som internationellt. Vid utveckling av NBU är det viktigt att se hur modern informationsteknologi kan användas, men kanske ännu viktigare är att se vad morgondagens it kan ge. NBU kommer liksom dagens och gårdagens underrättelsetjänst att innehålla faserna planering, insamling, bearbetning, produktion samt delgivning. Framför allt i bearbetningsfasen med sin slagsida åt analys- och syntesarbete kan modern it utnyttjas för att hitta relationer och strukturer i stora mängder information.

Den semantiska webben
För informationshantering i webbsammanhang framstår i dag utvecklingen inom den så kallade semantiska webben som ett stort kliv framåt. Här belyses vad den semantiska webben står för, varför den är viktig och vilken roll den kan komma att spela i ett framtida underrättelsesystem.

World Wide Web har inneburit tidigare oanade möjligheter för informationsutbyte mellan människor. Men informationen är gjord för att tolkas av människor, inte maskiner. En människa kan skilja på en lada och en Lada. Av sammanhanget framgår vad som är en byggnad och vad som är en bil. En maskin klarar inte detta. Datorbaserade underrättelsesystem samlar in enorma mängder information där lador och Lador blandas friskt. Det är här den semantiska webben kommer in. Informationen är redan från början gjord för att tolkas av maskiner.

Den semantiska webben var en del av Tim Berners-Lees vision av webben. Berners-Lee, som forskade vid det europeiska kärnforskningscentret Cern, var webbens egentliga upphovsman. Hans idé fick dock aldrig någon större genomslagskraft då webben främst riktade sig till tänkande människor. Den grundläggande tanken bakom den semantiska webben är att införa maskintolkbar information i webbapplikationer som är definierad enligt en mall. Detta medför att information lättare kan lokaliseras, integreras och återanvändas, samt att kommunikationen maskin till maskin, eller maskin till människa, kan genomföras på ett sätt som alla ”förstår” (interoperabilitet). Grunden är så kallade ontologier. Ontologier kan sägas vara de fack som informationen hamnar i samt relationen mellan dessa fack. Ursprungligen är ontologi ett begrepp från den filosofiska världen. Det handlar i grunden om läran om de begrepp eller kategorier som krävs för att skapa en sammanhängande, motsägelsefri och uttömmande beskrivning av någon del av verkligheten.

I den datalogiska världen kan ontologi i stället ses som en samling av de mest viktiga begrepp (till exempel typer av objekt), samt relationer mellan dessa, som ett system omfattar. Ontologier ses i allmänhet som ett medel för att ge Försvarsmakten interoperabilitet inom informationsområdet. Med interoperabilitet avses krav på ett systems förmåga att kunna utbyta information med andra system så att man kan skilja på en lada och en Lada.

Måste tala samma språk
Utvecklare av mjukvara måste ha ett gemensamt specifikationsspråk. Det dominerande språket, som i praktiken är standard, är UML. Dock räcker det inte med UML när informationen ska tolkas av maskiner. Ett mer lämpligt, men inte tillräckligt bra språk, är Extensible Markup Language (XML). Det beskriver vanligen information i hierarkiska klasser med tillhörande attribut. Det kan ge information vars struktur och basala relationer kan tolkas av maskiner. Men det är inte tillräckligt bra på att förklara meningen med informationen, det vi kallar semantik. Mest hopp sätts i dag till språket Web Ontology Language (OWL). Det kan sägas vara en utveckling av språket Resource Description Framework (RDF). OWL stöds av det konsortium (W3C) som skriver reglerna för webben. Det fina med OWL är bland annat att man med detta språk kan resonera om information. Det forskarna kallar inferens. Ny information kan härledas baserat på regler och befintlig information.

Den semantiska webbens språk kan komma till stor nytta för den framtida nätverksbaserade underrättelsetjänsten.

RDF och OWL kan skapa en delad modell för information inom en viss begreppsvärld. Med delad informationsmodell avses en modell som kan nyttjas och förstås av alla delar av ett system.

RDF och OWL representerar informationen på ett modulärt, strukturerat och distribuerat sätt. Det ger goda möjligheter till avancerad bearbetning av information, automatisering av processer och precis lokalisering av information.

Ett underrättelsesystem ska kunna visa relationer mellan olika företeelser, vilket är en naturlig del hos språk som RDF och OWL. I dessa språk kan relationer mellan företeelser uttryckas explicit, men även genereras automatiskt utifrån en uppsättning regler (inferens). Explicit kan vara att A beror på B och B beror på C. Då kan man skriva regeln att alla A beror på C. Den här förmågan gör att datorn mycket lättare än en människa kan hitta samband.

Men RDF och OWL är långt ifrån svaret på frågan om hur man skapar ett fungerande nätverksbaserat underrättelsesystem. Mycket arbete återstår, och det är oklart om det går att använda ontologier. Det vill säga sättet att dela upp informationen i fack. Dessutom har både RDF och OWL brister som gör att de ännu inte lever upp till de krav som NBU ställer. Information är en färskvara. Den kan dessutom vara osäker eller ofullständig. Det krävs metoder och tekniker som kan hantera osäkerheter i information, och vilka konsekvenser osäkerhet får på härledd information och slutsatskedjor. Dagens OWL klarar inte det. Det är därför en viktig forskningsuppgift att se om de mest lovande dataspråken RDF och OWL ändå är rätt väg mot att lösa problemet med osäkerheter.

Statistisk metod från 1700-talet
En möjlig väg är de så kallade Bayesianska nätverken som fått sitt namn efter den engelske 1700-talsprästen och amatörstatistikern Thomas Bayes. Bayesianska nätverk är en statistisk metod. Den kan hantera osäker information och även resonera om den. Metoden påminner i vissa delar om språken RDF och OWL. Det gör att en del information som hanterats med RDF och OWL skulle kunna översättas till ett Bayesianskt nätverk. Vid resonemang kring informationen kan då även hänsyn tas till informationens osäkerhet.

Den nätverksbaserade underättelsetjänsten är det nätverksbaserade försvarets syskon. Syskonen ska passa ihop. De ska ha samma regler och krav. När program och hårdvara byggs upp för NBU måste den passa in i NBF.

Det går inte att skapa en ontologi som kan möta alla krav från en domän. Det är bättre om underrättelsetjänsten har flera specialgjorda ontologier som tillsammans utgör en generell ontologi. Det är således viktigt att bygga infrastruktur som tar hänsyn till ontologier på flera nivåer, från generiska modeller som kan appliceras för hela underrättelseområdet till ontologier skapade för specialiserade grupper.

Martin Eklöf, Robert Suzic och Choong-Ho Yi från FOI:s systemteknikavdelning, samt Pontus Hörling från avdelningen för ledningssystem, arbetar med forskning kring informations- och kunskapshantering i framtida underrättelsesystem.

Från Framsyn nr 4-2004 – www.foi.se/framsyn

Läs artikel här



Kommentera:

Namn *:
E-post *:
Webbplats:
Kommentar *:
*