2023-10-02

Reading time: 7min

Melinda Cuzner

Melinda Cuzner

Digital strateg

Datautmaningen och AI-flugan

I medierna kan vi läsa hur utvecklingen inom AI kommer att revolutionera våra arbeten. Möjligheterna verkar oändliga. Samtidigt befinner sig många organisationer i en situation där förändringen är begränsad. Organisationerna vet att de måste på AI-tåget, men inte hur.

Rätt data för meningsfulla slutsatser

Minns ni den där filmen, Flugan från 1986? Precis, den där Cronenberg-filmen där vetenskapsmannen, spelad av Jeff Goldblum, skapade en teleporteringspodd, men datorn blir förvirrad och blandar ihop hans DNA med en flugas. Flugan brukar inte listas bland filmer med AI-tema, men jag tycker att den har ett sådant. Datorn saknar input från vetenskapsmannen och drar sina egna slutsatser. Resultatet blir inte så bra, men det finns ju heller ingenting som säger att AI per definition måste dra korrekta slutsatser.

Nu tror jag inte att många företag står inför utmaningen att skilja insekters DNA från människans i syfte att undvika skapandet av artöverskridande monster. Däremot tror jag många företag står inför utmaningen att använda data de har, i syfte att dra meningsfulla slutsatser.

Om det är någonting vi kan lära oss från Flugan så är det att vi inte kan slänga ihop en massa data i en självlärande dator och räkna med att resultatet blir bra.

Komplexa algoritmer

Visst, mycket beror på algoritmen. Den där snurran som processar data och ska efterlikna vår hjärnas intelligens. Beroende på hur den är konstruerad att dra konklusioner kommer den att vara bättre eller sämre på att dra slutsatser som organisationen har nytta av med den data som organisationen har till sitt förfogande. Ganska ofta är algoritmen komplex och svår att förstå sig på. Och svårare blir det förstås med AI-verktyg som inte är transparenta med hur deras algoritm funkar. Men oavsett algoritm kommer AI, liksom vi människor, dra olika slutsatser beroende på vilka data som matas in.

AI drar specifika slutsatser från specifik data

Ett hinder för många AI-applikationer är data. Hur är det möjligt, kan man fråga sig när verksamheter samlar på sig mängder med data? För data finns, massvis av data. Så mycket data att många organisationer inte vet vad de ska göra med alla data. Varför kan vi inte bara trycka in det i ett AI då? Jo, för att även om det i medierna framstår som att AI har en obegränsad slutsatsförmåga så är de AI verktyg som finns på marknaden idag begränsade. De är konstruerade för att dra specifika slutsatser baserade på specifika data. Ett AI-verktyg som kan användas för att optimera energiförsörjning kan inte samtidigt hantera avvikelser i data. Så om den data som verktyget använder innehåller extrema värden, mätfel eller dubbleringar har AI-verktyget med störst sannolikhet inte en inbyggd funktion som stannar upp och säger: ”Vänta nu, det är något som inte stämmer”.

  • Stirrar man blint på siffrorna ser det ut som att galenskapen sköt i höjden som ett resultat av radiolyssnandet.

Data kan ge skev bild

Sedan kan kombinationen av vissa data ge en skev bild om de paras ihop på fel sätt. Om vi tänker att den kommersiella radion hade sitt genombrott för en så där 100 år sedan, runt samma tidpunkt ändrades diagnosticeringen av mental ohälsa vilket ledde till en kraftig ökning i antal registrerade fall av mental ohälsa. Stirrar man blint på siffrorna ser det ut som att galenskapen sköt i höjden som ett resultat av radiolyssnandet. Korrelationen var ju skyhög! Men även om radiovågornas inverkan på våra hjärnor fortfarande studeras skulle ovan nämnda slutsats få medicinhistoriker att ta till skämskudden.

AI som lär sig göra fel

Trycker vi in en massa data, som är både felaktiga och irrelevanta, så kommer vårt AI verktyg dra felaktiga slutsatser och lära sig av sina egna misstag. Och då inte nödvändigtvis i den positiva bemärkelsen, utan den kan lära sig att bekräfta felaktigheterna dataunderlaget redan bär på. Till exempel kan ett AI-verktyg användas för en vegetationskartering och analys av den biologiska mångfalden i ett stort område för att ta reda på om det finns invasiva arter inom området. Om det finns det kan det vara aktuellt att åtgärda problemet genom att till exempel gräva upp invasiva växtligheter. För att planera åtgärderna på ett optimalt sätt är det viktigt med en korrekt bild av det biologiska beståndet.

AI-verktyget lär sig av data hämtade från manuellt registrerade observationer och då är det viktigt att observationerna registrerats rätt. Om till exempel en handläggare på en kommun använt ett mätverktyg med dålig precision blir GPS-positioneringen fel, och AI-verktyget kommer att lära sig fel.

GPS-verktygen har förbättrats avsevärt de senaste åren och kommunen kan ha köpt in nya mätverktyg för att åtgärda problemet med felpositionering. För att få tillräckligt med inlärningsdata matas däremot såväl nyproducerade data som historiska data in i AI-verktyget, alltså även från tiden innan dessa åtgärder sattes i bruk. Och i sin iver tar kommunen med data från gamla databaser som, på grund av ett tekniskt arv som de flesta organisationer bär på, innehåller dubbletter.

Nu bekräftar merparten av data den förlegade kartläggningen av det biologiska beståndet och AI-verktyget är inte smartare än att fortsätta dra slutsatser enligt dessa ingångsvärden. Alla insatser för att skydda området från invasiva arter riskerar nu att vara felriktade.

  • Hur kul är det att prata om datakvalitet, informationsägandeskap, teknisk skuld och informationssäkerhet när ledningen vill se flashiga AI-verktyg?

Digital strategi som har koll på data

Det är viktigt för organisationer att känna sin data och ha en informationsstyrning på plats. Detta är ett led i organisationens digitala mognad och bör ingå i organisationens digitala strategi.

Men hur kul är det att prata om datakvalitet, informationsägandeskap, teknisk skuld och informationssäkerhet när ledningen vill se flashiga AI-verktyg? Det tråkiga svaret är att organisationen inte kan digitaliseras utan att ha koll på sina data. Det roliga svaret är att organisationen kan börja använda data med känd och god kvalitét och förbättra sin dataförvaltning och därmed sina AI-applikationer allt eftersom. För att hitta en lösning som ger värde för organisationen krävs ett tydligt syfte men det kan även krävas många försök och många misslyckanden innan de hittar rätt.

Att hoppas att ett AI-verktyg ska kunna matas med alla sorters data och kunna skilja på vad som är människa och vad som är fluga och därifrån dra slutsatser som kan ta organisationen till oanade höjder är i dagsläget fortfarande science fiction.  Däremot finns det mycket att vinna på att inventera data och ta reda på hur det kan användas på bästa sätt. Om du klurar på din digitala strategi – hör av dig till oss på Sweco, så hjälper vi dig att hitta vägen framåt!