10 KJEMI 4 2024 1. Tekniske stordata er informative, men krever litt matematikk Med dagens måleinstrumenter kan vi beskrive hver enkelt prøve med to, ti, hundre eller kanskje hundre tusen instrument-kanaler samtidig, kanskje i en million piksler og i tusener av prøver i rask rekkefølge. Men med rask, mangekanals måleteknikk blir det mye måledata! Og den informasjon vi er interessert i, ligger grundig knadd sammen med informasjon fra mange andre variasjonsårsaker i slike tekniske stordata. For å ut nyttig informasjon trenger vi derfor å bruke praktisk datamodellering, statistisk validering, effektiv datakompresjon og god grafikk. Grunnleggende for alt dette: Nyttig matematikk. Math is cheaper than physics, but …: Som biokjemiker vet jeg at ikke alle er like glade i matematikk. Det er nesten en naturlov: Jo mer ‘bio, jo mindre mattetikk, takk. For Mattegapet skiller nemlig Matematikkens Hus fra Huset for Alt Annet. Mitt inntrykk er at Mattegapet i dag må krysses på slak line (figur 1a): Få prøver, færre kommer over, og enda færre kommer tilbake igjen med noe å fortelle. Noen blir fristet til å prøve å tette igjen Mattegapet med Black Box kunstig intelligens (KI). Gjort seriøst, kan dette funke og gi besparelse. Av og til er det foreløpig eneste mulighet, som for eksempel i språkmodellering osv. Men så veldig billig og enkelt er det ikke. Det krever tilstrekkelig informative treningsdata (dyrt) og mye regnekraft (mye strøm). Ferdig opptrent gir KI-systemer raske prediksjoner og klassifikasjoner. Men noen ganger feiler de, uten å si fra. Og trener man opp KI-løsningen flere ganger på samme treningsdataene, kan man få forskjellige løsninger hver gang – ingen av dem tolkbare for mennesker. Heldigvis jobbes det iherdig med såkalt Forklarbar KI (XAI), langs flere fronter. Men de har et vrient startpunkt: Den skjulte, men overveldende kompliserte nevralnett-modellen har masse ukjente parametere som estimeres fra treningsdataene, gjennom flere trinn. For mange tekniske stordata må black box KI betegnes som unødig kostbart, energikrevende, komplisert og menneskelig fremmedgjørende. For Kjemiens bidrag til bedre KI? Data-fenomikk: Se mønstrene i årsakenes virkninger Harald Martens, bio-kjemometriker, prof. emerit., stordata-kybernetikk, Inst. teknisk kybernetikk, NTNU, seniorkonsulent, Idletechs AS, Trondheim Figur 1: Matte-gapet skal overvinnes! LANDSMØTE 2024
RkJQdWJsaXNoZXIy MTQ3Mzgy