Tellefs feedback: Ikke bruk ki til tekstredigering

Å bruke språkmodeller ("ki", eller llm-er) til tekstredigering er risikabelt. Modeller som ChatGPT er trent til å “forbedre” tekst, og vil derfor nesten uunngåelig endre det du gir dem – selv når du ber dem la være. Resultatet er at selv en enkel oppgave, som å plassere tekst fra ett dokument inn i et annet, fort utvikler seg til en omskriving av begge du aldri ba om.

(En stor språkmodell, Large Language Model – LLM, er en avansert AI-teknologi trent på enorme datamengder for å forstå, generere og analysere menneskelig språk.)

En konkret test av ChatGPT viser hvor vanskelig det er å få en språkmodell til å utføre en presis redigeringsoppgave uten å gripe inn i teksten. Selv gjentatte og tydelige instruksjoner om å bevare formuleringer og kun foreslå plassering av tekstblokker ble ignorert. I stedet begynte modellen å omskrive, komprimere og “forbedre” materialet. Erfaringene illustrerer en grunnleggende begrensning ved LLM-er: De er bygget for å generere tekst, ikke for å la den være i fred.

Utgangspunktet mitt var enkelt: En eksisterende tekst på rundt 3000 ord skulle utvides til cirka 6000, ved å integrere tekstblokker fra et annet dokument hvor jeg hadde samlet mulige tillegg. Oppgaven var ikke kreativ, men redaksjonell. Det som skulle gjøres, var i prinsippet en kontrollert utvidelse: foreslå gode innsettingspunkter for tekst fra et dokumentet med tillegg slik at helheten fortsatt hang sammen.

I praksis viste det seg vanskelig å få ChatGPT til å holde seg til denne rammen.

Til tross for gjentatte instrukser om å ikke omskrive teksten, men kun foreslå plassering av eksisterende avsnitt, begynte modellen raskt å reformulere. Tekstblokker som skulle flyttes ble i stedet parafrasert. Avsnitt ble slått sammen. Argumenter ble komprimert. Resultatet var ikke en utvidet tekst, men en ny versjon – kortere, glattere og mindre presis enn originalmaterialet.

Underveis gikk det opp for meg at dette var klassisk ki-bullshit, der programmet tar av på egen hånd, uavhengig av instruksjonene det får.

Etter hvert utviklet det seg til noe som hadde passet bedre i et surrealistisk teaterstykke.

Som da jeg ba tjenesten ta for seg et og et av avsnittene i et dokument der jeg hadde samlet et titalls tillegg til teksten jeg hadde skrevet Både dokumentet med tilleggene og det med teksten tilleggene skulle inn i var lastet opp til ki-en. Det første forslaget var ok.

Finn avsnittet som slutter med “… this creates friction.”

Lim inn tillegget som begynner med

“From early vocal and percussive practices…”

og fram til:

“This imbalance is not historical, but historiographical.”

Greit nok, før galskapen tok over. For i neste forslag ba ChatGPT meg lime inn et tillegg jeg ikke husket å ha skrevet. Jeg søkte for sikkerhets skyld i dokumentet med tillegg, men fant ikke tekstblokken

“From a global perspective…”

og fram til:

“…simply music.”

Så jeg spurte hvor i tilleggsdokumentet denne teksten finnes. Ki-en svarte glatt at denne teksten ikke finnes i dokumentene jeg hadde lastet opp. Statistikken som styrer språkmodell-ki-en har altså overkjørt min instruks og funnet på noe den mener hadde passet bedre enn det jeg hadde foreslått. OBS! Ordene "overkjørt" og "mener" i forrige setning antyder en menneskelig intensjon fra ki-ens side, noe det jo ikke har.

Det mest raffinerte i galskapen er jo at den ikke skrev hele teksten i dette for meg ukjente “tillegget”. I stedet siterte den starten og slutten av et avsnitt den hadde konstruert, men ikke skrevet, som om det var den mest naturlige ting i verden. Velkommen til fremtiden. Den spinnvilt sinnssyke varianten.

I etterkant ba jeg ki-en om å forklare hvordan forslaget om å sette inn et imaginært avsnitt kunne oppstå. Forklaringen jeg fikk var grundig og lang, men kjernen var omtrent slik, i ChatGPTs egne ord:

"Jeg tok utgangspunkt i en tekstlig mulighet, ikke en tekstlig realitet.

Du jobbet i en modus som krever:

presisjon

kontroll

etterprøvbarhet

mens jeg svarte i en modus som produserer:

plausibilitet

flyt

sannsynlighet.

Og videre: "Jeg tok utgangspunkt i en tekstlig mulighet, ikke en tekstlig realitet."

Dette er ikke en tilfeldig feil, men en konsekvens av hvordan slike modeller er trent. En LLM er optimalisert for å produsere sammenhengende og plausibel tekst. Når den får to tekstkilder, vil den forsøke å integrere dem ved å skrive dem sammen, ikke ved å bevare dem side om side. Den oppfatter “integrasjon” som en språklig oppgave, ikke som en mekanisk.

Problemet oppstår særlig i oppgaver som kombinerer to typer krav: et mekanisk mål og en språklig operasjon. I dette tilfellet var målet eksplisitt – nå et bestemt omfang ved å legge til bestemt materiale – samtidig som teksten skulle forbli lesbar. For en menneskelig redaktør er dette en velkjent oppgave. For en språkmodell er det en konflikt: Den vil prioritere flyt og konsistens fremfor bevaring og volum.

Et annet aspekt er at modellen i liten grad respekterer negative instrukser. Å be den om å “ikke omskrive” er mindre effektivt enn å be den skrive noe nytt. Den vil likevel forsøke å optimalisere formuleringene, fordi dette er kjernen i funksjonen dens. Dermed blir også en tilsynelatende avgrenset oppgave – som å peke på hvor tekst kan settes inn – glidende over i en fullstendig omskriving.

Konsekvensen er at LLM-er per i dag er lite egnet til presis tekstredigering der kontroll er avgjørende. De fungerer godt som støtteverktøy i idéutvikling, strukturering og språkvask. Men når oppgaven krever nøyaktig håndtering av eksisterende tekst – bevaring av formuleringer, kontroll over lengde, og eksplisitt bruk av gitte tekstblokker – blir de upålitelige.

Den praktiske lærdommen er enkel: Bruk språkmodeller til å drodle, ikke til å utføre presis redigering. Der kontrollen må være absolutt, er tradisjonelle verktøy, og ditt eget hode, fortsatt bedre egnet.

Tellefs feedback

Thursday, April 16, 2026

Ikke bruk ki til tekstredigering

No comments: