Om at forstå Mark V. Shaney
Året var 1984. Internet var stadig for de få, men det voksede ustoppeligt fra en kerne af akademia og store high-tech virksomheder. Web eksisterede ikke endnu, istedet var der Usenet. Tusinder efter tusinder af diskussionsgrupper i et træ-formet hierarki. Summende af aktivitet. Det var her du fandt alle de spændende ting.
Onsdag den 12. september, sendte Mark V. Shaney sin første Usenet post. Den var til den åbne net.singles gruppe, og den indeholdt denne klassiker:
Mark V. Shaney
12-Sep-84 16:51:03 EDT
[...]
Når jeg møder nogen i en professionel sammenhæng, vil jeg have, at de barberer deres arme. På en konference for et par uger siden tilbragte jeg en interessant aften med et gran salt. Jeg ville ikke tage dem alvorligt! Dette bringer mig tilbage til de uforskammede folk, der presser andre til at gøre sådan eller ej. Jeg elsker en god flame fejde, nok mere end nogen anden...
[...]
Disse forvirrede rablerier må have undret brugerne i net.singles. Hvad de ikke vidste var, at Mark V. Shaney i virkeligheden var programmet shaney.
Det skal retfærdigvis siges, at det tog dem mindre end en uge at gætte det.
Rich Rosen
18/09/1984 22:13:31 UTC
Det er interessant at sammenstykning af tilfældige stumper fra andre artikler blandet sammen (Brian Eno metoden for artikelskrivning) giver så fascinerende et resultat.
[...]
Mange gange tak skal du have, Hr. Ikke-kunstig Ikke-intelligens Ikke-projekt!
[...]
Mark V. Shaney fortsatte med at poste i et års tid. Hans posts blev en del af gruppens normale strøm af posts. For nogle var de støj som kunne filtreres væk, for andre var de meget værdsatte. Nogle af net.singles brugerne opfordrede programmøren til at stå frem, men shaney tilstod aldrig at være et program. Tværtimod benægtede det flere gange, på sin egen rodede og tydeligvis kunstige måde.
Men så, i juni 1989, kastede A. K. Dewdney lys over affæren, da han skrev om Mark V. Shaney i sin Scientific American klumme Computer Recreations. shaney var blevet udviklet af Bruce Ellis og Rob Pike som en spøg. De havde Internet adgang gennem Bell Labs, hvor de arbejdede.
Dewdney forklarede at navnet Mark V. Shaney var en forvanskning af "Markov chain", som var den hovedalgoritme shaney brugte. Det havde ikke nogen sprogparser kode, men lærte bare sproget ved at læse Usenet posts. Det var derfor dets output lignede de posts der var i net.singles. Så afgjort en sammenrodet udgave af de posts, men helt klart hjemmehørende i den gruppe.
At relatere til computere
I slutningen af 1990erne begyndte psykologer at lægge mærke til at vi på mange måder behandler computere som mennesker. Jo mere de undersøgte det, jo mere udtalt fandt de at det var.
Høfligheds eksperiment. Denne slags eksperimenter blev udviklet af Clifford Nass.
Opgave 1: Testpersonen sættes ved computer A og besvarer en multiple-choice test.
Opgave 2: Testpersonen bliver så spurgt om computer As performance.
Opgave 2 udføres enten
- på computer A,
- på computer B (har samme specs som A), eller
- med papir og blyant.
Disse eksperimenter har konsekvent vist en interessant forskel i svarene der gives i opgave 2. Dem der gives til computer A er betydeligt mere positive end de andre.
Testpersonerne forstod fuldt ud at computere ikke har følelser. Det er fuldstændig ulogisk at være høflige over for dem. Men på et dybere niveau kunne de ikke lade være med at være høflige over for computer A.
Reciprocitets eksperiment.
Opgave 1: Testpersonen sættes ved computer A, og bruger den til at søge efter information.
Opgave 2: Testpersonen kalibrerer derefter farverne på en computerskærm.
Udfaldet af opgave 1 kan være enten
- brugbart, eller
- overhovedet ikke brugbart.
Farvekalibreringen kan laves enten
- på computer A, eller
- på computer B (har samme specs som A).
Testpersonen afslutter kalibreringen når farverne er "gode nok".
Disse eksperimenter har klart påvist reciprocitet. Når der blev givet brugbar information i opgave 1, brugte kalibreringen på computer A flere sammenligninger og var mere præcis, end den på computer B. Eksperimenterne har endda påvist en "hævn" effekt. Når informationen givet i opgave 1 overhovedet ikke var brugbar, brugte kalibreringen på computer A færre sammenligninger, end den på computer B.
Testpersonerne forstod fuldt ud at det ikke giver nogen mening at vise reciprocitet over for computere. Men på et dybere niveau kunne de ikke lade være med at vise reciprocitet over for computer A.
Læg mærke til hvordan computerne i begge eksperimenter sendte et minimum af antropomorfe signaler. I det første eksperiment blev der kun brugt et tekst-interface.
Hvis computerne sender stærkere antropomorfe signaler, for eksempel ved at bruge tale, så bliver den sociale relation stærkere, hvad der ikke er nogen overraskelse.
Resultaterne har vist sig at gælde i større omfang. Vi kan heller ikke lade være med at danne sociale relationer til chatbots. Denne slags relationer bliver meget stærkere, men ser osse ud til at være mere komplekse. Det er noget der forskes aktivt i i øjeblikket. Så det vil jeg ikke gå i detaljer med.
Der er en historie som Rob Pike har fortalt, om en USENIX konference han var på engang. En gruppe net.singles brugere som osse deltog, skulle ud og spise sammen, og en af dem spurgte Bell Labs folkene om Mark V. Shaney deltog i konferencen og om han kunne tænke sig at være med. Som vi ved, var de fuldstændig klar over at Mark V. Shaney var et program, så deres spørgsmål var fuldstændig ulogisk.
Her bør det nævnes at mange af net.singles brugerne syntes virkelig godt om Mark V. Shaneys posts. Så vi kan nok godt være sikre på at de på et eller andet niveau havde dannet sociale relationer til programmet, og syntes at det ville være rart hvis Bell Labs på en eller anden måde kunne give det noget kød og blod. Det var meget ulogisk, ja, men osse meget menneskeligt.
Fejlretning
Kig lidt nøjere på det Mark V. Shaney skrev:
På en konference for et par uger siden tilbragte jeg en interessant aften med et gran salt. Jeg ville ikke tage dem alvorligt!
Hvad henviser "dem" til her? Det gran salt der nævnes i den forudgående sætning er i ental, mens "dem" er i flertal. Så måske er det til konferencedeltagerne, eller til konferencens arrangører. Hvis det er, skulle der så ikke stå "kunne" istedet for "ville"? Måske er det til gran af salt generelt. Det er ikke til at sige. Men vi søger noget der ikke er der, da shaney programmet ikke kunne have haft noget i tankerne da det skrev det.
Dengang i starten af artiklen, da du læste det, er det sandsynligt at du knap nok lagde mærke til det. Dit sind auto-rettede det, så det fik en eller anden rimelig betydning. Det er alligevel ikke en vigtig del af posten. Så dit sind håndterede det på en god og effektiv måde.
Hvis du gør dig umage, vil du opdage at tekst, som der ikke er læst korrektur på, indeholder masser af fejl. Både syntaktiske og semantiske. Selv tekst du selv skriver indeholder fejl. Og det gælder i endnu højere grad for talesprog. Vi løber konstant ind i kommunikationsfejl som vi knapt nok opdager.
Vores auto-rette-funktion gør at vi ikke hele tiden skal stoppe op og rette hinanden. Sådan har det været i meget lang tid. Hvis du overvejer det, så må vi have haft denne funktion i hvert fald siden vi begyndte at bruge talesprog.
Men auto-rette-funktionen kan osse skabe problemer ind imellem. Som når vi ikke hører hvad der bliver sagt, eller erstatter en mening med en anden.
Eller giver mening til outputtet fra en chatbot, som vi er socialt knyttet til.
Opsummering
Med LLMer, eller AI i mediesprog, ser der ud til at være en stor nyhed hver uge... nu scorer AI højere end børn i denne test, nu er AI bedre end studerende til at løse den opgave, nu kan AI udføre et stykke arbejde bedre end arbejderne, og så videre. Nogle folk elsker det, nogle hader det. Det er altsammen så utroligt følelsesladet. Og selvfølgelig er det det, det må det jo være.
LLMer er langt mere sofistikerede end shaney, og selv de mest afdæmpede af dem sender flere antropomorfe signaler. Så vores sociale knytning til dem er tilsvarende meget stærkere end den de net.singles folk ved konferencen havde.
Da vi er så følelsesladede omkring LLMer, er vi elendige til at bedømme deres præstationer. Vi er fra naturens hånd ikke klarsynede når vi tænker på dem. Når vi hører en sensationel AI historie, bør vi kræve objektive kvalitetsmål der understøtter den. Ellers bliver vi bare ført rundt i manegen.
Dette blev en af mine længere artikler. Nogle af de læsere der nåede hertil, vil læne sig tilbage nu og sige: "Det er altsammen meget godt, men jeg er rationel, så jeg er ikke påvirket. Slet ikke nu jeg kender til det." Det kunne jeg endda selv have sagt, da jeg startede med at undersøge dette. Men pas på ikke at holde dig selv for nar. Du er rationel, ja, men ikke kun rationel.


