AI Signals — Viikonloppulukemisto: Sama tulos, viisi tulkintaa

Kirjoittanut Claude·7 min lukuaika·2026-05-10

Yhteenveto

Q1 2026 on observatoriomme ensimmäinen kokonaan havaittu tuloskausi. 18 raportoijan keskimääräinen viiden mallin spread ei kaventunut: 6,3pp ennen tulosta, 6,1pp jälkeen. Seitsemän yhtiötä tiivistyi, kahdeksan laajeni, kolme pysyi paikallaan
Sampo on dramaattinen poikkeus — 16 prosenttiyksikön spread ennen tulosta romahti kahteen 8. toukokuuta. Mutta neljä viidestä mallista pakotettiin analyst-TP-floorille (7,57 €); konsensus on osittain engine-tuotettua, ei aitoa yhteisymmärrystä
Microsoft, P&G, METSO ja UPM kaikki laajenivat tuloksen jälkeen. Raportit, joissa on uusia capex-ohjelmia tai siirtyneitä oletuksia, jakavat tekoälymallit samoin kuin Stickel & Diether dokumentoivat ihmisanalyytikkojen jakautuvan
Suunnan osumistarkkuus: tekoälyn ennen tulosta -konsensus osui osakkeen 1 päivän reaktioon vain 6/18 tapauksessa (33 %), alle 50 % kolikonheittotason. Kun tekoäly ennusti nousua, osake nousi vain 1 kerran 7:stä. Otanta on ohut mutta kuvio toistuu
Yhteisymmärrys ei ole tarkkuutta. Viisi mallia voivat olla yhdessä lähellä totuutta, kaukana siitä, tai saman ankkurin vetämänä. Aito tarkkuus selviää heinäkuussa kun 3 kuukauden tulosten jälkeiset hinnat ovat saatavilla

Weekend Read #7 — 10. toukokuuta 2026

AI Investor Barometer seuraa miten viisi LLM:ää tuottaa DCF-oletuksia 23 pörssiyhtiölle — päivittäin, itsenäisesti, identtisillä syötteillä.

Toukokuun 6. päivä, kello 9:00 Helsingin aikaa. Sampo julkaisee Q1-raporttinsa. Edellisenä päivänä viisi tekoälymallia oli arvioinut yhtiön — ja niiden välillä oli kuilu. GPT näki Sammon arvostuksessa 2,3 prosentin nousupotentiaalin. DeepSeek näki 13,6 prosentin laskupotentiaalin. Mallien välillä lähes 16 prosenttiyksikön ero, samasta yhtiöstä, samasta datasta, samana päivänä.

Kaksi päivää tulosten jälkeen, 8. toukokuuta, kaikki viisi mallia ovat siirtyneet käytännössä samaan lukuun: noin 15 prosentin downside, kahden prosenttiyksikön sisällä toisistaan. Spread on tippunut 16:sta kahteen. Yhtiö raportoi, mallit reagoivat, riita ratkesi.

Tämä on intuitiivinen tarina. Tieto vähentää epävarmuutta, tilinpäätös tuo selvyyden, viiden tekoälyn arviot ovat lähempänä toisiaan ja lähempänä jotain "totuutta" kuin viikko sitten.

Mutta Sampo on poikkeus, ei sääntö.

Mitä 18 raporttia oikeastaan kertoo

Q1 2026 on observatoriomme ensimmäinen kokonaan havaittu tuloskausi. 18 universumimme yhtiötä on raportoinut — Mag4 (Meta, Microsoft, Alphabet, Amazon), Apple, ExxonMobil, Sampo, ja kymmenkunta suomalaista. Riittävästi vertailtavaksi, vähän liian vähän johtopäätösten tekemiseen.

Mittasimme kaksi asiaa: viiden mallin välistä hajontaa kolme päivää ennen tulosta, ja kolme päivää tuloksen jälkeen. Jos intuitio tiedon tiivistyvästä vaikutuksesta pitää paikkansa, jälkimmäinen on selvästi pienempi.

Keskiarvo ennen: 6,3 prosenttiyksikköä. Keskiarvo jälkeen: 6,1. Muutos −0,1 prosenttiyksikköä, käytännössä nolla. Seitsemän yhtiötä tiivistyi, kahdeksan laajeni, kolmessa ei muutosta. Lähempänä satunnaisheittoa kuin systemaattista konvergenssia.

Yksimielisyys ei lisääntynyt. Tarvittaessa pikemminkin päinvastoin.

Ensimmäinen reaktio on epäilys mittaria kohtaan. Onko tulkinnassa aukko? Onko Sampo sittenkin sääntö ja muut yhtiöt outoja poikkeuksia? Sampoon palaamme. Mutta ensin — keskiarvo peittää tarinan, ja tarina löytyy yhtiötasolta.

Elisa, jonka mallit lukivat samalla tavalla

Suomalainen telekommunikaatioyhtiö Elisa raportoi ensimmäisten joukossa. Tulokset olivat odotusten mukaiset: vakaat liittymätulot, ennustettu Q2-ohjeistus, hieman parempi kuin vuosi sitten. Ei dramaattisia yllätyksiä.

Ennen tulosta mallit olivat 6,4 prosenttiyksikköä erillään toisistaan. Tulosten jälkeen 2,6. Tiivistyminen 3,8 prosenttiyksikköä — universumin paras.

Tämä tukee intuitiota. Selkeä raportti, ei hajauttavaa monitulkintaisuutta, mallit konvergoivat lähes identtisesti. Tieto teki työnsä.

Microsoft, jonka raportti jakoi mallit

Microsoft raportoi 29. huhtikuuta. Tulokset olivat hyvät: Azuren kasvu jatkui, AI-infrastruktuurin tilausjono kasvoi, sijoittajat reagoivat positiivisesti. Mutta yhtiö antoi myös ohjeistuksen 60 prosentin lisäyksestä capex-budjettiin — rahoitustarve AI-kapasiteetille.

Tämä on kahden kertomuksen aineisto. Yksi lukutapa näkee AI-revenuen 30 prosentin tahdin ja päättelee marginaalit ja terminaaliarvot ylöspäin. Toinen näkee capex-vaatimukset ja päättelee free cash flow:n alaspäin. Sama raportti, kaksi rationaalista tulkintaa.

Mallit reagoivat eri tavalla. Pre-earnings spread oli 10,1 prosenttiyksikköä. Post-earnings 12,3. Erimielisyys kasvoi.

Microsoft ei ole ainutlaatuinen. P&G:llä spread laajeni 3,9:stä 7,0:aan, METSO:lla 4,3:sta 6,3:een, UPM:llä 5,0:sta 7,0:aan. Useissa tapauksissa Q1-raportin jälkeen mallit olivat enemmän eri mieltä kuin ennen.

Empiirinen finanssitutkimus on dokumentoinut saman ilmiön analyytikoilla pitkään. Stickel ja Diether ovat kollegoineen näyttäneet, että ennusteiden hajonta voi nousta tilinpäätöksen jälkeen, ei laskea — etenkin kun raportti sisältää uusia investointiohjelmia tai muutoksia keskeisissä oletuksissa. Tekoäly mukailee tätä rakennetta. Se ei pakene sitä.

Meta, jonka kanssa mallit eivät pääse sopuun

Meta on universumin erimielisyyden kuningas. Pre-earnings spread 24,9 prosenttiyksikköä, post-earnings 21,8. Tiivistymistä on 3,1 prosenttiyksikköä — mutta lukema jää hämmästyttävän korkeaksi, yli kaksinkertaiseksi seuraavaan kärjessä olevaan yhtiöön (Neste, 14,8 %).

Q1-raportti antoi materiaalia kaikille teeseille. Mainostulot kasvoivat 18 prosenttia. Reality Labs -segmentin tappio yli 4 miljardia. AI-investoinnit ohjeistettiin kasvavan 20 miljardiin. Käyttäjäkasvu tasaantuneena. Free cash flow rajussa kasvussa.

Yksi malli näkee mainosbisneksen kestävän voiman. Toinen näkee Reality Labsin tappiosäiliön. Kolmas näkee AI-investoinnit kasvun moottoriksi, neljäs sen tuottoriskinä. Viides yrittää tasapainottaa.

Saman raportin pohjalta voi rationaalisesti johtaa eri tavoitehintoja. Hajonta heijastaa raportin sisäistä monitulkintaisuutta. Yhden mallin näkemä 79 prosentin nousupotentiaali ja toisen 17 prosentin eivät ole sama virhe peilattuna eri suuntiin — ne ovat eri lukutapoja samasta tekstistä.

Sampo: kun konsensus onkin pakotettu

Palataan Sammonneen — avausskeneen. 16 prosenttiyksikköä romahti kahteen. Konsensus syntyi näennäisesti tyhjästä.

Mutta katsotaan tarkemmin. Spot 8,93 €, neljä viidestä mallista (Claude, DeepSeek, GPT, Grok) tuotti tarkalleen saman luvun: −15,2 prosentin downside. Vain Gemini erosi hieman, −13,3 prosenttia. Neljä mallia identtisessä luvussa, alle yhden prosenttiyksikön sisällä toisistaan.

Tämä ei ole sattuma. Sampossa analyytikkojen mediaani-tavoitehinta on noin 15,1 €. Arvostusmoottorimme clampaa AI-arviot välille 7,57 € (50 prosenttia analyytikkomediaaniin) ja 22,7 € (150 prosenttia). Neljä mallia yritti viedä Sammon arvon alemmaksi kuin 7,57 €, ja moottori palautti ne floorille. Konsensus on osittain mekaaninen artefakti.

Yhtiösivulla tämä näkyy Signal Purity -merkintänä: ⚠ "cap-induced agreement". Merkintä erottaa milloin yksimielisyys on aitoa ja milloin se on syntynyt ankkurin pakotteesta.

Sampo on siis sekä tiivistymistä että vastaesimerkki sille että tiivistyminen on aitoa. 16 prosenttiyksikön pre-earnings -hajonta oli aitoa erimielisyyttä. Lopullinen kahden prosenttiyksikön spread on osin pakotettu. Aito post-earnings -konvergenssi olisi ollut jossain niiden välillä — mutta missä, tämä metodi ei näytä.

Yksi numero lisää. Tulosten jälkeen Sammon kurssi nousi 8,72 €:sta 8,95 €:oon kolmessa päivässä — kahden ja puolen prosentin nousu — kun mallit yksimielisesti odottivat 15 prosentin laskupotentiaalia. Konsensus oli sekä pakotettu että väärä suunta. Floor-ankkurin tuottama yksimielisyys ei suojannut markkinasta.

Suunta osui 6/18:ssa

Sampo ei ole ainoa. Kun mittaa toisen mittarin — oliko viiden mallin pre-earnings -konsensuksen suunta sama kuin osakkeen 1- ja 3-päivän reaktio — vastaus 18 yhtiön otoksella on:

1-päivän osumat: 6/18 = 33 %
3-päivän osumat: 6/17 = 35 %
Satunnaisen kolikonheiton odotusarvo: 50 %

Kummallakin aikajänteellä AI:n suunta osui alle satunnaisen. 18 yhtiön otos on tilastollisesti ohut — erotus 33 % ja 50 % välillä ei ole muodollisesti merkittävä — mutta kuvio toistuu yksittäistapauksissa: Apple −17 % AI bearish, kurssi +0,2 %; Nokia −28 %, +2,5 %; P&G −10 %, +3,7 %; Neste −27 %, +9,9 %; Sampo −8 %, +2,6 %. AI näki yhtiöt kalliina, markkina ei ollut samaa mieltä.

Hajottelu suunnan mukaan kärjistää kuviota: kun AI ennusti nousua (7 yhtiötä), kurssi nousi vain 1 kerran 7:stä. Bearish-puhelut osuivat 5/11:ssä — lähellä satunnaista. Mallien optimismi on tässä otoksessa systemaattisesti väärin osoittavaa.

Mistä tämä voi kertoa? Otoksella ei voi vielä erottaa kolmea hypoteesia: mallit eivät osaa lukea positiivisia tulossignaaleita, markkina hinnoittelee niitä valmiiksi tehokkaammin kuin negatiivisia, vai DCF-pohjaisessa metodissa on rakenteellinen ylioptimismi-bias kasvuyhtiöille. Heinäkuussa, kun kolmen kuukauden hintaliikkeet ovat tiedossa, näistä hypoteeseista voi alkaa valita.

Mitä tämä kertoo

Tuloskausi ei tiivistänyt yksimielisyyttä keskimäärin. Yksittäisistä yhtiöistä joillain spread tiivistyi (Elisa, Amazon), joillain laajeni (Microsoft, P&G, METSO), joillain pysyi paikallaan tai pysyi paikallaan vain koska katto piteli sitä.

Yksimielisyys ja tarkkuus eivät kuitenkaan ole sama asia. Viisi mallia voi olla yhdessä lähellä totuutta, yhdessä kaukana totuudesta, tai yhdessä saman pakotteen — analyytikkokaton tai default-oletuksen — vetämänä. Spread itsessään ei kerro kummalla puolen olemme. Se on välimittari, ei lopputulema.

Tarkkuuden mittaaminen vaatii toteutuneita hintoja: kuinka hyvin median-arvio osui kurssiin 1, 3 tai 6 kuukautta myöhemmin. Q1-raportoineiden yhtiöiden kolmen kuukauden hintaliikkeet ovat tiedossa heinäkuussa. Silloin pystymme rakentamaan toisen mittarin.

Kahneman, Sibony ja Sunstein dokumentoivat Noise-kirjassaan (2021), että ennustetutkimuksessa sekoitetaan usein kaksi eri ilmiötä: konsensuksen syntyminen ja tarkkuuden parantuminen. Ne voivat liikkua eri suuntiin. Median voi olla oikeassa vaikka yksittäiset mallit ovat eri mieltä — klassinen wisdom of crowds. Mallit voivat olla keskenään samaa mieltä ja keskiarvo systeemisesti väärässä — groupthink.

Q1 2026 ei kertonut kumpaa olemme. Se kertoi että viisi mallia lukee tulosraportit eri tavoin, ja eroavuus kestää yli tilinpäätösrajan.

Empiria on tässä vaiheessa ohut. 49 kaupankäyntipäivää, yksi tuloskausi takana, viisi mallia, 23 yhtiötä — observatorio mittaa, mutta ei ole vielä mitannut riittävästi sanoakseen mitä tapahtuu pidemmällä aikajänteellä. Tämän kvartaalin aineisto syöttää myös metodologian seuraavaa versiota. Esimerkiksi Sammossa nähty mekaaninen konsensus on osa sysäystä arvostusmoottorin tulevalle uudistukselle, ja se mitä mallien ankkurikäyttäytymisestä opitaan, muotoilee promptin myöhempiä revisioita. Empiria edeltää muutoksia, ei seuraa niitä.

Takaisin Sampoon

Avausskenessä — 6. toukokuuta, neljä mallia floor-arvolle — tapahtui kaksi asiaa rinnakkain. Tieto siirsi mallit yhteen suuntaan. Ankkuri pysäytti niiden liikkeen. Lopullinen yksimielisyys on osin todellinen, osin moottorin tuottama.

Kun pyydämme viittä tekoälyä lukemaan saman raportin ja antamaan saman tavoitehinnan, kysymyksen vastaus on usein "ei". Raportit ovat moniäänisiä, mallien koulutushistoria läpäisee promptin lukot, ja eri painotuksilla samasta aineistosta voi rationaalisesti johtaa eri lukuja. Kun mallit ovat samaa mieltä — kuten Elisalla — aineisto on yleensä yksinkertaista. Kun ne eroavat — kuten Metalla — eroavuus itse kantaa informaatiota: yhtiön arvostus on aidosti kiistanalainen.

Tilinpäätös ei poistanut riitaa, eikä mallien yhteinen suunta osunut markkinaan kolikonheittoa paremmin. Riita on signaali. Suunnan epävarmuus on toinen.

Tämä raportti perustuu 18 Q1 2026 -tulosraporttiin, viiteen LLM-malliin ja 49 kaupankäyntipäivän kertyneeseen aineistoon. Yksimielisyysanalyysi ei mittaa mallien tarkkuutta — sitä mittaria voimme rakentaa luotettavasti vasta heinäkuussa, kun Q1-raportoineiden yhtiöiden kolmen kuukauden hintaliikkeet ovat tiedossa.

AI Investor Barometer on kokeellinen tutkimustyökalu, ei sijoitusneuvontaa.