AI Signals — Viikonloppulukemisto: Kuinka usein ja kuinka paljon tekoälymallit muuttavat mieltään osakkeista?
- Claude ja Grok vakaimmat: kattamattomat arviot muuttumattomia 63–64 % päivistä. GPT:llä yli 10 % päiväliikkeitä kerran viikossa
- META jokaisen mallin ongelmalapsi — GPT:n ajallinen σ on 35,2 %, yli kaksinkertainen mihin tahansa muuhun osakkeeseen. NVDA:n CAGR-oletushaarukka 9–55 %
- Teknologiasektori 3× volatiilimpi kuin terveydenhuolto DCF-termein — mallin rakenteellinen ominaisuus, ei laatuongelma
- DeepSeek ei ole ylittänyt nollabiaista kertaakaan 29 päivässä. Koulutusdatan pessimismi, ankkurointi vai oikea markkinanäkemys? Emme tiedä vielä
- Temperature-muutos 1,0→0,4 siirsi GPT:n mediaanibiasin -23 %:sta lähelle neutraalia yhdessä yössä — yksi ensimmäisistä empiirisistä havainnoista temperature–sentimenttisuhteesta taloudellisissa LLM:eissä
Weekend Read #5 — 12. huhtikuuta 2026
Sijoittaja haluaa analyytikoilta johdonmukaisuutta. Jos analyytikko sanoo maanantaina osakkeen olevan 15 % aliarvostettu ja perjantaina enää 2 %, luottamus horjuu — vaikka perjantain luku olisi oikeampi. Sama pätee tekoälyyn.
Olemme pyörittäneet viittä tekoälymallia 29 kaupankäyntipäivän ajan. 3 335 arvonmääritystä, 24 osaketta, joka ikinen arkipäivä. Nyt on ensimmäistä kertaa tarpeeksi dataa kysyä: kuinka vakaita nämä arviot oikeasti ovat?
Tätä artikkelia varten analysoimme kattamattomia valuaatioita — raakoja tavoitehintoja ennen kuin arvostusmoottori soveltaa turvarajojaan. Näin pääsemme kiinni siihen mitä mallit oikeasti ajattelevat.
---
Yksi luku kertoo kaiken
Mittasimme jokaiselle mallille ajallisen keskihajonnan: kuinka paljon sen arvio samasta osakkeesta vaihtelee päivästä toiseen.
| Malli | Mediaani-σ | Päivien med. muutos | Nollapäiviä* | >10 % päiviä |
|---|---|---|---|---|
| Grok | 2,6 % | 0,00 % | 99/158 (63 %) | 1 |
| Claude | 2,7 % | 0,00 % | 118/183 (64 %) | 0 |
| DeepSeek | 4,3 % | 2,54 % | 34/146 (23 %) | 2 |
| GPT | 5,1 % | 0,34 % | 76/173 (44 %) | 18 |
| Gemini | 5,2 % | 1,51 % | 49/144 (34 %) | 12 |
\Nollapäiviä = päiviä jolloin kattamaton arvio ei muuttunut lainkaan. Mediaani-σ v7-kaudelta (25.3. alkaen).*
Grok ja Claude eivät muuta arviotaan useampana päivänä kuin muuttavat — yli puolina päivistä identtinen tulos. GPT:llä ja Geminillä isoja (>10 %) liikkeitä sattuu kerran viikossa tai useammin.
Mitä mallien sisällä oikeasti tapahtuu?
Vaihtelun ymmärtämiseksi pitää katsoa syvemmälle: mitkä oletukset muuttuvat ja kuinka paljon?
Jokainen malli tuottaa kolme keskeistä arvostusparametria: liikevaihdon 5-vuotisen kasvuennusteen (CAGR), tavoitemarginaalin (EBIT-%) ja pääomakustannuksen (WACC). Nämä syötetään deterministiseen DCF-moottoriin — mallit eivät anna tavoitehintoja suoraan.
Esimerkki: kaksi ääripäätä.
Elisan kohdalla viisi mallia antaa CAGR-arvion välillä 1,6–3,0 % (vaihteluväli 1,4 prosenttiyksikköä), marginaalin välillä 20–25 % ja WACCin välillä 6,5–7,0 %. Oletusavaruus on ahdas. Tavoitehinta ei voi liikkua paljon.
Metan kohdalla CAGR vaihtelee 12–23 % (11 prosenttiyksikköä), marginaali 38–45 % ja WACC 9,5–11,5 %. Oletusavaruus on valtava — ja sen sisällä mallit oskilloivat päivästä toiseen.
Suurimmat oletushaarukat koko universumissa (v7-kausi):
| Osake | CAGR-haarukka | Marginaalihaarukka | Mitä tämä tarkoittaa |
|---|---|---|---|
| NVDA | 9–55 % (46 pp) | 46–65 % (19 pp) | Tekoälybuumi vai ylikapasiteetti? |
| TIETO | -14–5 % (19 pp) | 9–12 % (4 pp) | Kasvaako vai kutistuuko? |
| META | 12–23 % (11 pp) | 38–45 % (7 pp) | AI-investointien takaisinmaksu? |
| TSLA | 4–14 % (11 pp) | 7–18 % (11 pp) | Auto vai teknologiayhtiö? |
| NOKIA | 1–5 % (4 pp) | 4–14 % (10 pp) | Marginaalit täysi arvoitus |
NVDA:n 46 prosenttiyksikön CAGR-haarukka on poikkeuksellinen. Se heijastaa kahta toisensa poissulkevaa näkemystä: toisessa datakeskusten GPU-kysyntä jatkaa eksponentiaalista kasvua, toisessa nykyinen kysyntäpiikki normalisoituu ja kilpailu syö marginaalit. DCF-mallissa näiden ero tarkoittaa satoja prosentteja tavoitehinnassa. Sijoittajan kannalta tämä kertoo, ettei yksikään malli — ihminen tai kone — pysty luotettavasti hinnoittelemaan NVDA:ta nykyisessä markkinatilanteessa.
Meta on jokaisen mallin ongelmalapsi
Yksittäisistä osakkeista META erottuu kaukaa.
GPT:n Metan tavoitehinta heiluu 35,2 % keskihajonnalla — yli kaksi kertaa enemmän kuin mikään muu osake millään mallilla. Gemini: 14,2 %. DeepSeek: 10,5 %. Claudekin, joka on muuten vakaa, heiluu Metassa 6,6 %. Ei yksikään malli saa pidettyä näkemystään vakaana.
Absoluuttisina lukuina: GPT:n Metan keskimääräinen tavoitehinta on $932, mutta keskihajonta on $182 — arvio liikkuu tyypillisesti yli 400 dollarin vaihteluvälillä. Claudella vastaavasti $817 ± $16 — kymmenkertainen ero vakaudessa.
Miksi nimenomaan Meta? DCF-mallin dynamiikka. Metan arvo riippuu lähes kokonaan siitä, miten nopeasti liikevaihto kasvaa ja miten paljon AI-infrastruktuuripanostukset syövät marginaaleja. Pienikin kasvuoletuksen muutos vyöryy kohti lopputulosta, koska terminaaliarvo dominoi. Ja mallit oskilloivat — sama data, eri painotus.
GOOGL (20,0 % GPT, 10,8 % DeepSeek, 7,5 % Claude) ja MSFT (12,0 % GPT, 9,6 % Gemini) kärsivät samasta ilmiöstä lievempänä. Kaikki mega-cap tech -yhtiöitä joiden arvo nojaa kauas tulevaisuuteen.
Sektorien vaikeus: teknologia oma luokkansa
Sektoritasolla kuva on selkeä:
| Sektori | Keskimääräinen σ | Osakkeet |
|---|---|---|
| Teknologia | 9,6 % | META, GOOGL, MSFT, NOKIA, TIETO, AAPL, NVDA, TSLA |
| Energia | 4,8 % | NESTE, XOM |
| Perusteollisuus | 4,1 % | UPM |
| Teollisuus | 3,4 % | METSO, KNEBV, WRT1V |
| Rahoitus | 3,3 % | SAMPO, NDA1V, BRK-B, JPM |
| Telecom | 3,0 % | ELISA |
| Kulutus | 2,7 % | AMZN, PG |
| Terveydenhuolto | 2,3 % | JNJ, ORNBV |
Teknologiasektori on lähes kolme kertaa volatiilimpi kuin terveydenhuolto. Tämä ei johdu siitä, että mallit olisivat huonoja teknologian kanssa — se johtuu siitä, että DCF-mallin rakenne vahvistaa epävarmuutta pitkän keston kasvuosakkeissa. Marginaalimuutos JNJ:ssä (25,5–33 %) on suhteellisesti pienempi ja painaa vähemmän kuin Metan (38–45 %), koska JNJ:n kasvu on hitaampaa ja terminaaliarvo hallitsee vähemmän.
Neste ja Nokia: suomalaiset haasteet
Suomalaisista osakkeista nousevat esiin kaksi nimeä.
Neste tuottaa korkeaa vaihtelua DeepSeekille (5,6 %) ja GPT:lle (4,1 %) — v7-kaudella matalampaa kuin aiemmalla moottoriversiolla, mutta silti selvästi vakaita osakkeita korkeampaa. Jalostusmarginaalit riippuvat raakaöljyn hinnasta, uusiutuvan dieselin kysynnästä ja päästöoikeuksien hinnasta — asioista joita malli ei näe tilinpäätösluvuista. Se näkee eilisen tuloksen mutta ei huomisen öljyn hintaa. Mallien CAGR-haarukka on kapea (1,5–4 %), mutta marginaalihaarukka iso (6–12 %) — juuri se parametri jota markkina ajaa.
Nokia on GPT:n (10,2 %) ja Grokin (7,0 %) epävakain suomalainen osake. Marginaalihaarukka on universumimme suurimpia: 4–14 %. Televerkkolaitteiden markkina on syklinen, 5G-investoinnit hidastuvat ja 6G on vielä tulevaisuutta. Mallit eivät tiedä milloin operaattorit avaavat lompakon — ja se näkyy suoraan numeron heiluntana.
Elisa, KONE ja tylsyyden arvo
Tylsin löydös on ehkä kiinnostavin.
Elisa on vakain osake kaikilla viidellä mallilla: mediaani-σ vain 1,4 %. Clauden, Grokin ja DeepSeekin Elisa-arvio muuttuu niin harvoin, että σ on 1,3–1,4 % — identtiset oletukset päivästä toiseen.
KONE (mediaani-σ 1,9 %), Berkshire Hathaway (0,9 %) ja JNJ (2,1 %) ovat lähes yhtä vakaita. Yhdistävä tekijä: kapea oletusavaruus. KONEn CAGR vaihtelee 2–5 %, marginaali 12,5–14 %. Mallilla ei ole tilaa heilua.
Tämä on itsessään informatiivista. Vakaus ei tarkoita, että arvio on oikein. Se tarkoittaa, etteivät mallit näe epävarmuutta. Metan kohdalla ne näkevät paljon epävarmuutta. Elisan kohdalla eivät. Molemmat ovat hyödyllistä tietoa.
DeepSeek — malli joka ei koskaan vaihda mieltään
Kaikista viidestä mallista DeepSeek on erikoistapaus.
Neljä mallia ovat kuukauden aikana konvergoineet kohti neutraalia — niiden kokonaisnäkemys on lähellä nykyhintoja. DeepSeek ei ole. Se ei ole ylittänyt nollaa yhtenäkään 29 päivästä. Se näkee osakkeet jatkuvasti 7–10 % yliarvostettuina.
Tämä on erityisen silmiinpistävää, koska DeepSeekin arvioista 44 % osuu moottorin turvarajoihin — mikä vetää arvioita kohti nykyhintoja. Raaka näkemys on todennäköisesti vielä karhumaisempi.
Kolme tulkintaa on mahdollista. Ensimmäinen: DeepSeek on oikeassa ja markkinat ovat yliarvostettuja. Toinen: neljä muuta mallia ankkuroituvat nykyhintoihin ja tuottavat siksi neutraalimpia arvioita. Kolmas: DeepSeekin koulutusdatassa pessimistiset näkemykset ovat yliedustettuina. Talouskirjallisuudessa ja analyytikoiden kommenteissa varovainen sävy on tyypillisempi kuin optimistinen — "riski" esiintyy useammin kuin "mahdollisuus". Jos malli on imenyt tämän vinoutuman, se heijastuu systemaattisesti negatiivisina oletuksina. Emme tiedä mikä tulkinta pitää paikkansa — vielä.
Temperature-kokeilu: yksi parametrimuutos, dramaattinen vaikutus
Maaliskuun 17. päivänä vaihdoimme kaikkien mallien temperature-asetuksen (satunnaisuusparametri) arvosta 1,0 arvoon 0,4.
GPT:n mediaanibias hyppäsi yhdessä yössä -23 %:sta -10 %:iin — ja jatkoi nousua kohti neutraalia. Sama malli, samat osakkeet, sama kysymys. Ainoa muutos oli se, kuinka "luovasti" mallia pyydettiin vastaamaan.
Korkeampi temperature ei tuottanut "parempia" tai "monipuolisempia" näkemyksiä — se tuotti systemaattisesti pessimistisempiä. Tämä voi olla yksi ensimmäisistä empiirisistä havainnoista temperature-efektistä LLM:ien taloudellisessa päättelyssä.
Metodologinen huomautus: kattojen vaikutus
Arvonmääritysmoottorimme soveltaa turvarajoja: analyytikkojen tavoitehintakattoja (±50 % FI, ±40 % US mega-cap), PE-kattoja ja terminaaliarvokattoja. Nämä koskevat 35–44 % valuaatioista mallin mukaan.
Tämän artikkelin analyysit käyttävät kattamattomia valuaatioita aina kun mahdollista. Sektoritilastot, osakekohtaiset keskihajonnat ja oletushaarukat ovat kaikki pre-cap-datasta. Päivittäiset kokonaisbias-luvut (DeepSeek-osio) käyttävät lopullisia lukuja — niissä katot vaimentavat äärimmäisiä näkemyksiä. Mallien keskinäinen järjestys pätee silti.
Mitä tästä seuraa?
Kolme johtopäätöstä:
1. Konsensus on luotettavampi kuin yksittäinen malli. Viiden mallin mediaani tasoittaa päivittäistä kohinaa. Yksittäisen mallin yksittäisen päivän arvio ei kannata ottaa liian vakavasti — varsinkaan GPT:n.
2. Vaihtelun aste kertoo osakkeesta itsestään. Kun kaikki viisi mallia heiluvat, taustalla on aito epävarmuus — arvostus riippuu oletuksista joista on vaikea olla varma. Kun ne pysyvät paikallaan, oletusavaruus on kapea. Hajonnan aste on itsessään informaatiota.
3. Sijoittajan kannattaa lukea hajontalukuja yhdessä arvion kanssa. Jos osakkeen konsensus on -15 % mutta hajonnan mediaani-σ on 3 % (kuten KONE), arvio on stabiili — mallit ovat päätyneet samaan johtopäätökseen toistuvasti. Jos konsensus on +30 % mutta σ on 25 % (kuten META), arvio on pikemminkin heitto kuin analyysi. Käytännössä: kun hajontaluku on matala, konsensusta voi käyttää vertailupisteenä. Kun se on korkea, konsensus kertoo enemmän epävarmuudesta kuin suunnasta.
Lähestymme 30 kaupankäyntipäivää — riittävästi mallikohtaisen kalibroinnin aktivoimiseen. Pian johdonmukaisemmat mallit saavat suuremman painon konsensuksessa. Mutta onko johdonmukaisuus oikeasti sama asia kuin tarkkuus? Se on seuraavan artikkelin kysymys — ja vastaus ei ole itsestään selvä.
---
AI Investor Barometer seuraa päivittäin miten 5 tekoälymallia muodostavat osakkeiden arvostusarvioita — ja missä ne eroavat toisistaan. Tämä on kokeellinen tutkimustyökalu, ei sijoitusneuvontaa.