AI Signals — Viikoittainen mallikäyttäytymisen yhteenveto

Miten viiden AI-mallin arviot ja bias-taipumukset muuttuvat — viikoittainen yhteenveto.

AI Signals — Viikonloppulukemisto: Kuukausi dataa — mitä 2 760 tekoälyarvostusta opetti meille

2026-04-04pääkirjoitus · kirjoittanut Claude
Yhteenveto
  • 24 kaupankäyntipäivän ja 2 760 arvion jälkeen emme voi erottaa metodologian vaikutuksia mallien aidosta käyttäytymisestä — jokainen moottori- tai promptimuutos liikutti lukuja
  • Viisi erilaista mallipersoonallisuutta: Claude ainoa optimisti (+1,0 %), GPT paras suuntatarkkuus (52,7 %) mutta suurin vaihtelu, DeepSeek 100 % luotettava 1/15 hinnalla
  • XOM putosi 31 % päivässä kun kaikki mallit reagoivat Iranin de-eskalaatiosignaaleihin — samaan aikaan 9 suurta pankkia nosti tavoitehintojaan. DCF vahvistaa lyhyen aikavälin sentimenttiä syklisille osakkeille
  • Suuntatarkkuus 47-53 % yhden päivän horisontilla — tilastollisesti kolikonheittoa. Todellinen testi alkaa 3 kuukauden (heinäkuu) ja 12 kuukauden (maaliskuu 2027) kohdalla
  • Mallikohtainen kalibrointi tulossa huhtikuun lopussa kun 30 päivää v7-dataa on kertynyt

Kuukausi dataa — mitä 2 760 tekoälyarvostusta opetti meille

Kuukauden ajan viisi tekoälymallia on arvostanut 24 osaketta jokaisena kaupankäyntipäivänä. Se on 2 760 arviota, 24 kaupankäyntipäivää ja noin 50 dollaria API-kustannuksia. Tässä mitä opimme — ja mitä emme.

Kokonaiskuva: kaikki mallit ovat varovaisia, ja tilanne syveni

Maaliskuun alussa AI-mallien yhteenlaskettu arvostuskuilu oli noin -15 % — mallit arvostivat osakkeet keskimäärin 15 % markkinahintoja alemmas. Seuraavien kahden viikon aikana kuilu kaventui tasaisesti noin -6 prosenttiin. Luulimme havainneemme lähentymistä markkinahintoihin.

Sitten suunta kääntyi. Kuilu leveni takaisin -12 prosenttiin. Parannus ei johtunut mallien viisastumisesta — kyse oli yhdistelmästä omia metodologiamuutoksiamme (Engine v7, Bayesian-kutistus, lämpötilan yhtenäistäminen) ja markkinan omaa laskua. Kun markkina tasaantui, taustalla ollut varovainen vinouma nousi jälleen esiin.

Tämä on rehellisen kuukauden tärkein opetus: emme voi erottaa metodologiamme vaikutuksia mallien aidosta käyttäytymisestä. Joka kerta kun muutimme jotain moottorissa, promptissa tai lämpötilassa, se liikutti lukuja.

Viisi mallia, viisi persoonallisuutta — mutta ovatko ne aitoja?

Claude on optimisti. Se on ainoa malli, jonka keskimääräinen vinouma on positiivinen (+1,0 %) — se näkee osakkeet hieman alihinnoiteltuina. Se on myös johdonmukaisin: arviot muuttuvat vain 1,3 % päivien välillä.

GPT on vastavirtaan kulkija. Sillä on paras suuntatarkkuus (52,7 %) mutta myös suurin päivittäinen vaihtelu (3,9 %). Kun muutimme lämpötilan 1,0:sta 0,4:ään, se kääntyi pessimistisimmästä optimistisimmaksi ennen tasaantumista. GPT näyttää olevan herkin parametrimuutoksille.

DeepSeek on työjuhta. 100 % validi JSON-tuotos 529 ajosta — ei yhtään jäsennysvirhettä. Se maksaa 1,10 $/kk Clauden 17,20 $/kk rinnalla.

Gemini tuottaa laajimman vaihteluvälin kasvuoletuksissa ja matalimman suuntatarkkuuden (47,0 %).

Grok on nopein (7,3 s) mutta sen raaka-arviot osuvat turvarajoihin 46 % ajasta — useammin kuin millään muulla mallilla.

Epämukava kysymys: kiristimme promptia sektorikohtaisilla haarukoilla, laskimme lämpötilan 0,4:ään ja otimme käyttöön Bayesian-kutistuksen. Mallien välinen hajonta on kaventunut 11 prosenttiyksiköstä 3-5:een. Missä vaiheessa mittaamme omia rajoitteitamme eikä mallien todellisia eroja?

XOM-tapaus: kun geopolitiikka kohtaa DCF:n

2. huhtikuuta ExxonMobilin AI-konsensusarvio putosi 118 dollarista 82 dollariin yhdessä päivässä — 31 prosentin lasku ja suurin yksittäisen osakkeen liike seurantamme aikana. Kaikki viisi mallia laskivat samanaikaisesti kasvuodotuksiaan ~4 prosentista 1-3 prosenttiin ja laskivat marginaalitavoitteita 14 prosentista 11-12 prosenttiin.

Taustalla oli todellinen markkinatapahtuma: 1. huhtikuuta XOM:n osake laski 5,7 % — suurin päiväpudotus vuoteen — kun presidentti Trump vihjasi Iranin konfliktin mahdollisesta päättymisestä. Öljymarkkinat ovat olleet myllerryksessä Hormuzinsalmen sulun jälkeen, ja jokainen merkki de-eskalaatiosta laukaisee jyrkän käännöksen energiaosakkeissa. CNN kuvaili tilannetta termillä "whiplash" — markkinat heiluvat jokaisella uudella Iran-uutisella.

AI-mallimme poimivat tämän signaalin päivittyneen Yahoo Finance -datan kautta — analyytikkojen tarkistukset, hintaliikkeet ja raaka-ainesignaalit — ja kaikki viisi päätyivät itsenäisesti samaan varovaiseen johtopäätökseen samana päivänä. Yksimielisyys on huomionarvoista: viisi erillistä API-kutsua, ei jaettua muistia, sama suunta.

Mutta mallit ylireagoivat. XOM:n P/E-luku on 23x, kun energiasektorin kattomme on 18x. DCF-malli tuottaa matalan raaka-arvion, ja P/E-katto painaa sitä vielä alemmas. Samaan aikaan yhdeksän suurta pankkia — Piper Sandler, Wells Fargo, Barclays, Citi ja muut — ovat itse asiassa nostaneet XOM:n tavoitehintojaan. Analyytikot näkevät pitkän aikavälin arvon monipuolisessa energiayhtiössä; DCF näkee syklisen osakkeen, joka noteerataan yli käyvän arvon.

XOM istuu nyt -49,3 prosentin kuilussa — mallit ajattelevat ExxonMobilin olevan puolet markkinahinnastaan. Se kertoo kolme asiaa: DCF:llä on rakenteellisia katvealueita syklisille raaka-aineosakkeille, AI-mallit vahvistavat lyhyen aikavälin sentimenttiä kun syöttödata muuttuu, ja kuilu AI:n ja analyytikkojen välillä voi itsessään olla signaali.

Mitä tarkkuus tarkoittaa (ja ei tarkoita) 24 päivän kohdalla

Suuntatarkkuutemme vaihtelee 47-53 prosentin välillä mallista riippuen. Tilastollisesti tämä ei erotu kolikonheitosta.

Mutta tämä mittari mittaa väärää asiaa. Mallit tuottavat 12 kuukauden DCF-arvostuksia — huomisen hintaliikkeen ennustamisen arviointi on kuin maratonjuoksijan arvioimista ensimmäisten sadan metrin perusteella. Todellinen tarkkuustesti alkaa 3 kuukauden kohdalla heinäkuussa ja tulee merkitseväksi 12 kuukauden kohdalla maaliskuussa 2027.

Lyhyen aikavälin data kertoo mallien käyttäytymisestä, ei ennustekyvystä. Clauden lähes nolla-vinouma (+1,0 %) tarkoittaa, että se on parhaiten kalibroitu nykyisiin markkinahintoihin. GPT:n ja DeepSeekin -5,1 prosentin vinouma tarkoittaa, että ne systemaattisesti aliarvioivat.

Missä tekoäly ja analyytikot eroavat

Erimielisyyskarttamme paljastaa kolme selkeää klusteria:

Konsensusalue (7 osaketta): BRK-B, ELISA, JNJ, KNEBV, NDA1V, NOKIA, WRT1V — pääosin suomalaisia defensiiviosakkeita. AI-mallit ovat samaa mieltä keskenään ja analyytikkojen kanssa.

AI yksimielinen, analyytikot eri mieltä (13 osaketta): useimmat US large cap -osakkeet. AI-mallit ovat sisäisesti johdonmukaisia mutta systemaattisesti eri mieltä analyytikkokonsensuksen kanssa. Tämä on DCF vs. momentum -kuilu.

Täysi epävarmuus (3 osaketta): NESTE, UPM ja nyt GOOGL. Sekä AI-mallit että analyytikot ovat eri mieltä. NESTE on ollut tässä kvadrantissa kolme viikkoa — kukaan ei tiedä miten arvostaa uusiutuviin polttoaineisiin siirtyvää öljynjalostajaa geopoliittisen energiakriisin keskellä.

Missä menimme pieleen

Lämpötilavaikutukset olivat odotettua suurempia. Muutos 1,0:sta 0,4:ään ei vain vähentänyt satunnaisuutta — se muutti suuntavinoumaa. Teimme tämän samaan aikaan promptimuutosten kanssa, joten emme voi erottaa syytä.

Osakeavaruus on liian pieni luotettaviin tilastoihin. 23 osaketta tarkoittaa, että yksi poikkeama (XOM) voi siirtää mediaania 6 prosenttiyksikköä päivässä.

DCF:llä on rakenteellisia katvealueita. Korkean P/E:n kasvuosakkeet (GOOGL +42,6 %) ja sykliset raaka-aineosakkeet (XOM -49,3 %) istuvat ääripäissä eivät AI:n näkemyksen vaan metodologian rajoitteiden vuoksi.

Mitä seuraavaksi

Mallikohtainen kalibrointi (huhtikuun loppu). 30 päivän datan jälkeen aktivoimme mallikohtaisen Bayesian-kutistuksen. Claude saa enemmän painoa kuin GPT tai DeepSeek.

Tulostesti (touko-kesäkuu). Q1/2026-tulokset alkavat tulla. Ensimmäinen todellinen testi: muuttavatko mallit oletuksiaan uuden talousdatan nähtyään?

3 kuukauden tarkkuustarkistus (heinäkuu). Ensimmäinen tilastollisesti mielekäs vertailu AI-arvioiden ja toteutuneiden hintaliikkeiden välillä — ja ensimmäinen mahdollisuus verrata AI-tarkkuutta analyytikkojen tarkkuuteen samoille osakkeille.

Kuukauden data on opettanut meille enemmän omasta metodologiastamme kuin tekoälyn kyvystä arvostaa osakkeita. Se ei ole epäonnistuminen — se on rehellinen lähtökohta sen ymmärtämiseen, mitä nämä mallit todella tekevät kun niitä pyydetään ajattelemaan taloudellista arvoa.

AI Signals — Viikko 14, Mar 30–Apr 03, 2026

2026-03-30 → 2026-04-03generoija: claude
Yhteenveto
  • Neljä viidestä mallista muuttui tällä viikolla aiempaa optimistisemmaksi, mutta 23 yhtiön konsensuksen keskimääräinen nousuvaraus ei juuri liikkunut — optimismi on keskittynyttä, ei laajapohjaista.
  • DeepSeek kääntyi lievästi positiivisesta paneelin ainoaksi karuksi, samalla kun kaikki muut mallit kasvoivat rakentavammiksi: harvinainen ja merkityksellinen eriytyminen.
  • ExxonMobilin konsensushintatavoite romahti 30 % yhden viikon aikana — jyrkin yksittäisen yhtiön revisio koko datasetin historiassa ja stressitesti, jonka kehikko ei selvinnyt kunnialla.
  • Geminin bullish-vinouma hyppäsi kolme prosenttiyksikköä viikossa, suurin yksittäisen mallin muutos koskaan, mutta sen terminaalikasvuoletus on lukittu täsmälleen 2,00 %:iin jokaiselle sen kattamalle yhtiölle.
  • DeepSeek hinnoittelee 115 arvostusta 0,26 dollarilla — seitsemäntoista kertaa halvemmalla kuin Claude tuotoksilla, jotka kertoivat tällä viikolla merkittävästi erilaisen tarinan.

AI Signals — Viikonloppulukemisto: Kun markkina liikkuu tekoälyn suuntaan

2026-03-28pääkirjoitus · kirjoittanut Claude
Yhteenveto
  • Tekoälymallien arvioiden ja markkinahintojen ero kapeni -13 %:sta -4 %:iin 20 kaupankäyntipäivässä
  • Kaksi samanaikaista tekijää: markkina laski (MSFT -15 %) JA metodologiamme parani (Engine v6→v7)
  • Näitä vaikutuksia ei voi erottaa toisistaan — kyse on havainnosta, ei todisteesta ennustekyvystä
  • Mallien persöönallisuusjärjestys muuttumaton 20 päivää: Claude vähiten bearish, GPT eniten
  • Todellinen testi edessä: Q1/2026-tuloskausi näyttää reagoivatko mallit uuteen talousdataan

AI Signals — Week 13, Mar 23–27, 2026

2026-03-23 → 2026-03-27generoija: claude
Yhteenveto
  • GPT teki vuoden dramaattisimman sentimenttimuutoksen, kääntyen -7,3 %:n karumielialasta +6,0 %:n härkämielialaan — 13,3 pisteen heilahdus, joka ylittää kaikkien muiden mallien liikkeet.
  • Teknologiasektorin mallien konsensus nousi 8,3 pisteellä tällä viikolla — suurin sektorikohtainen muutos datassa — vaikka osakkeet ovat edelleen pääosin mallien tavoitehintojen yläpuolella.
  • DeepSeekin hinta on vain 2,23 dollaria tuhatta arvostusta kohden, kun Clauden hinta on 39,25 dollaria — 17-kertainen hintaero, joka herättää kysymyksiä siitä, mitä lisähinnalla oikeastaan saa.
  • Nokia on viikon ainoa trendiyhtiö, jolla on kolme peräkkäistä nousupäivää 7,8 %:n tavoitehintahaarukassa — poikkeuksellisen tiukka vakaumus näin kiistanalaiselle osakkeelle.

AI Signals — Viikonloppulukemisto: Claude vs GPT — Kaksi tekoälyanalyytikkoa, kaksi hyvin erilaista näkemystä

2026-03-21pääkirjoitus · kirjoittanut Claude
Yhteenveto
  • Claude (Sonnet 4.6) näkee osakkeet suunnilleen oikein hinnoiteltuina (−1,8 % bias); GPT (4o-mini) pitää niitä merkittävästi ylihinnoiteltuina (−13,1 %)
  • GPT:n pessimismi lähes kaksinkertaistuu US-osakkeille (−16,1 %) vs suomalaisille (−10,1 %); Claude pysyy neutraalina markkinasta riippumatta
  • Claude on vakain malli (1,5 %/pv vaihtelu) mutta epäonnistuu JSON-jäsennyksessä useammin; GPT on reaktiivisempi (3,0 %/pv) mutta luotettavampi tuotannossa
  • 14 päivän data 24 osakkeesta: jos haluat ymmärtää miten tekoäly ajattelee arvosta, yhden mallin katsominen ei riitä

AI Signals — Week 12, Mar 16–20, 2026

2026-03-16 → 2026-03-20generoija: claude
Yhteenveto
  • Jokainen tekoälymalli kääntyi viikolla selvästi optimistisemmaksi — synkronoitu muutos, joka kertoo enemmän yhteisistä koulutusaineistoista kuin markkinafundamenteista.
  • GPT on edelleen pessimistisin malli -7,4 %:n keskimääräisellä tuottopotentiaalilla, mutta kirjasi silti suurimman viikkotason muutoksen kaikista malleista: +9,6 prosenttiyksikköä.
  • Neste on viikon karuin konsensusarvio: mallit hinnoittelevat osakkeen 16,66 euroon spothinnan ollessa 29,70 euroa, mikä tarkoittaa -44 %:n laskupotentiaalia — lukema, jota yksikään analyytikkotalo ei julkaisisi ilman varausta.
  • DeepSeek tuottaa täyden laadun 2,19 dollarin hinnalla tuhatta arvostusta kohden — noin 16 kertaa halvempaa kuin Claude — mikä tekee frontier-mallien välisestä kustannuserosta yhä vaikeammin perusteltavan.
  • Teknologia on ainoa sektori, jossa mallit näkevät aitoa nousuvaraa (+6,3 %), mutta sielläkin vakaumus on heikko; terveydenhuolto johtaa lukuina, mutta otoksessa on vain kaksi yhtiötä.

AI Signals — Week 11, Mar 09–13, 2026

2026-03-09 → 2026-03-13generoija: claude
Yhteenveto
  • Every model thinks the market is overvalued — average upside across all five models is negative, ranging from GPT's brutal -17% verdict to Claude's relatively sanguine -3%, a 14-percentage-point gap that tells you more about model personality than market reality.
  • DeepSeek delivers perfect parse reliability at 100% validity for a cost of $2.10 per thousand valuations — roughly 16x cheaper than Claude, which raises uncomfortable questions about what you're actually paying for.
  • Gemini's terminal growth rate is locked to a suspiciously tight band with a standard deviation of just 0.09%, suggesting the model has hardwired a near-constant assumption rather than reasoning from first principles on each company.
  • GPT is the only model to peg terminal growth at exactly 2.0% with zero standard deviation across 115 valuations — a statistical signature that is not analysis, it is a default setting masquerading as judgment.

AI Signals — Viikonloppulukemisto: Mitä viisi tekoälymallia opettivat meille osakkeiden arvonmäärityksestä

2026-03-07pääkirjoitus · kirjoittanut Claude
Yhteenveto
  • Alkudata 460 arvostuksesta 4 päivän ajalta: kaikki viisi LLM:ää kallistuvat varovaiseen suuntaan, poikkeama -2,8 %:sta -13,8 %:iin konsensukseen nähden
  • GPT tuottaa jokaiselle yhtiölle täsmälleen 2,0 % terminaalikasvun (σ=0,00) — promptin varaoletus omaksuttu lopullisena vastauksena, ei järjestelmän raja
  • Viisi keskitason tekoälymallia rinnakkain 45 $/kk — rajoitettu pelkkään tekstipäättelyyn ilman työkaluja tai selailua
  • Suomalaiset osakkeet näyttävät hyvin kalibroituilta (-3,3 %), USA:n suuryhtiöillä -12,7 % ero — hypoteeseja seurattavaksi datan kertyessä

AI Signals — Week 10, Mar 02–05, 2026

2026-03-02 → 2026-03-05generoija: claude
Yhteenveto
  • Every model called the market overvalued this week — the most bearish cross-model consensus since this platform launched, with average downsides ranging from -3% to -15% across all five models.
  • GPT's terminal growth rate is locked at exactly 2.00% with zero standard deviation across 63 valuations, a statistical impossibility in genuine analysis that exposes hard-coded assumptions.
  • DeepSeek delivers the only perfect validity score (100%) at a cost of $2.03 per thousand valuations — roughly 16x cheaper than Claude while expressing greater conviction with a 0.65 confidence average.
  • Tesla's consensus target price of $253 against a spot of $406 represents the widest absolute bearish call of the week, with zero dispersion across models — a rare moment of unanimous AI pessimism.
Tilaa sähköpostiuutisetIlmainen · Ei roskapostia · Peruuta milloin vain · Tietosuoja
Kokeellinen AI-mallien vertailutyökalu — ei sijoitusneuvontaa
Kaikki sisältö on tekoälymallien tuottamaa ja voi sisältää virheitä. Tämä on kokeellinen työkalu — ei sijoitusneuvontaa, -tutkimusta eikä -suositusta. Käyttöehdot · Tietosuoja