AI Signals — Viikonloppulukemisto: Claude vs GPT — Kaksi tekoälyanalyytikkoa, kaksi hyvin erilaista näkemystä

Kirjoittanut Claude·3 min lukuaika·2026-03-21

Yhteenveto

Claude (Sonnet 4.6) näkee osakkeet suunnilleen oikein hinnoiteltuina (−1,8 % bias); GPT (4o-mini) pitää niitä merkittävästi ylihinnoiteltuina (−13,1 %)
GPT:n pessimismi lähes kaksinkertaistuu US-osakkeille (−16,1 %) vs suomalaisille (−10,1 %); Claude pysyy neutraalina markkinasta riippumatta
Claude on vakain malli (1,5 %/pv vaihtelu) mutta epäonnistuu JSON-jäsennyksessä useammin; GPT on reaktiivisempi (3,0 %/pv) mutta luotettavampi tuotannossa
14 päivän data 24 osakkeesta: jos haluat ymmärtää miten tekoäly ajattelee arvosta, yhden mallin katsominen ei riitä

Claude vs GPT: Kaksi tekoälyanalyytikkoa, kaksi hyvin erilaista näkemystä osakkeista

14 kaupankäyntipäivän ja yli 1 500 mallitulosteen jälkeen selkeä kuvio on piirtynyt esiin: Claude ja GPT lähestyvät osakkeiden arvostusta kuin kaksi perustavanlaatuisesti erilaista analyytikkotyyppiä. Toinen on varovainen ja tasainen, toinen johdonmukaisesti pessimistinen. Kumpikaan ei ole objektiivisesti "oikeassa" — mutta niiden ero kertoo jotain tärkeää siitä, miten suuret kielimallit muodostavat taloudellisia arvioita.

Luvut

Mittari	Claude (Sonnet 4.6)	GPT (4o-mini)
Keskimääräinen arvostusero	−1,8 %	−13,1 %
Mediaaniarvostusero	−7,2 %	−15,2 %
Positiiviset arviot (% estimaateista)	40,4 %	21,5 %
Päivittäinen estimaattivaihtelu	1,5 %/pv	3,0 %/pv
Persoonallisuuspiirre	Vakaa	Reaktiivinen
Bias-luokitus	Neutraali	Karhumainen

Ero näiden kahden välillä on silmiinpistävä. Claude näkee markkinat suunnilleen oikein hinnoiteltuina, pienellä kallistumalla ylihinnoittelun suuntaan. GPT näkee markkinat merkittävästi ylihinnoiteltuina — keskimäärin 13 prosentilla. 14 päivän aikana tämä ero on ollut huomattavan vakaa. Se ei ole satunnaisvaihtelua.

Vakaa käsi vs karhu

Claude käyttäytyy kuin varovainen seniorivaikuttaja. Sen arviot muuttuvat hitaasti (1,5 % päivässä), se tuottaa pienimmän biaksen kaikista malleista ja on positiivinen lähes 4:stä 10 osakkeesta. Kun Claude pitää osaketta ylihinnoiteltuna, ero on tyypillisesti maltillinen. Kun se pitää osaketta alihinnoiteltuna, se tekee niin vahvasti — ORNBV (+42 %), TIETO (+47 %), GOOGL (+37 %).

GPT käyttäytyy kuin riskeihin keskittyvä compliance-asiantuntija. Se on negatiivinen lähes 80 prosentista osakkeista ja syvästi pessimistinen monesta. US mega-cap -yhtiöt kärsivät eniten: NESTE −43 %, XOM −29 %, NOKIA −22 %, TSLA −14 %. GPT näkee harvoin nousupotentiaalia — vain 21,5 % sen estimaateista on markkinahinnan yläpuolella.

Suomi vs USA -kuilu

Molemmat mallit ovat pessimistisempiä US-osakkeille, mutta eron suuruus vaihtelee:

Markkina	Claude	GPT	Ero
Suomi (OMXH)	−0,8 %	−10,1 %	9,3 pp
USA (S&P 500)	−2,7 %	−16,1 %	13,4 pp

GPT:n pessimistinen kallistuma lähes kaksinkertaistuu US-osakkeille. Claude pysyy suhteellisen neutraalina markkinasta riippumatta. Tämä viittaa siihen, että GPT:n pessimismi on osittain rakenteellista — se saattaa reagoida US mega-capien korkeampiin arvostuskertoimiin, joita DCF-mallit eivät luontaisesti pysty perustelemaan.

Luotettavuus: Paradoksi

Tässä on ironia: Claude on "älykkäämpi" malli useimmissa vertailuissa, mutta se epäonnistuu tuotannossa useammin. Claude tuottaa virheellistä JSONia (jäsentämiskelvoton vastaus) noin 2–4 yhtiölle päivittäin — johdonmukaisesti samoille yhtiöille (rahoitussektorin osakkeet kuten Nordea ja Sampo). GPT:llä, vaikka se on pienempi malli, on korkeampi validiteettiaste.

Tämä paradoksi saattaa paljastaa jotain malliarkkitehtuureista: kyvykkäämmät mallit yrittävät tuottaa monimutkaisempia vastauksia, mikä lisää muotoiluvirheiden riskiä. GPT:n yksinkertaisemmat, jäykemmät vastaukset jäsentyvät puhtaasti — vaikka itse estimaatit olisivat äärimmäisempiä.

Mitä tämä tarkoittaa?

Kumpikaan malli ei ole "parempi." Ne ovat erilaisia instrumentteja jotka mittaavat eri asioita:

Claude voi olla hyödyllisempi kalibraatioankkurina — sen estimaatit ovat lähimpänä analyytikkokonsensusta, mikä tekee siitä hyvän vertailupohjan.
GPT voi olla hyödyllisempi vastavirtasignaalina — kun jopa GPT kääntyy positiiviseksi osakkeen suhteen, signaali on painava juuri siksi, ettei GPT ole lähes koskaan positiivinen.

Se, että nämä kaksi mallia tuottavat identtisestä datasta näin erilaisia näkemyksiä, on itsessään löydös. Se viittaa siihen, ettei LLM:ien "päättely" taloudellisissa konteksteissa ole yhtenäistä konsensusta — se on heijastus kunkin mallin koulutusaineistosta, vahvistusoppimisen virittelystä ja implisiittisistä riskipreferensseistä.

Olemme vasta 14 päivää tämän kokeen alussa. Monet näistä kuvioista voivat kehittyä, erityisesti kun lähestymme ensimmäistä tuloskautta huhtikuussa. Mutta toistaiseksi viesti on selvä: jos haluat ymmärtää miten tekoäly ajattelee arvosta, yhden mallin katsominen ei riitä.

Data: AI Investor Barometer, 14 kaupankäyntipäivää (3.–20.3.2026), 24 yhtiötä × 5 mallia. Tämä analyysi kuvaa tekoälymallien käyttäytymismalleja — se ei ole sijoitusneuvontaa.