Question 1

Mikä on AI Investor Barometer?

Accepted Answer

Kokeellinen observatorio, joka seuraa miten 5 itsenäistä tekoälymallia (GPT, Claude, Gemini, DeepSeek, Grok) muodostavat osakkeiden arvostusoletuksia. Deterministinen arvostusmoottori laskee arviot näistä oletuksista. Sivusto visualisoi missä mallit ovat samaa mieltä, missä eri mieltä ja miten niiden näkemykset muuttuvat ajan yli. Tämä ei ole sijoitusneuvontapalvelu.

Question 2

Miksi käytätte DCF-mallia eikä P/E-vertailua?

Accepted Answer

DCF pakottaa jokaisen tekoälymallin ilmaisemaan eksplisiittisesti oletuksensa kasvusta, kannattavuudesta ja riskistä — sen sijaan että se vain valitsisi vertailukelpoisen kertoimen. Tämä tekee mallien välisistä eroista läpinäkyviä ja mitattavia. Forward P/E -kattoa käytetään turvarajana estämään äärimmäisiä arvostuksia.

Question 3

Miksi rahoitusyhtiöillä on eri malli?

Accepted Answer

Pankeille ja vakuutusyhtiöille (Sampo, Nordea, JPMorgan, Berkshire) velka on liiketoiminnan raaka-aine, ei rahoituserä. Perinteinen FCFF-DCF tuottaa näille systemaattisesti harhaanjohtavia tuloksia. Käytämme Excess Return on Equity -mallia, joka perustuu oman pääoman tuottoon suhteessa sen kustannukseen.

Question 4

Mikä on deterministinen laskuri ja miksi se on tärkeä?

Accepted Answer

Kaikki viisi tekoälymallia syöttävät oletuksensa täsmälleen samaan matemaattiseen kaavaan. Tämä tarkoittaa, että arvioiden erot johtuvat puhtaasti mallien erilaisista näkemyksistä — ei siitä, että yksi malli laskisi paremmin. Ilman tätä erottelua mallien vertailu olisi mahdotonta.

Question 5

Miten diskonttokorko (WACC) määräytyy?

Accepted Answer

WACC rakentuu markkina- ja sektorikohtaisista komponenteista. Riskitön korko on 3,0 % Suomessa ja 4,5 % USA:ssa. Osakeriskilisä on 4,5 % (Suomi) ja 5,0 % (USA). Tekoälymalli arvioi yhtiökohtaisen betakomponentin. Sektorikohtaiset WACC-haarukat ohjaavat malleja (esim. telecom 6,5–7,5 %, teknologia 9–11 %).

Question 6

Mitä tarkoittaa Bayesilainen kalibraatio (shrinkage)?

Accepted Answer

Lopullinen arvio on yhdistelmä: 70 % DCF-mallin tulosta ja 30 % analyytikkokonsensusta. Tämä 'kutistus' vähentää systemaattista harhaa, jota DCF-malleilla yleensä on (tyypillisesti liian pessimistinen). Kalibroimaton DCF-signaali säilytetään erikseen tekoälyindeksejä (ACDI, ADI) varten.

Question 7

Mitä 'Agreement score' tarkoittaa?

Accepted Answer

Se mittaa kuinka moni viidestä mallista on samaa mieltä suunnasta — onko osake mallin mielestä ali- vai ylihinnoiteltu. Arvo 1,00 tarkoittaa kaikkien mallien samansuuntaista arviota. Matala arvo (esim. 0,65) kertoo merkittävästä erimielisyydestä.

Question 8

Mikä on terminaalikasvu ja miten se määritetään?

Accepted Answer

Terminaalikasvu on oletettu pitkän aikavälin kasvuvauhti ennustejakson jälkeen. Sitä EI aseta tekoälymalli — se on deterministinen, perustuen markkina × sektori -karttaan (esim. suomalainen teknologia 2,0 %, amerikkalainen terveydenhuolto 2,5 %). Tämä estää LLM:iä arvaamasta epärealistisia pitkän aikavälin lukuja.

Question 9

Mitä ACDI (AI Valuation Gap) mittaa?

Accepted Answer

Mediaani arvostuseroa kaikkien tekoälymallien arvioiden ja markkinahintojen välillä koko osakkeistossa. Negatiivinen luku tarkoittaa, että mallit näkevät osakkeet keskimäärin ylihinnoiteltuina suhteessa laskettuihin arvoihin.

Question 10

Mitä ADI (Model Disagreement) mittaa?

Accepted Answer

Mallien keskinäistä erimielisyyttä — ei niiden suhdetta markkinahintaan. Korkea ADI voi viitata epävarmuuteen, mutta myös siihen, että jokin malli on erityisen aggressiivinen tai konservatiivinen kyseisenä päivänä.

Question 11

Mitä ANM (Sentiment Shift) mittaa?

Accepted Answer

Muutosta viiden kaupankäyntipäivän yli: ovatko mallit kokonaisuutena liikkuneet optimistisempaan vai pessimistisempään suuntaan. Se ei kuvaa absoluuttista tasoa vaan dynamiikkaa — tekoälymallien tunnelman muutosta.

Question 12

Miksi kaikilla malleilla on negatiivinen bias juuri nyt?

Accepted Answer

Tämä on yksi projektin mielenkiintoisimmista havainnoista. Mahdollisia syitä: DCF-mallit ovat herkkiä diskonttokorolle, ja korkeiden korkojen ympäristö painaa arvoja alas. Lisäksi mallien koulutusdata saattaa heijastaa historiallisesti matalampia arvostustasoja. Seuraamme biaksen kehitystä Bias Index -sivulla.

Question 13

Mitä 'Calibration score' tarkoittaa käytännössä?

Accepted Answer

Se mittaa kuinka lähelle analyytikkokonsensusta malli pääsee ilman ulkoisia korjauksia. Korkeampi pistemäärä ei tarkoita, että malli on oikeassa — konsensuskin voi olla väärässä. Se kertoo lähinnä, kuinka hyvin kalibroitunut malli on suhteessa markkinoiden yleiseen näkemykseen.

Question 14

Miksi GPT on systemaattisesti karhumaisin?

Accepted Answer

Emme tiedä täsmälleen — tämä on yksi projektin tutkimuskysymyksistä. Mahdollisia selityksiä: GPT saattaa painottaa riskejä konservatiivisemmin, tai sen koulutusdata heijastaa eri markkinasykliä. Systemaattinen bias on dokumentoitu ja näkyy Bias Index -historiassa.

Question 15

Onko Claude parempi koska sen bias on pienin?

Accepted Answer

Ei välttämättä. Matala bias suhteessa markkinahintaan voi tarkoittaa hyvää kalibrointia — tai se voi tarkoittaa, että malli on oppinut seuraamaan hintaa pikemmin kuin arvioimaan fundamentteja. Accuracy-sivu seuraa, mikä malli ennustaa suuntaa parhaiten ajan yli.

Question 16

Miksi arviot vaihtelevat päivästä toiseen vaikka fundamentit eivät muutu?

Accepted Answer

Tekoälymallit eivät ole deterministisiä — sama syöte voi tuottaa hieman erilaisen tulosteen eri ajokerroilla. Lisäksi pipeline hakee tuoreimman markkinadatan päivittäin, mikä voi vaikuttaa oletuksiin. 'Vakaa' vs 'Reaktiivinen' -luokittelu Model Traits -osiossa kuvaa tätä vaihtelua mallitasolla.

Question 17

Voivatko mallit oppia toisiltaan tai vaikuttaa toisiinsa?

Accepted Answer

Ei. Jokainen malli saa täsmälleen saman syötteen ja ajaa täysin itsenäisesti. Mallien välillä ei ole kommunikaatiota. Tulokset yhdistetään vasta laskennan jälkeen.

Question 18

Mitä tekoälymalliversioita käytetään?

Accepted Answer

Tällä hetkellä: GPT-4o-mini (OpenAI), Claude Sonnet 4.6 (Anthropic), Gemini 2.5 Flash (Google), DeepSeek Chat (DeepSeek) ja Grok-3 (xAI). Malliversioita päivitetään tarjoajien julkaistessa uusia versioita. Versiomuutokset dokumentoidaan Changelogissa.

Question 19

Miten promptit on rakennettu? Onko kyse zero-shot, few-shot vai RAG-lähestymistavasta?

Accepted Answer

Puhdas zero-shot -strukturoitu tuloste. Jokainen malli saa saman promptin joka sisältää: yhtiön taloustiedot (tuloslaskelma, tase, kassavirta Yahoo Financesta), tuoreimmat uutisotsikot (IR-syötteet + Yahoo News), analyytikkokonsensuksen tavoitehinnan, sektorikohtaiset ohjeet (marginaalihaarukat, kasvuodotukset, WACC-konteksti — 10 sektoriprofiilia) ja ohjeet tuottaa 3 arvostusparametria (liikevaihdon CAGR, EBIT-marginaalitavoite, WACC). Lämpötila on 0.4 kaikille malleille. Ei few-shot-esimerkkejä, ei tiedonhakua (RAG). Prompti ei sisällä aiempia mallituloksia tai historiallisia tekoälyarvioita.

Question 20

Mitä konepellin alla tapahtuu päivittäin?

Accepted Answer

Joka arkipäivä klo 06:00 automaattinen pipeline: (1) hakee tuoreen talousdatan Yahoo Financesta kaikille seuratuille yhtiöille — tuloslaskelma, tase, analyytikkokonsensus ja uutisotsikot; (2) lähettää saman datan kaikille 5 tekoälymallille rinnakkaisesti, kukin tuottaa arvostusparametrit (kasvu, marginaali, WACC); (3) ajaa deterministisen DCF-moottorin joka laskee tavoitehinnat; (4) aggregoi konsensuksen, erimielisyyden ja markkinaindeksit; (5) tarkistaa hälytykset ja generoi viikkoraportin. Koko metodologia on dokumentoitu Metodologia-sivulla.

Question 21

Kuinka tuoretta data on?

Accepted Answer

Pipeline ajetaan automaattisesti arkipäivisin (ma–pe). Spot-hinnat ja markkina-data tulevat edellisen kaupankäyntipäivän päätöskursseista. Analyytikkokonsensus voi päivittyä viiveellä lähteestä riippuen. Viikonloppuisin ja pyhäpäivisin sivusto näyttää viimeisimmän saatavilla olevan datan.

Question 22

Kuinka luotettavia mallien arviot ovat?

Accepted Answer

Arviot ovat kokeellisia eikä niitä tule käyttää sijoitusneuvontana. Alkuvaiheessa kaikilla 5 mallilla on systemaattinen negatiivinen vinouma (aliarvostus suhteessa markkinahintoihin). Mallien validiteetti on noin 100% (kaikki tuottavat tuloksen päivittäin). Suuntatarkkuus — ennustaako malli oikein nouseeko vai laskeeko osake — vaatii merkittävästi enemmän dataa luotettavaan arviointiin. Varhaisen vaiheen tarkkuusmetriikat löytyvät Tarkkuus-sivulta. Tärkein arvo ei ole yksittäisissä arvioissa vaan siinä, miten eri mallit muodostavat näkemyksiä ja missä ne eroavat.

Question 23

Miksi joillakin yhtiöillä on vähemmän kuin 5 mallia?

Accepted Answer

Osa malleista saattaa palauttaa virheellisen tai jäsennyskelvoittoman vastauksen tietylle yhtiölle tiettynä päivänä — esimerkiksi jos malli kieltäytyy arvioimasta tai tuottaa luvun joka ei läpäise validointia. Tällaiset tulokset hylätään automaattisesti. Invalidi malli palautuu spot-hintaan eikä vaikuta konsensukseen.

Question 24

Miksei mukana ole enemmän yhtiöitä?

Accepted Answer

Universumi on tarkoituksella rajattu: 12 suomalaista OMXH-yhtiötä ja 12 amerikkalaista S&P 500 -yhtiötä. Projekti on kehitysvaiheessa, ja pienemmällä universumilla rakentaminen, konfigurointi ja laadunvarmistus ovat helpompaa ja edullisempaa. Jokainen yhtiö vaatii sektorikohtaisen konfiguraation ja validoinnin. Laajentaminen on suunnitteilla metodologian kypsyessä.

Question 25

Miksi joidenkin yhtiöiden gap on todella suuri (+40 % tai -44 %)?

Accepted Answer

Suurilla eroilla on yleensä rakenteellinen selitys. Esimerkiksi DCF-mallit aliarvioivat tyypillisesti korkean P/E:n kasvuyhtiöitä (kuten US mega-cap -teknologiayhtiöt) ja saattavat yliarvostaa defensiivisiä yhtiöitä vakailla kassavirroilla. Sektorikohtaisia prompt-ohjeita ja moottorin kalibrointia kehitetään näiden ääriarvojen vähentämiseksi.

Question 26

Mitä värikoodatut pallot mallien nimien vieressä tarkoittavat?

Accepted Answer

Jokaisella tekoälymallilla on tunnusväri johdonmukaista tunnistamista varten kaikissa kaavioissa ja taulukoissa. GPT on syaani, Claude oranssi, Gemini violetti, DeepSeek vihreä ja Grok keltainen. Samoja värejä käytetään Model Spread -kaaviossa, Bias Indexissä ja mallisivuilla.

Question 27

Mitä σ (sigma/dispersio) tarkoittaa?

Accepted Answer

Sigma (σ) mittaa kuinka hajallaan mallien arviot ovat suhteessa niiden mediaaniin. Matala sigma tarkoittaa mallien olevan lähellä toisiaan. Korkea sigma tarkoittaa laajaa erimielisyyttä. Se lasketaan kvartiilivälillä jaettuna mediaanilla.

Question 28

Onko data ilmaista käyttää?

Accepted Answer

Sivusto on vapaasti käytettävissä. Data on tekoälymallien tuottamaa eikä sitä tule käsitellä taloustutkimuksena. Jos haluat viitata dataan akateemisessa tai journalistisessa työssä, mainitse lähteeksi 'AI Investor Barometer (aiinvestorbarometer.com)'. Julkinen API on harkinnassa.

Question 29

Voiko tätä käyttää sijoituspäätösten tukena?

Accepted Answer

Työkalu on suunniteltu tekoälymallien vertailuun ja systemaattisten kuvioiden havainnointiin — ei osto- tai myyntisuositusten antamiseen. Jos käytät dataa omassa analyysissa, huomioi että datahistoria on lyhyt ja mallit voivat olla systemaattisesti väärässä. Katso käyttöehdot lisätiedoista.

Question 30

Onko tämä MiFID II:n alaista sijoitustutkimusta?

Accepted Answer

Ei. Työkalu ei täytä säännellyn sijoitustutkimuksen määritelmää: se ei anna suosituksia, se ei ota kantaa osto- tai myyntipäätöksiin, eikä se ole suunnattu yksittäisten sijoituspäätösten tekemiseen. Se on vertailutyökalu tekoälymallien käyttäytymisen analysointiin.

Question 31

Miten palvelu kehittyy?

Accepted Answer

AI Investor Barometria kehitetään asteittain datan kertyessä. Arvostusmoottoria, prompteja ja mallien kalibrointia parannetaan tuotantodatasta tehtyjen havaintojen perusteella. Viimeaikaisiin edistysaskeliin kuuluvat Engine v8:n analyytikkocap-uudistus (leveä sanity-kaista korvasi portaittaiset rajat, jotta mallien aito erimielisyys pysyy näkyvissä) ja Prompt v11:n eksplisiittinen WACC-metodijärjestys. Kehityksen etenemistä voi seurata Changelog-sivulta. Pysyäksesi ajan tasalla uusista ominaisuuksista ja löydöksistä, liity sähköpostitilaajaksi — lähetämme viikoittaisen AI Signals -raportin ja tiedotamme merkittävistä muutoksista.

Question 32

Miksi kaikki mallit ovat bearisheja — onko tämä bugi?

Accepted Answer

Ei. Kaikki 5 mallia tuottavat johdonmukaisesti arvioita markkinahintojen alapuolelle (mediaani-ero noin −8 % … −17 %). Tämä vaikuttaa olevan kahden tekijän yhdistelmä: (1) DCF-mallit ovat rakenteellisesti herkkiä diskonttokorolle, ja nykyinen korkeiden korkojen ympäristö painaa laskennallisia arvoja alas; (2) LLM:t saattavat painottaa riskejä enemmän kuin mahdollisuuksia oletuksissaan. Seuraamme tätä systemaattisesti ja pidämme sitä yhtenä tärkeimmistä tutkimuskysymyksistä.

Question 33

Miksi mallit ovat bearishempia US-osakkeille kuin suomalaisille?

Accepted Answer

Kaikki mallit näyttävät 5–7 prosenttiyksikköä enemmän negatiivista biasta US-osakkeille verrattuna suomalaisiin. Todennäköinen selitys on, että US mega-cap -osakkeet treidaavat merkittävästi korkeammilla P/E-kertoimilla (usein >30×), joita DCF-mallit eivät pysty perustelemaan pelkillä kassavirtaennusteilla. Suomalaiset osakkeet, joiden kertoimet ovat matalampia, ovat lähempänä DCF-mallien luonnollista tuotosta. Tämä viittaa siihen, että DCF:llä voi olla rakenteellinen rajoite korkean kasvun ja korkeiden kertoimien markkinoilla.

Question 34

Onko malleilla erilliset 'persoonallisuudet'?

Accepted Answer

Kyllä — tämä on yksi selkeimmistä havainnoista. Claude käyttäytyy kuin varovainen seniorivaikuttaja: matala volatiliteetti (1,6 %/päivä), pienin bias, paras johdonmukaisuus. GPT on konservatiivinen ja riskipainotteinen: suurin bearish-bias, kohtalainen volatiliteetti. Gemini on impulsiivisin: suurimmat päivävaihtelut. DeepSeek seuraa ryhmää tehokkaasti alhaisimmalla hinnalla. Grok on nopea ja rohkea, mutta korkein korjausaste. Nämä 'persoonallisuudet' ovat pysyneet vakaina kaikilla 13+ havaintopäivällä.

Question 35

Voiko korkea yksimielisyys (1.00) olla harhaanjohtava?

Accepted Answer

Kyllä. Kun kaikki 5 mallia näyttävät täydellistä yksimielisyyttä (score = 1,00), se voi tarkoittaa kahta eri asiaa: aitoa konsensusta yhdenmukaisten näkemysten pohjalta, tai keinotekoista konvergenssia jossa turvarajat pakottavat kaikki mallit samaan kaistaan. Esimerkiksi jos analyytikkokonsensuskatto rajoittaa kaikki mallit samalle alueelle, ne näyttävät 'olevan samaa mieltä' vaikka niiden pohjalla olevat DCF-arviot saattoivat olla hyvin erilaisia. Kehitämme tapoja erottaa aito yksimielisyys katto-indusoidusta.

Question 36

Kenen analyysitapaa LLM:t oikeastaan noudattavat?

Accepted Answer

Tämä on avoin tutkimuskysymys. LLM:t on koulutettu valtavilla määrillä finanssitekstiä — analyytikkoraportteja, uutisia, akateemisia papereita, foorumeita. Ne ovat saattaneet oppia yhdistelmän institutionaalisten analyytikkojen konventioista (kuten Goldman Sachs tai Morgan Stanley) ja retail-sijoittajien näkökulmista. Yksi hypoteesi: niiden taipumus bearish-arvioihin saattaa heijastaa julkaistuissa analyytikkoraporteissa yleistä konservatiivista biasta, jossa yliarviointi (liian bullish) kantaa suurempaa maineriski kuin aliarviointi.

Question 37

Ovatko LLM:t oikeasti hyviä arvonmäärityksessä?

Accepted Answer

Liian aikaista sanoa lopullisesti — tarvitsemme vähintään 90 päivää dataa tilastollisesti merkitseviin analyyseihin. Alustavat havainnot viittaavat siihen, että: (1) viiden mallin konsensus on vakaampi kuin yksittäinen malli; (2) LLM:t kamppailevat eniten korkean P/E:n kasvuyhtiöiden kanssa; (3) ne suoriutuvat paremmin eurooppalaisista osakkeista matalammilla kertoimilla; (4) niiden arvo ei ehkä ole tarkoissa tavoitehinnoissa vaan systemaattisten kuvioiden ja vinoumien paljastamisessa siinä, miten tekoäly 'ajattelee' arvosta.

Question 38

Miten mallit reagoivat uuteen informaatioon kuten tulosjulkistuksiin?

Accepted Answer

Meillä ei vielä ole tuloskauden dataa (ensimmäiset Q1/2026-tulokset odotetaan huhti-toukokuussa). Tämä tulee olemaan ratkaiseva testi: reagoivatko jotkin mallit nopeammin uuteen dataan kun taas toiset pitävät kiinni aiemmasta näkemyksestään? 'Vakaa' vs 'Reaktiivinen' -malliluokitus ennustaa, että Claude muuttuu hitaasti kun taas Gemini saattaa ylireagoida. Suunnittelemme julkaisevamme erityisanalyysin ensimmäisen tuloskauden jälkeen.

Kysymyksiä ja vastauksia

Metodologia ja laskenta

Indeksit ja mittarit

AI-mallien käyttäytyminen

Data ja rajoitteet

Käyttö ja vastuuvapaus

Tutkimus ja alustavat havainnot