Kysymyksiä ja vastauksia
Yleisiä kysymyksiä AI Investor Barometrista — miten se toimii, mitä luvut tarkoittavat ja mihin se on (ja ei ole) tarkoitettu.
Metodologia ja laskenta
Mikä on AI Investor Barometer?▾
Kokeellinen observatorio, joka seuraa miten 5 itsenäistä tekoälymallia (GPT, Claude, Gemini, DeepSeek, Grok) muodostavat osakkeiden arvostusoletuksia. Deterministinen arvostusmoottori laskee arviot näistä oletuksista. Sivusto visualisoi missä mallit ovat samaa mieltä, missä eri mieltä ja miten niiden näkemykset muuttuvat ajan yli. Tämä ei ole sijoitusneuvontapalvelu.
Miksi käytätte DCF-mallia eikä P/E-vertailua?▾
DCF pakottaa jokaisen tekoälymallin ilmaisemaan eksplisiittisesti oletuksensa kasvusta, kannattavuudesta ja riskistä — sen sijaan että se vain valitsisi vertailukelpoisen kertoimen. Tämä tekee mallien välisistä eroista läpinäkyviä ja mitattavia. Forward P/E -kattoa käytetään turvarajana estämään äärimmäisiä arvostuksia.
Miksi rahoitusyhtiöillä on eri malli?▾
Pankeille ja vakuutusyhtiöille (Sampo, Nordea, JPMorgan, Berkshire) velka on liiketoiminnan raaka-aine, ei rahoituserä. Perinteinen FCFF-DCF tuottaa näille systemaattisesti harhaanjohtavia tuloksia. Käytämme Excess Return on Equity -mallia, joka perustuu oman pääoman tuottoon suhteessa sen kustannukseen.
Mikä on deterministinen laskuri ja miksi se on tärkeä?▾
Kaikki viisi tekoälymallia syöttävät oletuksensa täsmälleen samaan matemaattiseen kaavaan. Tämä tarkoittaa, että arvioiden erot johtuvat puhtaasti mallien erilaisista näkemyksistä — ei siitä, että yksi malli laskisi paremmin. Ilman tätä erottelua mallien vertailu olisi mahdotonta.
Miten diskonttokorko (WACC) määräytyy?▾
WACC rakentuu markkina- ja sektorikohtaisista komponenteista. Riskitön korko on 3,0 % Suomessa ja 4,5 % USA:ssa. Osakeriskilisä on 4,5 % (Suomi) ja 5,0 % (USA). Tekoälymalli arvioi yhtiökohtaisen betakomponentin. Sektorikohtaiset WACC-haarukat ohjaavat malleja (esim. telecom 6,5–7,5 %, teknologia 9–11 %).
Mitä tarkoittaa Bayesilainen kalibraatio (shrinkage)?▾
Lopullinen arvio on yhdistelmä: 70 % DCF-mallin tulosta ja 30 % analyytikkokonsensusta. Tämä 'kutistus' vähentää systemaattista harhaa, jota DCF-malleilla yleensä on (tyypillisesti liian pessimistinen). Kalibroimaton DCF-signaali säilytetään erikseen tekoälyindeksejä (ACDI, ADI) varten.
Mitä 'Agreement score' tarkoittaa?▾
Se mittaa kuinka moni viidestä mallista on samaa mieltä suunnasta — onko osake mallin mielestä ali- vai ylihinnoiteltu. Arvo 1,00 tarkoittaa kaikkien mallien samansuuntaista arviota. Matala arvo (esim. 0,65) kertoo merkittävästä erimielisyydestä.
Mikä on terminaalikasvu ja miten se määritetään?▾
Terminaalikasvu on oletettu pitkän aikavälin kasvuvauhti ennustejakson jälkeen. Sitä EI aseta tekoälymalli — se on deterministinen, perustuen markkina × sektori -karttaan (esim. suomalainen teknologia 2,0 %, amerikkalainen terveydenhuolto 2,5 %). Tämä estää LLM:iä arvaamasta epärealistisia pitkän aikavälin lukuja.
Indeksit ja mittarit
Mitä ACDI (AI Valuation Gap) mittaa?▾
Mediaani arvostuseroa kaikkien tekoälymallien arvioiden ja markkinahintojen välillä koko osakkeistossa. Negatiivinen luku tarkoittaa, että mallit näkevät osakkeet keskimäärin ylihinnoiteltuina suhteessa laskettuihin arvoihin.
Mitä ADI (Model Disagreement) mittaa?▾
Mallien keskinäistä erimielisyyttä — ei niiden suhdetta markkinahintaan. Korkea ADI voi viitata epävarmuuteen, mutta myös siihen, että jokin malli on erityisen aggressiivinen tai konservatiivinen kyseisenä päivänä.
Mitä ANM (Sentiment Shift) mittaa?▾
Muutosta edellisestä päivästä: ovatko mallit kokonaisuutena liikkuneet optimistisempaan vai pessimistisempään suuntaan. Se ei kuvaa absoluuttista tasoa vaan dynamiikkaa — tekoälymallien tunnelman muutosta.
Miksi kaikilla malleilla on negatiivinen bias juuri nyt?▾
Tämä on yksi projektin mielenkiintoisimmista havainnoista. Mahdollisia syitä: DCF-mallit ovat herkkiä diskonttokorolle, ja korkeiden korkojen ympäristö painaa arvoja alas. Lisäksi mallien koulutusdata saattaa heijastaa historiallisesti matalampia arvostustasoja. Seuraamme biaksen kehitystä Bias Index -sivulla.
Mitä 'Calibration score' tarkoittaa käytännössä?▾
Se mittaa kuinka lähelle analyytikkokonsensusta malli pääsee ilman ulkoisia korjauksia. Korkeampi pistemäärä ei tarkoita, että malli on oikeassa — konsensuskin voi olla väärässä. Se kertoo lähinnä, kuinka hyvin kalibroitunut malli on suhteessa markkinoiden yleiseen näkemykseen.
AI-mallien käyttäytyminen
Miksi GPT on systemaattisesti karhumaisin?▾
Emme tiedä täsmälleen — tämä on yksi projektin tutkimuskysymyksistä. Mahdollisia selityksiä: GPT saattaa painottaa riskejä konservatiivisemmin, tai sen koulutusdata heijastaa eri markkinasykliä. Systemaattinen bias on dokumentoitu ja näkyy Bias Index -historiassa.
Onko Claude parempi koska sen bias on pienin?▾
Ei välttämättä. Matala bias suhteessa markkinahintaan voi tarkoittaa hyvää kalibrointia — tai se voi tarkoittaa, että malli on oppinut seuraamaan hintaa pikemmin kuin arvioimaan fundamentteja. Accuracy-sivu seuraa, mikä malli ennustaa suuntaa parhaiten ajan yli.
Miksi arviot vaihtelevat päivästä toiseen vaikka fundamentit eivät muutu?▾
Tekoälymallit eivät ole deterministisiä — sama syöte voi tuottaa hieman erilaisen tulosteen eri ajokerroilla. Lisäksi pipeline hakee tuoreimman markkinadatan päivittäin, mikä voi vaikuttaa oletuksiin. 'Vakaa' vs 'Reaktiivinen' -luokittelu Model Traits -osiossa kuvaa tätä vaihtelua mallitasolla.
Voivatko mallit oppia toisiltaan tai vaikuttaa toisiinsa?▾
Ei. Jokainen malli saa täsmälleen saman syötteen ja ajaa täysin itsenäisesti. Mallien välillä ei ole kommunikaatiota. Tulokset yhdistetään vasta laskennan jälkeen.
Mitä tekoälymalliversioita käytetään?▾
Tällä hetkellä: GPT-4o-mini (OpenAI), Claude Sonnet 4.6 (Anthropic), Gemini 2.5 Flash (Google), DeepSeek Chat (DeepSeek) ja Grok-3 (xAI). Malliversioita päivitetään tarjoajien julkaistessa uusia versioita. Versiomuutokset dokumentoidaan Changelogissa.
Miten promptit on rakennettu? Onko kyse zero-shot, few-shot vai RAG-lähestymistavasta?▾
Puhdas zero-shot -strukturoitu tuloste. Jokainen malli saa saman promptin joka sisältää: yhtiön taloustiedot (tuloslaskelma, tase, kassavirta Yahoo Financesta), tuoreimmat uutisotsikot (IR-syötteet + Yahoo News), analyytikkokonsensuksen tavoitehinnan, sektorikohtaiset ohjeet (marginaalihaarukat, kasvuodotukset, WACC-konteksti — 10 sektoriprofiilia) ja ohjeet tuottaa 3 arvostusparametria (liikevaihdon CAGR, EBIT-marginaalitavoite, WACC). Lämpötila on 0.4 kaikille malleille. Ei few-shot-esimerkkejä, ei tiedonhakua (RAG). Prompti ei sisällä aiempia mallituloksia tai historiallisia tekoälyarvioita.
Mitä konepellin alla tapahtuu päivittäin?▾
Joka arkipäivä klo 06:00 automaattinen pipeline: (1) hakee tuoreen talousdatan Yahoo Financesta kaikille seuratuille yhtiöille — tuloslaskelma, tase, analyytikkokonsensus ja uutisotsikot; (2) lähettää saman datan kaikille 5 tekoälymallille rinnakkaisesti, kukin tuottaa arvostusparametrit (kasvu, marginaali, WACC); (3) ajaa deterministisen DCF-moottorin joka laskee tavoitehinnat; (4) aggregoi konsensuksen, erimielisyyden ja markkinaindeksit; (5) tarkistaa hälytykset ja generoi viikkoraportin. Koko metodologia on dokumentoitu Metodologia-sivulla.
Data ja rajoitteet
Kuinka tuoretta data on?▾
Pipeline ajetaan automaattisesti arkipäivisin (ma–pe). Spot-hinnat ja markkina-data tulevat edellisen kaupankäyntipäivän päätöskursseista. Analyytikkokonsensus voi päivittyä viiveellä lähteestä riippuen. Viikonloppuisin ja pyhäpäivisin sivusto näyttää viimeisimmän saatavilla olevan datan.
Kuinka luotettavia mallien arviot ovat?▾
Arviot ovat kokeellisia eikä niitä tule käyttää sijoitusneuvontana. Alkuvaiheessa kaikilla 5 mallilla on systemaattinen negatiivinen vinouma (aliarvostus suhteessa markkinahintoihin). Mallien validiteetti on noin 100% (kaikki tuottavat tuloksen päivittäin). Suuntatarkkuus — ennustaako malli oikein nouseeko vai laskeeko osake — vaatii merkittävästi enemmän dataa luotettavaan arviointiin. Varhaisen vaiheen tarkkuusmetriikat löytyvät Tarkkuus-sivulta. Tärkein arvo ei ole yksittäisissä arvioissa vaan siinä, miten eri mallit muodostavat näkemyksiä ja missä ne eroavat.
Miksi joillakin yhtiöillä on vähemmän kuin 5 mallia?▾
Osa malleista saattaa palauttaa virheellisen tai jäsennyskelvoittoman vastauksen tietylle yhtiölle tiettynä päivänä — esimerkiksi jos malli kieltäytyy arvioimasta tai tuottaa luvun joka ei läpäise validointia. Tällaiset tulokset hylätään automaattisesti. Invalidi malli palautuu spot-hintaan eikä vaikuta konsensukseen.
Miksei mukana ole enemmän yhtiöitä?▾
Universumi on tarkoituksella rajattu: 12 suomalaista OMXH-yhtiötä ja 12 amerikkalaista S&P 500 -yhtiötä. Projekti on kehitysvaiheessa, ja pienemmällä universumilla rakentaminen, konfigurointi ja laadunvarmistus ovat helpompaa ja edullisempaa. Jokainen yhtiö vaatii sektorikohtaisen konfiguraation ja validoinnin. Laajentaminen on suunnitteilla metodologian kypsyessä.
Miksi joidenkin yhtiöiden gap on todella suuri (+40 % tai -44 %)?▾
Suurilla eroilla on yleensä rakenteellinen selitys. Esimerkiksi DCF-mallit aliarvioivat tyypillisesti korkean P/E:n kasvuyhtiöitä (kuten US mega-cap -teknologiayhtiöt) ja saattavat yliarvostaa defensiivisiä yhtiöitä vakailla kassavirroilla. Sektorikohtaisia prompt-ohjeita ja moottorin kalibrointia kehitetään näiden ääriarvojen vähentämiseksi.
Mitä värikoodatut pallot mallien nimien vieressä tarkoittavat?▾
Jokaisella tekoälymallilla on tunnusväri johdonmukaista tunnistamista varten kaikissa kaavioissa ja taulukoissa. GPT on syaani, Claude oranssi, Gemini violetti, DeepSeek vihreä ja Grok keltainen. Samoja värejä käytetään Model Spread -kaaviossa, Bias Indexissä ja mallisivuilla.
Mitä σ (sigma/dispersio) tarkoittaa?▾
Sigma (σ) mittaa kuinka hajallaan mallien arviot ovat suhteessa niiden mediaaniin. Matala sigma tarkoittaa mallien olevan lähellä toisiaan. Korkea sigma tarkoittaa laajaa erimielisyyttä. Se lasketaan kvartiilivälillä jaettuna mediaanilla.
Käyttö ja vastuuvapaus
Onko data ilmaista käyttää?▾
Sivusto on vapaasti käytettävissä. Data on tekoälymallien tuottamaa eikä sitä tule käsitellä taloustutkimuksena. Jos haluat viitata dataan akateemisessa tai journalistisessa työssä, mainitse lähteeksi 'AI Investor Barometer (aiinvestorbarometer.com)'. Julkinen API on harkinnassa.
Voiko tätä käyttää sijoituspäätösten tukena?▾
Työkalu on suunniteltu tekoälymallien vertailuun ja systemaattisten kuvioiden havainnointiin — ei osto- tai myyntisuositusten antamiseen. Jos käytät dataa omassa analyysissa, huomioi että datahistoria on lyhyt ja mallit voivat olla systemaattisesti väärässä. Katso käyttöehdot lisätiedoista.
Onko tämä MiFID II:n alaista sijoitustutkimusta?▾
Ei. Työkalu ei täytä säännellyn sijoitustutkimuksen määritelmää: se ei anna suosituksia, se ei ota kantaa osto- tai myyntipäätöksiin, eikä se ole suunnattu yksittäisten sijoituspäätösten tekemiseen. Se on vertailutyökalu tekoälymallien käyttäytymisen analysointiin.
Miten palvelu kehittyy?▾
AI Investor Barometria kehitetään asteittain datan kertyessä. Arvostusmoottoria, prompteja ja mallien kalibrointia parannetaan tuotantodatasta tehtyjen havaintojen perusteella. Viimeaikaisiin edistysaskeliin kuuluvat Engine v7 sektorikohtaisella ROIC-kalibroinnilla, kaikkien mallien lämpötilan yhtenäistäminen ja 10 sektorikohtaista promptia. Kehityksen etenemistä voi seurata Changelog-sivulta. Pysyäksesi ajan tasalla uusista ominaisuuksista ja löydöksistä, liity sähköpostitilaajaksi — lähetämme viikoittaisen AI Signals -raportin ja tiedotamme merkittävistä muutoksista.
Tutkimus ja alustavat havainnot
Miksi kaikki mallit ovat bearisheja — onko tämä bugi?▾
Ei. Kaikki 5 mallia tuottavat johdonmukaisesti arvioita markkinahintojen alapuolelle (mediaani-ero noin −8 % … −17 %). Tämä vaikuttaa olevan kahden tekijän yhdistelmä: (1) DCF-mallit ovat rakenteellisesti herkkiä diskonttokorolle, ja nykyinen korkeiden korkojen ympäristö painaa laskennallisia arvoja alas; (2) LLM:t saattavat painottaa riskejä enemmän kuin mahdollisuuksia oletuksissaan. Seuraamme tätä systemaattisesti ja pidämme sitä yhtenä tärkeimmistä tutkimuskysymyksistä.
Miksi mallit ovat bearishempia US-osakkeille kuin suomalaisille?▾
Kaikki mallit näyttävät 5–7 prosenttiyksikköä enemmän negatiivista biasta US-osakkeille verrattuna suomalaisiin. Todennäköinen selitys on, että US mega-cap -osakkeet treidaavat merkittävästi korkeammilla P/E-kertoimilla (usein >30×), joita DCF-mallit eivät pysty perustelemaan pelkillä kassavirtaennusteilla. Suomalaiset osakkeet, joiden kertoimet ovat matalampia, ovat lähempänä DCF-mallien luonnollista tuotosta. Tämä viittaa siihen, että DCF:llä voi olla rakenteellinen rajoite korkean kasvun ja korkeiden kertoimien markkinoilla.
Onko malleilla erilliset 'persoonallisuudet'?▾
Kyllä — tämä on yksi selkeimmistä havainnoista. Claude käyttäytyy kuin varovainen seniorivaikuttaja: matala volatiliteetti (1,6 %/päivä), pienin bias, paras johdonmukaisuus. GPT on konservatiivinen ja riskipainotteinen: suurin bearish-bias, kohtalainen volatiliteetti. Gemini on impulsiivisin: suurimmat päivävaihtelut. DeepSeek seuraa ryhmää tehokkaasti alhaisimmalla hinnalla. Grok on nopea ja rohkea, mutta korkein korjausaste. Nämä 'persoonallisuudet' ovat pysyneet vakaina kaikilla 13+ havaintopäivällä.
Voiko korkea yksimielisyys (1.00) olla harhaanjohtava?▾
Kyllä. Kun kaikki 5 mallia näyttävät täydellistä yksimielisyyttä (score = 1,00), se voi tarkoittaa kahta eri asiaa: aitoa konsensusta yhdenmukaisten näkemysten pohjalta, tai keinotekoista konvergenssia jossa turvarajat pakottavat kaikki mallit samaan kaistaan. Esimerkiksi jos analyytikkokonsensuskatto rajoittaa kaikki mallit samalle alueelle, ne näyttävät 'olevan samaa mieltä' vaikka niiden pohjalla olevat DCF-arviot saattoivat olla hyvin erilaisia. Kehitämme tapoja erottaa aito yksimielisyys katto-indusoidusta.
Kenen analyysitapaa LLM:t oikeastaan noudattavat?▾
Tämä on avoin tutkimuskysymys. LLM:t on koulutettu valtavilla määrillä finanssitekstiä — analyytikkoraportteja, uutisia, akateemisia papereita, foorumeita. Ne ovat saattaneet oppia yhdistelmän institutionaalisten analyytikkojen konventioista (kuten Goldman Sachs tai Morgan Stanley) ja retail-sijoittajien näkökulmista. Yksi hypoteesi: niiden taipumus bearish-arvioihin saattaa heijastaa julkaistuissa analyytikkoraporteissa yleistä konservatiivista biasta, jossa yliarviointi (liian bullish) kantaa suurempaa maineriski kuin aliarviointi.
Ovatko LLM:t oikeasti hyviä arvonmäärityksessä?▾
Liian aikaista sanoa lopullisesti — tarvitsemme vähintään 90 päivää dataa tilastollisesti merkitseviin analyyseihin. Alustavat havainnot viittaavat siihen, että: (1) viiden mallin konsensus on vakaampi kuin yksittäinen malli; (2) LLM:t kamppailevat eniten korkean P/E:n kasvuyhtiöiden kanssa; (3) ne suoriutuvat paremmin eurooppalaisista osakkeista matalammilla kertoimilla; (4) niiden arvo ei ehkä ole tarkoissa tavoitehinnoissa vaan systemaattisten kuvioiden ja vinoumien paljastamisessa siinä, miten tekoäly 'ajattelee' arvosta.
Miten mallit reagoivat uuteen informaatioon kuten tulosjulkistuksiin?▾
Meillä ei vielä ole tuloskauden dataa (ensimmäiset Q1/2026-tulokset odotetaan huhti-toukokuussa). Tämä tulee olemaan ratkaiseva testi: reagoivatko jotkin mallit nopeammin uuteen dataan kun taas toiset pitävät kiinni aiemmasta näkemyksestään? 'Vakaa' vs 'Reaktiivinen' -malliluokitus ennustaa, että Claude muuttuu hitaasti kun taas Gemini saattaa ylireagoida. Suunnittelemme julkaisevamme erityisanalyysin ensimmäisen tuloskauden jälkeen.