Modelování a předpovídání v ekonomii

Jakékoliv diskuse o modelování a předpovídání v ekonomii vyvolávají vášně a často se v těchto přestřelkách diskutuje o něčem, co ve skutečnosti ekonomové nedělají. Rád bych se na pár řádcích věnoval několika rozšířeným mýtům.

Ačkoliv nejsem odpůrce modelování jako konceptu a zároveň to je částečně moje práce, nekladu si za cíl vás nějak přesvědčit, že modelování je super skvělé nebo tak něco (sám si to nemyslím). Jen bych vám chtěl dát trochu víc podkladů, abyste se mohli lépe rozhodnout sami. Skoro vůbec se nebudu věnovat tématu meritu matematické ekonomie samotné, to je na delší povídání.

(Nejprve v rychlosti terminologie. “Model” je celkem obecný termín. Budu tu řešit zejména makro modely, tedy zpravidla komplexní systémy, které se snaží pokrýt agregátní pohled na ekonomiku. Nebudu rozlišovat několik výrazů, které znamenají trochu odlišné věci (estimate, forecast, projection), akorát by to mátlo. A nebudu, až na menší výjimky, zacházet do technických detailů.)

Proč zjednodušujeme?

Makroekonomický model bude vždy simplifikací. Je to zjednodušení reality, snaha zachytit interakce mezi lidmi, firmami, zeměmi, … Zjednodušujeme, protože obsáhnout veškeré reálie by bylo příliš náročné (resp. nemožné), nepraktické a ani bychom k tomu neměli data.

Odsouzení modelování je často založeno na kritice přílišného zjednodušení, ale zároveň je pak doprovázeno požadavkem užití selského rozumu. To je ale značně nekonzistentní kritika, protože poučky na základě selského rozumu či elementárních modelů jsou ještě větším zjednodušením, často nekonzistentním.

Zjednodušení v modelování obecně plyne z nutnosti použít méně parametrů než dat. Můžete jednoduše “vysvětlit” veškerou dynamiku v datech, když si zvolíte dostatek parametrů, model vám pak bude ale prakticky k ničemu. Také nám menší počet parametrů (za určitých okolností) zajistí jednoznačnost řešení. Jde nám tedy o kombinaci teoretického základu, jednoduchosti (parsimonie) a vysvětlující schopnosti.

Nezajímá nás jen budoucnost

Hned zkraje je třeba rozlišovat bezpodmínečné předpovědi, tedy výhledy (forecasting), které jaksi mnozí předpokládají za cíl či úkol ekonomů. Může je však překvapit, že forecasting je relativně minoritní podobor v rámci modelování.

Když už se dělá nějaké předpovídání, je to velmi často tzv. nowcasting, tedy odhad toho, co se právě děje či co právě skončilo. Makro veličiny jako HDP jsou tak komplexní, že často trvá týdny až měsíce, než získáme finální čísla za uplynulý rok či kvartál (před pár dny vyšla nefinální čísla za Q2 pro Česko, tedy kvartál 6 týdnů skončený). Tato čísla spolu s odhady blízké budoucnosti mají velký vliv na politiku, větší než dlouhodobé odhady, které téměř nikdo nebere vážně.

Mnohem zábavnější (záleží tedy na vaší definici zábavy) je podmíněné předpovídání (conditional forecasting), zejména pak tzv. policy analysis, tedy analýza vlivu politických rozhodnutí na ekonomiku. Může se dělat dvojím způsobem, ex post či ex ante. Ex post analýza bere existující data za minulost a snaží se odhadnout tzv. counterfactual, tedy co by se bývalo stalo, kdyby nějaká změna nenastala. Může jít o intervenci ČNB, vstup do EU či Eurozóny atd. Metod jak na to je spousta, vydají na zvlášť článek či knihu.1

Ex ante analýza se pak snaží odhadnout dopad plánovaných změn. Krom counterfactual linky (což vlastně není counterfactual, protože oba případy jsou nerealizované) se tak musí udělat i zvlášť předpověď bez této politické změny, též nazvané business as usual, příp. baseline. Máte tedy dvě verze budoucnosti, ale nezajímá vás tolik absolutní vyjádření jednotlivých veličin jako jejich rozdíl mezi těmito scénáři. Do jisté míry se tak potlačuje ta inherentní nejistota v předpovědích. Neříkáte, že HDP by bylo X při normálním chodu dějin a Y při této změně, ale spíš hlásíte procentuální rozdíl mezi těmito dvěma scénáři. “Můžete” se tak mýlit v odhadu určité dynamiky, ale budete se mýlit v obou scénářích, takže i rozdíl mezi nimi bude menší.

Modely se tak liší účelem. Není to tak, že se vezme jeden model a použije na jednu z výše popsaných metod. Jsou modely na předpovídání krátkého či středního období, modely na dlouhé období, simulační modely na policy analysis atd. Modely jsou konstruovány za daným účelem, a je třeba to mít na paměti.

Model není jen ekonomická záležitost

Odpůrci ekonomického modelování občas zapomínají, že modelování jako koncept je rozšířená věc v jiných oblastech jako je biologie, meteorologie, klimatologie nebo ve sportu (příkladem budiž adorovaný Nate Silver).

A nejde jen o veřejné výzkumní aktivity, v soukromém sektoru se hojně modeluje též. Nate Silver je a vždy byl soukromník při modelování sportu, podobně modeluje energetická firma chování zákazníků, aby mohla včas a správně investovat do infrastruktury (což je ostatně pro mě dost reálný příklad). Nebo třeba v kvantitativních financích, modelování rizika.

Když se tedy díváte na předpověď počasí, nakupujete na Amazonu nebo se sprchujete v teplé vodě, někdo v práci modeloval, aby tohoto dosáhl (teplé vody, ne vašeho sprchování :).

Lidské jednání

Protiargumentem k této rozšířenosti modelů v jiných vědních disciplínách je fakt, že v ekonomii máme co dočinění s lidským jednáním, pro které neplatí daná pravidla jako ve fyzice či chemii. Slovy otce myšlenky, Ludwiga von Misese, např. takto:

> Their ideal is to construct an economic theory according to the pattern of mechanics. They again and again resort to analogies with classical mechanics which in their opinion is the unique and absolute model of scientific inquiry. There is no need to explain again why this analogy is superficial and misleading and in what respects purposive human action radically differs from motion, the subject matter of mechanics. (Ludwig von Mises, Human Action)

Což je validní argument, lidské jednání opravdu mění podstatu problému, přijde mi ale trochu zjednodušující, aby se tímto odmítalo modelování jako koncept. Je podle mě fér přiznat, že lidské jednání nám metaforicky háže klacky pod nohy, ale nevidím důvod kvůli tomuto opustit tento obor. Měl-li bych argumentovat poptávkou, stačí se podívat do výše zmiňovaného soukromého sektoru, kde modelování lidského jednání hojně probíhá, a není to výzkum za účelem výzkumu, jak často někdo akademické bádání vidí.

Není to jen lineární, deterministické, stálé, bez zpětné vazby

Je třeba adresovat i některé technické poznámky. Často zmiňovanou metodou je lineární regrese, což je věc značně nepochopená. Nejen že slovo lineární neznamená, že jde o pouhé lineární vztahy, že jde o nějaké “přímky” (ostatně ani není vůbec nutné lineární regrese používat). Oblíbenou karikaturou modelování je proložení dat přímkou nebo parabolou (ta zrovna není úplně lineární).2 To je vidět možná na úvodní hodině statistiky, ale v reálu uvidíte značně sofistikovanější metody.

Parametry se mohou měnit v čase, celý model může být z definice nelineární. Může obsahovat náhodné prvky, zpětné vazby a může se vám i úplně zbláznit pod rukama. Postupně.

Odhadnuté vztahy nemusí být definitivní a stálé. Mohou mít zlom v čase (např. při vstupu do FTA, při zavedení inflačního cílování apod.), mohou se průběžně měnit. Nebo mohou počítat s náhodnými výchylkami - stochastické modely ve svém jádru mají náhodné a nekorelované šoky či jiné náhodné veličiny. Pomocí simulací pak můžete zjistit, jakých možných výsledků dosáhnete.

(U některých komplexních nelineárních systémů mohou tyto stochastické vlivy vést k tomu, že i mírná změna vstupních podmínek může vést k drasticky jinému výsledku, problém tzv. chaos theory. I to se může stát v ekonomii.)

Častou námitkou je, že máme u veličin jasně zpětné vazby, že vše není z hůry dáno (tzv. exogenní). Problém těchto veličin, těch, které se v závislosti na dalších mění, tzv. endogenní proměnné, je dobře znám. A také má několik možných řešení, namátkou instrumenty nebo vektorová autoregrese, kdy cíleně zkoumáme vzájemné zpětné vazby mezi více veličinami.

Někdo by mohl namítat, že někdy nemáme kompletní vzorek, že z různých důvodů nemáme reprezentativní výběr ze společnosti. I to řešil např. James Heckman (a dostal za to Nobelovu cenu). Obecně byl znám problém, že když nemáme vzorek pokrývající potřebně reprezentativní, náš model nebude dobře aplikovatelný mimo námi zkoumanou skupinu vstupů. Občas ale není možné mít reprezentativní vzorek, Heckman proto ukázal, jak náš model této situaci přizpůsobit.

Další z námitek je nestálost odhadnutých parametrů, že stačí jedna dvě výchylky, a rozpadnou se nám výsledky. Odpovědí je tzv. robustní statistika/ekonometrie, kdy autor modelu zohledňuje výchylky a zároveň je využívá, protože často nesou velmi důležité informace (pokud nejde o chyby dat).

No a v neposlední řadě vidíme v poslední době fúzi více oborů, kdy nám do ekonomie fušují fyzikové nebo biologové a vidíme modelování difuze technologií za pomocí známého predator-prey modelu; evoluční teorii her nebo tzv. econophysics.

Toto je samozřejmě nekompletní výčet, jde o krátký výčet problémů, které moderní ekonometrie adresuje.

Reprezentativní agent

Jedno ze zjednodušení je tzv. “reprezentativní agent”, který slouží jako “průměrná” osoba v systému, který modelujeme. Tento koncept je často kritizován, protože se přeci nechováme všichni stejně. To ale ani není podstata tohoto konceptu, nepředpokládá jednotné chování, ale umožňuje nám aproximovat celek (za předpokladu možnosti agregace).

Zatímco v určitých částech mikroekonomie to tak úplně fungovat nemůže, v makro pohledu, tedy agregátním, je dobře vidět užitečnost tohoto zjednodušení. Je-li jedním z vašich předpokladů/empirických pozorování, že spotřebitelé šetří deset procent mzdy, neznamená to, že všichni spoří přesně deset. Někdo spoří 20, někdo 30, někdo nic.

To je samozřejmě příklad, může se předpokládat určité statistické rozdělení pro míru úspor nebo nějaká zpětná vazba mezi úrovní mzdy a spořivostí. Co je ale častější, je více modelových agentů v ekonomii. Tzv. “heterogenous agent models” tedy využívají vícero možných “typů” jedinců. Může jít o singles, rodiny s dětmi, penzisty, … A u každé skupiny očekáváme jiné chování.

Pokud tedy kritizujete ekonomy pro předpoklady heterogenního chování, podívejte se nejprve na specifikace používaných modelů, např. národní banky je zveřejňují. Takový model místního ministerstva financí má až 50 různých agentů.

(Modelování chování agentů se poslední dobou zavádí do extrémů, kdy se v makru objevují tzv. agent-based modely, kdy se přímo simulují interakce jedinců v ekonomii, tedy takoví Sims na velké škále :) Jde o celkem nový přístup, který se stal možným až s příchodem dostupné výpočetní techniky.)

Velmi krátká historie

Posledních několik desetiletí bylo pro makroekonomické modelování dost turbulentní období. Chci zde popsat jen několik základních myšlenek, aby bylo jasné, že jde o neustále vyvíjející se obor. Dochází ke evoluci různých konceptů, to z důvodů teoretických i praktických.

Z hlediska praktického jde o dostupnost výpočetní techniky, existenci dat, jejich vyšší kvalitu a detail, jednodušší komunikaci mezi ekonomy a lidmi obecně atd. (Na druhou stranu to vše vedlo i k jedné velké nevýhodě dnešního praxe, tedy že technika je dnes tak dostupná, že často její užití předchází teorii, protože cena modelování je dnes velmi nízká.)

Z hlediska teorie šlo o několik průlomů, které si nechám do poznámky pod čarou,3 pro nás bude důležitý zejména přínos nobelisty Lucase. Jde o tzv. negativní objev, tedy poukazání na to, že něco nefunguje. Robert Lucas ve své slavné kritice (tzv. Lucas critique) tehdy mainstreamové modelování odsoudiljako z velké části nefungující, protože je založeno na historických vztazích, které nejen že nemusí platit nadále, ale zejména pokud modelujeme reformy či regulace (policy), tak právě tyto změny pravidel mohou naše pozorované ekonomické vztahy změnit. Tedy velmi častá kritika i dnes.

> “Given that the structure of an econometric model consists of optimal decision rules of economic agents, and that optimal decision rules vary systematically with changes in the structure of series relevant to the decision maker, it follows that any change in policy will systematically alter the structure of econometric models.”

Upozorňuje nás tak na dynamiku, kterou je nutné brát v potaz. Lucasova kritika měla dalekosáhlé dopady, protože, jak jsem psal výše, modelování dopadů politických rozhodnutí patří mezi populární použití modelování.

Lucasova kritika ale neplatí pouze pro modely samotné, ale v obecném ekonomickém uvažování. Navrhujete-li zrušení určité daně, neznamená to pouze, že lidé budou mít o X více a erár vybere o X méně. To je velmi statický způsob uvažování. Je třeba brát v potaz, jak tato “změna pravidel” ovlivní chování lidí. Nemusíte modelovat, nemusíte na papír napsat jediné číslo, je obecně třeba brát v potaz ekonomickou dynamiku.

Selhali ekonomové, co se týče krize?

Dobrá otázka. Nedávné dvě krize (obě stále existující v jisté podobě) nám ukazují hezký kontrast současných schopností ekonomů. Obecně se ekonomům připisuje jejich selhání, že nepředpověděli finanční krizi (která se vyvinula v ekonomickou) nebo evropskou fiskální krizi. Pokud jste slyšeli o někom, kdo tu první předpověděl, tak ji nejspíš nepředpověděl, to jen tak na okraj.4

Jak jsem mnohokrát zopakoval, bezpodmínečné předpovídání není tak rozšířené, jak si veřejnost myslí. To za prvé. Je též přehlíženo, že tato finanční krize byla trochu jiná než “běžné” krize - v svém původu. Měla původ ve finančním sektoru, ve způsobu ohodnocení hypotečních úvěrů a modelování rizika. Tedy složek, které nejen že nejsou v dnešních ekonomických modelech (protože by tam ani neměly žádný vliv), ale hlavně jsou založeny na silně privátních datech. Bylo obecně známo, že peníze jsou “levné” a že určitá část hypoték bude nesplacena, což je zpětně reflektováno v hypotečním trhu.

Už ale nebylo tak jasné, že tato rizika byla špatně spočítána a že byla skryta v nových finančních produktech (resp. nebyl jasný jejich rozsah), a že to celé může spadnout jako domek z karet. Bylo to tedy celé mimo rozsah makroekonomického modelování, z hlediska metodologického i z hlediska dostupnosti dat.

Dnešní modely se snaží lépe zakomponovat makrofinance, uvidíme, zda to k něčemu bude. Stále toho tolik o financích nevíme, je to diskuse vedená spoustu dekád, hezky to ilustrují poslední Nobelovy ceny, které šly do dvou táborů s opačnými názory na finanční trhy a jejich informační hodnotu.

Daleko “modelovatelnější” byla zmíněná fiskální krize v Evropě. Zde se z velké části operovalo se skutečnostmi, které jsou dobře kvantifikovatelné. Způsob státního financování (pomineme-li řecké hrátky s Goldman Sachs), rigidita pracovního trhu, obchodní závislost evropských ekonomik, realitní bubliny, demografický vývoj, to vše jsou viditelné informace o evropských ekonomikách, a pokud je někdo správně poskládá, může mít dobrý pohled na potenciální budoucí vývoj. Šlo tedy o dosti “viditelnější” krizi než tu finanční/ekonomickou.

Palčivější problémy

Snažil jsem se adresovat některé populární kritiky modelování, které jsou podle mě dost nedostatečné a často jsou založeny na neznalosti. Je ale spousta tíživějších problémů, které jsou často snadno atakovatelné.

Jedním je nestálost výsledků v závislosti na použité metodě, i když se použijí stejná data. Na každý možný problém se najde několik způsobů, jak je řešit, takže není překvapující, že si někteří vyberou tu “správnou” metodu, která jim dá chtěný výsledek. Pěkně to je vidět třeba na tomto paperu, kde se autoři snaží odhadnout vliv většího bohatství na poptávku po benzínu. Po použití všemožných metod dostanou pokaždé dost jiný odhad.

Další z problémů je inherentní nepřesnost. Modeláři netvrdí, že jejich numerický odhad je přesný a že právě ta jimi udávaná hodnota je Ta Správná. Často svůj odhad doprovází určitou mírou nejistoty a ukazují, jaký rozptyl jejich odhad má. Dobře to vidíme třeba na těchto grafech Bank of England (podobné můžete vidět v prezentacích ČNB), kde se rozptyl zvětšuje s časem, protože nejistota stoupá. Klesá tak užitečnost tzv. bodových odhadů, a to je třeba brát v potaz.

Problém zejména v druhé polovině minulého století byl nedostatek dat (a/nebo výpočetního výkonu). Často se analýzy dělaly na několika desítkách pozorování, dokonce se používaly teorémy, které závisí na konvergenci vzorků dat k určitému statistickému rozdělení, tato konvergence je ale (logicky) závislá na velikosti vzorku.

Určitá nedostupnost stále trvá. U některých makro dat častější odhady než čtvrtletní prostě nemáme (HDP budiž příkladem), někde je sběr velmi nákladný. Pohled do článků o behaviorální ekonomii nám připomene makro papery z let sedmdesátých. Patnáct až dvacet pozorování a snaha z toho cokoliv vyčíst. Je to samozřejmě dáno tím, že když máte kontrolní skupinu, dále dělení podle pohlaví, příjmových skupin atd., tak rychle zjistíte, že musíte mít stovky až tisíce pozorování, abyste v každé této podskupině měli alespoň trochu dat. Hezky to je vidět u paperu nobelisty Rotha, který zkoumal sobeckost napříč národy.5

Vliv policy a Lucasovu kritiku jsem výše zmiňoval. Je to jeden z nejpalčivějších problémů současného modelování, protože to je stále do velké míry otevřený problém. Ačkoliv se modeláři snaží pochopit vliv těchto změn pravidel, ne vždy se jim to daří. A nejde jen o změny daní, může jít třeba o geopolitické vlivy (Rusko a sankce), nejisté fenomény a s nimi spjaté akce (deflace, intervence) nebo třeba energetika (aktivní výzkum, silná regulace a státní angažovanost).

Závěr

Gratuluji, pokud jste to dočetli až sem. Snad pro vás tato rychlá exkurze do světa ekonomického modelování byla užitečná. Snažil jsem se vybrat zajímavá témata a popsat je srozumitelně a netechnicky. Znalec omluví cílené opuštění formální mluvy, ale cílový čtenář není ekonom.

Vynechal jsem několik témat, protože jsem se jim nikdy nevěnoval (např. DSGE nebo inflační modelování). Všude jinde jsem se snažil zmínit jména a zdroje, abyste si v případě zájmu mohli dohledat podrobnosti, i Wikipedie je často slušný zdroj. Případně mi napište, můžu dodat další čtení.


  1. Zde je často doporučovaná Mostly Harmless Econometrics nebo spousta paperů od těchto autorů.

  2. Technicky vzato je snadné proložit data parabolou v lineární regresi. Linearita má co dočinění se způsobem řešení i s “tvarem” parametrů, není ale nutné mít vstupní data na původní úrovni, může jít o hodnoty různě transformované, takže linearita řešení nevyústí v lineární vztah mezi původními úrovněmi našich dat.

  3. Neúplný výčet (za všechny tyto objevy byla udělena Nobelova cenu): Jan Tinbergen (vůbec první recipient) a později Lawrence Klein položili základy ekonometrického modelování. Richard Stone rozpracoval tzv. input-ouput analýzou, jde o mapování nákupů jednotlivých sektorů od druhých (jde tedy o matici), z čehož můžete vysledovat dopad “šoku” v jednom sektoru, jak pak propluje celým systémem. Nebo Clive Granger upozornil na to, že regrese časových řad může vést k tzv. spurious vztahům, tedy ve skutečnosti neexistujícím závislostem.

  4. Pokud někoho můžeme označit, že předpověděl krizi, musí mít dobrý track record, tedy historii dobrých odhadů. Pokud někdo předpovídá krizi každý měsíc, jednou se trefí. Tak se třeba už několik let předpovídá krize startupové scény. Kde nic, tu nic. (Sám si myslím, že dříve nebo později přijde, ale nikdo ji zatim věrohodně nepředpověděl.)

  5. Je to jiný subobor, ale dá vám to jistou perspektivu. Chcete-li příklad z makra, tak zmiňovaná Bank of England má nové modely, kde používá data jen od poloviny devadesátých let do r. 2007 (kvůli krizi), byť čtvrtletní. Sami přiznávají, že to není časová řada úplně dlouhá. No není :)