The Golden Times

이번 주에 학회에서 발표를 하나 했는데, critical material 중 한 원소의 시장을 모델링하고, demand shock이 가져올 영향을 분석하는 논문이었다. 광물 쪽 연구에 있어서 가장 큰 제약조건 중 하나는 데이터의 가용성인데, 구리나 알루미늄 같이 널리 쓰이는 것들은 좀 덜하지만 대부분의 마이너 메탈들은 시장이라고 할 만한 것이 없이 생산자와 소비자간의 bilateral contract에서 가격이 결정되기 때문에 가격 정보를 얻기가 매우 어렵다. 우리도 결국 거의 천만원 가까이 하는 자료를 따로 구매해서 가격 자료를 구해야 했는데, 당연히 패널 데이터도 아닐 뿐더러 연간 자료라 관측치도 매우 제한적이고, 그나마도 가격이 추정치다. 이렇다보니 경제학에 가장 널리 쓰이는 방법론인 계량을 적용하기가 애초에 거의 불가능하다. 그래서 partial equilibrium model을 이용해서 분석을 시도했다. CGE가 뜨면서 요샌 equilibrium modelling이 좀 많이 알려진 것 같은데, 최근 들어 질 좋은 데이터에 접근하기가 매우 쉬워지면서 계량이 더더욱 널리 이용되는지라, 여전히 계량에 비하면 덜 쓰이는 느낌이다. 다만 분야에 따라 더 선호되는 방법론들이 있기도 한데, 예를 들면 학계에는 계량쪽 직업이 훨씬 많고, 정부 기관이나 컨설팅쪽으로 가면 equilibrium modelling이 환영받는다(고 mj가 말했다). 


Equilibrium modelling과 계량의 가장 큰 차이점을 꼽자면 deterministic이냐 stochastic이냐 하는 점이라고 할 수 있다. 


오늘 살펴볼 equilibrium model은 시스템 내의 agent (예를 들어 생산자와 소비자)들이 최적화를 하고 (생산자는 이윤극대화, 소비자는 효용극대화), 그 최적화 식에서 도출되는 first order condition들과 market clearance condition (생산 \( \geq \) 소비), 그리고 일반균형 모델에선 income balance condition이 추가되어 두 가지 혹은 세 가지 종류의 조건들로 정의된다. 우리가 실제 시장에서 관측한 가격, 생산량, 소비량을 넣었을 때 모든 조건들이 성립하는 것을 보이면 데이터를 replicate하는 데 성공했다고 한다. 데이터를 replicate 했으면 이제 예를 들어 소비가 늘어났을 때 생산량과 가격이 어떻게 반응하는 지 보이기 위해, counterfactual에서 소비를 인위적으로 증가시킨 뒤, 다른 변수들의 값이 어떻게 변화하는 지 관찰한다. 이렇듯 가장 기본적인 형태의 equilibrium model에선 불확실성이 존재하지 않는다. 따라서 우리가 counterfactual에서 얻는 변수들의 값은 deterministic이라고 하겠다. 물론, 모델에 들어가는 parameter값에 대한 자료를 얻기 어렵거나 한 경우, parameter를 일정한 모집단 분포를 가정한 뒤 그 안에서 무작위 추출을 하는데, 이럴 경우엔 불확실성이 있을 수 있으며, counterfactual에서 얻어지는 변수 값도 평균값과 신뢰구간으로 표현된다. 


가장 단순한 예로 자동차 산업을 생각해보자. 우리가 알고 싶은 건, 자동차 수요가 늘었을 때, 가격이 어떻게 반응할 것인가 라고 가정하자. 자동차를 생산하는 생산자와 생산자로부터 차를 구매해 이용하는 소비자의 두 agents가 있는 모델이다. 자동차 생산자의 이윤극대화 식은 다음과 같이 표현된다:

$$ \underset{Q}{\max} \left( p - c \right) Q \tag{1}$$

위의 식에서 \( Q \)는 자동차 생산량, \( p \) 는 자동차 가격, \( c \) 는 한계생산비용이다. 위의 식으로부터 구한 first order condition은

$$ c \geq p \quad \perp \quad Q \geq 0. \tag{2} $$

제조업은 다음과 같은 수요함수를 따른다.

$$ D = \overline{D} \left( \frac{p}{\overline{p}} \right) ^{\epsilon} \tag{3} $$

\( D \)는 자동차 소비량, \( \overline{D} \) 는 benchmark 소비량 (즉, 우리가 데이터로부터 실제 관측한 소비량), \( \overline{p} \)는 benchmark 가격, 그리고 \( \epsilon \) 은 수요의 가격탄력성을 나타낸다. 


Market clearance condition은 \( Q \geq D ~~ \perp ~~ p \geq 0 \) 이며, 앞서 설명한 생산자의 first order condition과 이 market clearance condition에 의해 시스템이 정의된다. 모델 내에서 variable은 \(Q\), \(p\), \(D\)의 세 가가지이고, parameter는 \(c\), \(\overline{D}\), \(\overline{p}\), \(\epsilon\) 등이다. 변수가 세 개에 방정식이 세 개 (식 (2), (3), 그리고 market clearance condition)이므로, mixed complimentarity problem으로 풀 수 있다. 우리가 넣은 데이터 값에서 시스템을 푸는 데 성공했다면, 이제 인위적으로 \( D \) 값을 높여보자. 즉, \( D \)를 원래 데이터에 나오는 숫자보다 두 배 더 큰 수준으로 고정시킨 뒤, 모델에서 \(Q\) 와 \(p\)가 어떻게 반응하는 지 보는 거다. 그러면 수요가 증가했을 경우 생산량과 가격이 얼마나 늘어날 지 알 수 있다. 이 때 새로이 얻어지는 \(Q\)와 \(p\) 값들은 불확실성이 없이 deterministic으로 결정된다. 


(사실 위에서 예로 든 모형에선 수요가 늘어도 가격이 전혀 변하지 않는다. 이렇듯 직관에 반하는 결과가 나오는 건 CRTS production cost를 가정함으로써 암묵적으로 생산자가 완전경쟁시장에 있다고 가정했기 때문이며, 게다가 생산자의 최적화 식에 생산용량, 자원량 등의 제약조건도 없기 때문이다.)


이 방법론은 분석 결과가 reduced-form 계량과는 달리 엄밀한 경제학 모델에 기반한다는 점에서 많은 호응을 얻는다. 뿐만 아니라, 앞서 살펴본 것 처럼 계량에 적합한 데이터를 구하기 어려울 때, 즉 시계열/패널 자료를 구하기 어려운 경우 계량의 대용으로 이용되기도 한다. equilibrium modeling에선 한 시점에서의 자료만 있어도 변화하는 한 변수값에 대한 다른 변수들의 반응을 볼 수 있기 때문이다. 하지만, 분야에 따라선 데이터의 가용성에 관계 없이 적극적으로 활용되기도 한다. 전통적으로는 무역, 세금 등의 분야에서 많이 쓰였는데, 아무래도 시스템 전반에 걸친 모델링을 한 후 균형상태에서 어떤 충격을 줬을 떄 시스템 내의 다른 요소들이 어떻게 반응하는지를 관찰할 수 있다는 모형의 특성 자체와 관련이 있다고 하겠다. 예를 들어 무역 같은 경우 양 국가간의 균형 상태에서의 교역을 모델링 한 후, FTA 등이 가져올 영향을 살펴볼 수 있고, 세금도 마찬가지로 균형 상태에서의 경제활동에 세금이라는 충격을 주었을 경우 어떤 반응을 보일지를 볼 수 있다. 여담이지만 이런 점 때문에 정부 기관이나 컨설팅 등에서 이 방법론을 환영하는 것으로 생각된다. 또한 이래서 환경쪽에 이 모델이 적합한 경우가 많은데, 이를테면 탄소세의 영향 (세금), 혹은 carbon leakage (무역)은 앞서 설명한 세금 및 무역의 카테고리에 비교적 정확히 들어간다. 

초심자로서 내가 이 방법론에 대해 느끼는 단점으로는 실제 논문에 쓰이는 모델은 위의 예처럼 단순하지가 않다는 거다. 예를 들면 생산함수를 어떤 형태로 정의해야 하는지, 경제 내 섹터간의 관계는 어떻게 정의해야 되는지 등에서 정해진 답이 없으며, 결국 연구자가 판단하기에 가장 적합한 형태를 골라서 독자들을 설득해야 하는 문제다. 나는 이번에 E 와 하는 연구에서 이 방법론을 처음 써봤는데, 지금 갖고 있는 모델이 한 50번 정도의 실패를 거쳐서 나온 거다. 하지만 B는 이 51번째 모델을 아예 다 뜯어 고칠 것을 주문했다. 하... 물론, 지금은 처음 해 보는 거라 더 헤매고 있고, 익숙해 지면 훨씬 낮은 비용으로 모델을 세울 수 있겠지만 일단 거기까지 가는게 막막하다. 


일부 사람들은 equilibrium model과 계량과의 하이브리드를 시도하기도 하는데, 이를테면 위에 예로 든 자동차시장에서 \(\epsilon\), 즉 수요탄력성 값을 구할 때 계량 모델을 이용해서 추정하는 거다. 내가 지금 C 와 하는 연구에서도 그런 식으로 연구를 진행중이다. 하지만 모든 모델러들이 그렇게 하는 것은 아니며, 일반적으로는 parameter 값을 결정할 때 *믿을만 한* 연구자/연구단체가 선행연구에서 제시한 숫자를 차용한 후 그 값 근처에서 민감도 분석을 하곤 한다. 


이번 시간엔 deterministic한 equilibrium model에 대해 알아봤고, 다음엔 stochastic한 계량에 대해 간단히 알아보자. 

그런데 이거 생각보다 시간이 많이 걸리는데, 이 시간에 논문을 쓰는게 낫지 않을까 하는 회의감이 들지만, 이런 기본적인 내용들은 자꾸만 까먹기 때문에 한 번 정리해 둘 가치가 있다고 울면서 되놰 본다