생산가능인구와 경제성장률의 높은 관련성 working-age population and gdp
http://runmoneyrun.blogspot.kr/2016/10/working-age-population-and-gdp.html
고령화가 경제성장률을 낮춘다.
1960년대 이후 선진국과 몇 개의 아시아 국가에서 생산가능인구비율과 경제성장률을 비교해서 얻은 결론이다.
1990년을 경계로 해서 생산가능인구의 비율에 변곡점이 나타나기 때문에 이전과 이후를 나누어 비교하는 것이 중요하다는 것이 또 하나의 결론이다.
그렇게 해도 같은 관련성을 확인할 수 있다.
http://blog.naver.com/hong8706/221037708650
https://www.aeaweb.org/articles?id=10.1257/aer.p20171101
그런데 어떤 이유로 1990년에서 2015년 까지의 데이타만을 가지고 분석하면 전혀 다른 결론이 나올 수 있다고 한다.
노령화가 경제성장률과 관련이 없거나, 오히려 성장률을 높일 수 있는 것처럼 보인다고.
내가 전에 몇 개의 나라만을 뽑아서 비교한 것은 미리 어떤 결론을 염두에 둔 것이 아니고, 한국보다 규모가 큰 선진국과 한국과 비슷한 역사적 배경을 갖는 아시아의 국가를 포함한 것이다.
한국과의 비교가 의미있는 국가를 최소한으로 포함시켜서 결과를 확인해보니 저렇다는 것이다.
위에 인용된 논문에서처럼 데이타를 구할 수 있는 나라를 전부 포함시키면 데이타를 선택할 때 발생할 수 있는 오류는 사라질 수 있다.
그런데 인구와 gdp가 매우 작아서, 나라 수십개를 합쳐도 미국이나, 중국에도 못 미치는 나라를 각각의 국가로 똑같이 비교하게 되면, 결과에 심대한 영향을 주게 된다.
인구만으로 따지면 중국, 인도는 나머지 아시아 전체와 비교할 만한 수준이다.
이렇게 크기에서 오는 오류를 피하려면 평균을 구할 때는 기준을 정해 가중평균을 구해야 한다.
집단간의 비교를 하려면 사이즈에 대해서 층위를 두거나 비교가능한 수준으로 합쳐서 결론에 영향이 적게 해야 한다.
논문에서 지역, 출생코호트에 대한 고려를 했다고 하나, 샘플의 갯수(전체국가 169, oced 35) 자체가 의미하는 것은 이 논문이 과도하게 일반화될 수 있는 결론을 추구했다는 것이다.
만약 저렇게 전체 국가를 그대로 비교를 하려면, 경제 규모나 인구 규모를 비슷하게 맞출 필요가 있다.
미국은 주별로 50개로 뽀개고, 중국은 성별로 수십개로 뽀개서 데이터가 표시하는 인구와 경제규모가 과도하게 차이가 나지않게 해야 한다.
이렇게 분해하는 방법은 여러나라를 합치는 것보다 어렵다.
데이타를 얻기 어렵고, 다수에게 납득할 기준을 제시하기 어렵다.
결국 국가를 합쳐서 비교가능하게 만들거나, 비교대상이 되기 어려운 나라를 제거해야 한다.
또 하나의 심각한 문제는 성장경로에 대한 의존성의 문제이다.
'만약'
일국의 인당gdp수준이 일정 기간의 성장기를 지난 후 포화되는 것이라면, 이미 50-60년대 선진국 수준에 도달한 국가, 이후에 선진국에 도달한 아시아의 몇개 국가, 수십년 이내 선진국 근처에 도달하기 어려운 많은 국가들은 인구구조의 영향을 전혀 다르게 받을 수 있다. (나는 이 가설이 상당히 유망하다고 본다)
그렇다면 전세계 국가를 전부 포함하는 위의 통계는 전부 쓸모가 없을 가능성이 있다.
결국 한 국가의 인구규모, gdp규모, 인당gdp 수준에 따라 달리 비교를 해 볼 필요가 있는 것이다.
그러니까 학문적인 가치가 있는 논문을 쓰려고 했으면 저 정도 수준에서 결론을 끄집어 내려고 하면 안 되고 최소한의 노력과 성의가 필요했다고 본다.
내 상식과 내가 확인한 데이타는 고령화가 경제성장률을 낮출 가능성을 명백하게 지지한다.
그렇지 않다는 주장을 하는 논문은 경제학자들이 제시한 것이라고 해도 오히려 한계가 명확하다.
1. 구할 수 있는 국가 데이타를 다 보여준다고 진실에 더 접근하는 것이 아니고, 오히려 진실을 왜곡할 수 있다.
2. 원하는 일부 시기만으로 비교하는 것은 진실을 결정적으로 왜곡할 수 있다. 고령화와 성장의 관련성이 역사적으로 변화했고, 그에 대한 확인을 했다면 그게 더 중요한 데이타일 것이다.
3. 제한된 조건에서의 제한된 결론이 그나마 사실에 가까울 수 있다.
더구나 그런 주장을 하는 의도가 이어지는 분석에서 보인다.
그러나 논문이 제시하는 노령화와 경제성장률의 관계에 대한 증거가 의심스러다면, 왜 고령화가 경제성장률을 낮추지 않는지 혹은 높이는지에 대한 가설은 들여다 볼 필요가 없다.
쓸 데 없이 길어졌지만 위 논문은
고령화가 성장률과 관계가 없는지 혹은 고령화가 성장률을 오히려 높이는지
고령화의 억제 영향에도 불구하고 다른 생산성향상 요인이 성장률을 더 높였는지
아니면 고령화, 생산성 향상요인, 경제성장률이 다른 공통 요소의 직접적인 영향을 받았는지
이런 현상들이 짧은 기간, 일부 지역/국가에서만 나타나는 것인지, 장기적이고 보편적인 현상인지 등을 구분할 근거를 제시한다고 볼 수 없다.
그렇게 된 이유는 논문 하나를 날로 먹으려고 했기 때문인 것으로 보인다.
reject.
만약 19세기 후반부터 2차대전까지 유럽, 미국, 일본, 아르헨티나 등의 인구구조와 성장률에 대한 조사 결과가 있다면 통계처럼 없이 그냥 보여주어도 저 논문보다 도움이 될 듯하다.
------------------
추가
위의 비판이 이해가 안 가는 사람들은 아래 글을 참고하기 바람.
Simpson's paradox 심슨의 패러독스
http://runmoneyrun.blogspot.kr/2014/12/simpsons-paradox.html
그룹별로 보는 것과 전체를 보는 것이 전혀 다른 결과를 보일 수 있음.
또 그룹별로 의미있는 것이 전체로 의미가 없을 수도 있고, 반대로 전체로 의미가 있는 것이 그룹별로는 의미가 없을 수도 있음.
다른 특성을 가진 자료나 다른 조건에서 얻어진 자료를 그냥 합치면 사실을 왜곡할 수 있음.
피하려면 '노력'이 필요함.
보고 있는 데이타가 같은 특성을 가진 그룹인지, 아니면 전혀 다른 여러 그룹의 합인지는 미리 알 수도 있지만, 사전에 전혀 알 수 없어서 미리 확인해야 하는 경우도 있음. 소위 pilot study가 필요한 경우.
그래도 위의 논문은 남이 만들어 놓은 데이타를 가져와서 분석만 하면 되는 것이라 큰 노력과 시간이 드는 것도 아님.