2018년 8월 31일 금요일

경기지수, 재고순환, kospi, 금리차 20180831



전에는 통계청의 경기선행, 동행, 후행지수가 발표되면 확인하고 그림을 올리기도 했다.
그러나 몇년 전 개편 이후로 선행지수가 고자가 된 뒤로 관심이 떨어졌었다.
최근에는 많은 사람들이 통계청의 경기선행지수보다 oecd의 cli를 더 중요한 지표로 생각하는 듯하다.




따온 그림이다.
선행지수가 동행지수에 선행하나?
내가 보기에 전혀 아니다.
오히려 16년 초부터 동행지수가 선행지수를 앞서고 있다.

요점은 선행지수가 경기에 선행한다고 생각하지 말라는 것이다.

왜 저런 일이 발생했을까? 어떻게 고치면 좋을까?
그런 것은 통계청의 전문가에게. 혹은 새 청장에게.



선행지수 구성요소 중에 kospi와 장단기금리차는 실시간으로 확인가능하고, 통계작성 중에 나타날 수 있는 잠재적인 오류에 노출될 가능성도 적다.
더구나 각각을 보는 것만으로도 충분히 경기선행지수를 대신할 수 있다.
또한 전 세계의 많은 경기선행지수에 두 개는 거의 빠지지 않고 포함되는 요소이다.

전문가의 손이 많이 닿은 경기선행지수보다 날 것으로 보는 것이 불리하지 않다는 것이다.
'이없으면 잇몸으로'라고 할 수 있지만, 잇몸이 이보다 약하지 않은 경우이다.


선행지수를 구성하는 재고순환은 몇년 전까지만 해도 매우 경기를 잘 선반영하는 지표였다.
한 두 달 나중에 봐도 좋은 훌륭한 지표였는데, 알지 못 하는 이유로 최근 고장이 나버렸다.

어떤이는 비중이 커진 반도체 산업의 출하, 재고 관련 지수의 대표성이 떨어졌다고 한다.
산업별 생산, 재고, 출하 지수가 몇 년 간의 산업의 변화를 제대로 반영하지 못하는 상황을 얘기하는데, 의심은 가나 확인할 길은 없다.





경기선행지수 전년동월비를 제조업 재고순환과 비교한 것이다.
약 2015년까지 잘 동행한다.
그런데 16년 이후 재고순환이 앞서기 시작하더니 18년 이후 지금까지 반대방향으로 진행하고 있다.





재고순환 지표를 kospi 전년동월비와 비교한 것이다.
같은 상황이다.
재고순환이 앞서기 시작하다가 지금은 반대방향이다.

출하나 재고 중 어느 지표가 큰 영향을 주었을까?




재고 먼저 확인해 보자.
여기서 재고는 역축이다. 그래야 선행성을 유지한다.

마찬가지로 17년 앞서서 꺾이고 18년에 상향전환했다.



출하는 싸이클이 재고보다 약하게 나타난다.
그러나 17년 후반 이후의 하락과 상승은 재고와 유사한 움직임이다.


만약 재고순환지표가 현실과 괴리된 것이 아니고, 현실을 정말 선행해서 반영하고 있다면 향후 확인할 수 있을 것이다.
그러나 아직은 고장난 것으로 보고 의심을 거두지 말아야 한다.




선행지수, 동행지수, kospi를 전년비로 비교한 것이다.

2017년 이후 동행지수 > 선행지수 > 코스피 순으로 고점을 확인했다.

전년비로 보면 순환변동치와 달리 2013년 전후까지는 선행지수가 동행지수에 선행하고, 코스피와는 함께 간다.






금리차와 코스피는 17년 말에 고점을 보이고 꺾이거나 횡보중이다.
둘다 경기선행지수와 동조화되어 있다.



요약

금리차, 코스피yoy, 경기선행지수yoy는 경기에 선행하는지는 확신을 갖기 어려우나, 최근까지 동조화되어 있다.
경기동행지수는 경기선행지수에 앞서 달리고 있다. 뭥미.
역전의 용사 재고순환은 알 수 없는 이유로 경기와 괴리되어 있다.







가계소득 통계 - 사과와 배


최저임금도, 소득주도성장도 신물이 난다.
그러나 답답해서 한번만 더 쓴다.

통계청장 경질 이후 개나 소나 통계를 가지고 떠들어도 그러다 말겠거니 했다.
그런데 점점 더 심해지는 것을 보니 뭔가 특별한 통계가 정말 필요한 모양이다.

"가계소득 조사대상 60% 다른데... 사과와 배 비교한 셈"
http://www.ohmynews.com/NWS_Web/View/at_pg_w.aspx?CNTN_CD=A0002467927&CMPT_CD=P0010&utm_source=naver&utm_medium=newsearch&utm_campaign=naver_news

사과와 배를 비교했으니 말이 안 된다는 소리다.
18년의 가계소득 통계를 17년 이전과 비교할 수 없다는 소리다.
지난 2분기 동안 벌어진 하위 40%의 소득감소는 믿을 수 없다는 소리다.
통계청장을 갈아치울만 했다는 소리다.

이게 왜 개소리인가?
좀 더 정확히 말해서, 개소리일 가능성이 왜 높은가?


1) 과거와 비교를 위해 반드시 패널조사를 할 필요는 없다.

대통령 선거에서 1000명에서 2000명의 표본으로 2천만 이상의 인구를 대표하는 지지율을 추정한다.
조사방법에 여러가지 논란이 존재하지만 표본 수는 저정도면 충분하다고 인정된다.
또한 같은 집단을 대상으로 지지율의 변화를 보는 패널조사가 더 정확한 예측결과를 내놓는다고 주장도 있지만, 반드시 그런 것도 아니다.
누가 어떻게 하는지에 따라서 미국에서도 다른 결과가 나오고, 작년의 한국 대선에서 패널조사를 한 경우는 아예 본 적이 없다.
그럼에도 불구하고 갤럽이든 리얼미터이든 같은 업체의 결과는 대개 일관성있는 결과를 보여주었다.
서로 다른 업체의 결과도 여러개가 존재하는 경우 한 업체의 연속적인 자료를 보는 것 못지않게 현실을 파악하는데 도움이 된다.

어떤 방법이 최선인지는 상황에 따라 다를 수 있다.
그러나 많은 경우에는 최선이 어떤 것인지도 알기 어렵다.

통계청, 한국은행의 통계 중에 어떤 것이 설문조사인지는 기억해도, 어떤 것이 패널을 구성해서 하는 조사인지는 기억도 나지 않는다.
이렇게 여기저기서 사기꾼들이 떠들 만한 일도 아니다.



2) 통계청 패널의 크기가 충분히 크다.

한국의 가구수는 2천만이 되지 않는다.
통계청의 표본은 8천에서 5천 사이에서 변동이 있었다고 하지만, 대선과 비교하면 충분히 많은 표본이다.
이 정도 크기면 조사시점마다 새로운 표본을 뽑아서 조사해도 충분히 과거와 비교할 수 있다.
소득에 따라 10분위로 나누고 또 근로자가구, 비근로자가구로 나누는 등 구분해야 할 변수가 많으니 더 필요할 수도 있다.
그러나 그런 것을 반영해서 그런 규모의 표본수를 유지했다면 17년, 18년의 변화가 큰 문제가 될 리 없다.



3) 전체 모집단의 성격이 빠르게 변하면 패널조사는 실제 상황을 반영하지 못할 수 있다.

모집단의 변화를 반영하기 위해 패널의 구성을 바꾸어도 그렇다는 것이다.
16년까지 조사마다 표본의 일부를 교체해서 일년에 1/3씩 표본의 구성이 바뀌었다고 한다.

왜 1/3을 바꾸었을까?

이렇게 바꾸면 1년 후에 2/3가 남고
2년 후에 2/3*2/3 = 4/9가 남고...

0      
1 2 3 66.7%
2 4 9 44.4%
3 8 27 29.6%
4 16 81 19.8%
5 32 243 13.2%
6 64 729 8.8%
7 128 2187 5.9%
8 256 6561 3.9%
9 512 19683 2.6%
10 1024 59049 1.7%

계산해보면 10년 후에 98% 이상이 바뀐다.
사과에서 배로 바뀌는데 10년이 걸리는 방식이다.

2/3씩 바꾸면 어떻게 되나?
1/3, 1/9. 1/27, 1/81, 1/243.
사과에서 배로 바뀌는데 5년이 걸린다.

이것들아 60%나 30%나 그렇게 큰 차이가 아니다.
바뀌는데 둘 다 오래 걸린다.


처음 패널이 대표성이 떨어지면 조사결과가 현실을 덜 반영할 수 있지만, 새로운 패널을 현실을 잘 반영하도록 선정해서 포함시키면 점점 차이가 감소한다.
또 어떤 사건이나 지속적인 변화로 인해 모집단의 구성에 큰 변화가 생겼는데 우연히 패널이 그 영향을 적게 받았을 경우에도 시간이 지나면 모집단의 변화를 반영하게 될 것이다.

그런 사건이 몇년에 걸쳐서 벌어지는 일이라면 저런 방식으로 충분히 대응이 될 것이다.



그러나 불가능한 경우도 발생할 수 있다.
극단적인 예를 들어보자.

내일 갑자기 통일이 되어서 남한과 북한이 합쳐진다면?
남북한 인구가 다 섞여버렸고, 말투도 구분할 수 없다면?

북한가구 1000만이 남한가구 2000만에 더해져서 모집단이 완전이 바뀌었지만, 표본이 현실을 반영하는데 최소 7-8년이 걸리니 나오는 통계는 대략 쓸모가 없다.

그럼 어떻게 할까?
1) 사과와 배를 비교하면 안 되니까 하던대로 한다.
2) 모집단의 변화를 반영할 수 있게 북한가구에서만 표본을 4000개 뽑아서 기존의 8000개에 더한다.
3) 남북한 합쳐서 표본을 새롭게 선정한다.


생각해보면 더 좋은 방법이 있을 것이다.
그러나 사과와 배정도 구분하는 자들의 방식만 피하면 어떤 방법도 상관없다고 본다.
어떤 쓰레기는 경질된 통계청장과 통계청을 대상으로 국정조사까지 해야된다고 지*을 한다.
적반하장도 유분수라더니...




-----------

문제가 된 통계청의 자료를 가지고 청와대에서 하청을 받았던 자들이 소득주도성장을 방어하기 위한 세미나를 했던 모양이다.
신임 통계청장도 거기서 발표를 했고 이후 감투를 썼다.

소득분배의 현황과 정책대응 토론회
https://www.kli.re.kr/kli/dscsnSeminarView.do?key=47&dscsnSeminarNo=2319






나는 자료집에 나오는 저 그림을 보고 충격을 받았다.

기존의 2703명에 새로 3907명을 추가해서 6610명의 표본을 대상으로 조사를 했다.
그런데 기존의 표본과 추가된 표본의 분포가 확연히 다르다.

소득의 양극화가 급격히 진행된 것을 추가된 표본의 분포만으로 알 수 있다.


이것을 저들은 표본의 선정에 문제가 있던 것으로 본다.




1분위에만 추가표본의 비중이 높은 것은 소득이 적은 가구가 추가표본에 많이 포함되었기 때문이라고 한다.
만약 이것이 어떤 의도를 가지고 그런 것으로 보인다면 문제를 삼을 수 있다.

ㅇ조사 과정에서 의도치 않은 결과인가?
- 표본 설계시에 소득을 기준으로 하지 않기 때문에 가능성이 있음 

위 자료를 만든 사람도 본문 중에 저렇게 언급한다.

전 통계청장이 비정치적인 인물이고 소득의 양극화를 예상하지 못했거나 예상하고도 진실을 보여주기 위해 주어진 조건에서 최선의 자료를 만든 것이라면, 이후에 누가 통계청장이 되어도 다른 결과를 얻기 어렵다.


그래서 나는 추가표본이 패널표본과 다른 것은, 기존 표본보다 훨씬 큰 추가표본의 문제가 아니라 모집단의 구성이 단시간에 급격히 변화한 증거라고 본다.
기존표본과 비교하면 추가표본에 나타나는 소득의 양극화는 매우 극적이다.

아니라고?

그것을 다시 조사해보지 않고 어떻게 아나?
다시 조사해도 그렇게 나오면 믿기는 하겠나?





논란 많던 1분기 자료이다.
자기들끼리는 세부자료를 전부 보고 있던 모양이다.
전체표본과 패널표본을 구분해서 분석해보니 저렇다고 한다.
전체표본에서 추가표본의 비중이 높으니, 추가표본과 패널표본이라고 해도 좋다.

논란이 되는 1분위에서 추가된 표본의 숫자를 다른 분위와 비슷하게 조정해서 봐도 2-5분위에서 소득감소(정체가 아니고)가 명확하다.



현 정권이 원하는 것은 최소한 패널표본이 보여주는 빨간 선일 것이다.
그래봐야 양극화는 마찬가지이지만, 소득이 전체적으로 증가하는 그림이다.
소득 전문가라는 신임 청장을 통해 저들이 원하는 결과가 나올 때까지 통계를 주무르면, 원하는 결과는 반드시 얻을 수 있을 것이다.
표본을 흡족할 때까지 변경할 수도 있고, 표본을 뽑는 방식도 변경할 수 있고, 통계청장 전공이라는 소득 계산 방식을 바꿀 수도 있다.

그러나 무슨 짓을 해도 진실을 가릴 수는 없기 때문에 다시 한번 최저임금이 10% 인상되는 내년 1분기 이후 고용지표 등 다른 통계에서 다시 한번 참상이 펼쳐질 것이다.

저들은 자신들의 무덤을 파고 있다.
나는 그들을 지지하는 2-5분위의 국민을 위해서라도 저들이 소득주도성장이라는 무당짓을  그만 두기 바란다.



--------------
추가

"표본 오류로 소득격차↑"…靑·與 '편의적 해석' 진실은
https://news.naver.com/main/read.nhn?oid=421&sid1=101&aid=0003567229&mid=shm&mode=LSD&nh=20180902062633

오랫만에 보는 볼만한 기사