2018년 8월 31일 금요일

가계소득 통계 - 사과와 배


최저임금도, 소득주도성장도 신물이 난다.
그러나 답답해서 한번만 더 쓴다.

통계청장 경질 이후 개나 소나 통계를 가지고 떠들어도 그러다 말겠거니 했다.
그런데 점점 더 심해지는 것을 보니 뭔가 특별한 통계가 정말 필요한 모양이다.

"가계소득 조사대상 60% 다른데... 사과와 배 비교한 셈"
http://www.ohmynews.com/NWS_Web/View/at_pg_w.aspx?CNTN_CD=A0002467927&CMPT_CD=P0010&utm_source=naver&utm_medium=newsearch&utm_campaign=naver_news

사과와 배를 비교했으니 말이 안 된다는 소리다.
18년의 가계소득 통계를 17년 이전과 비교할 수 없다는 소리다.
지난 2분기 동안 벌어진 하위 40%의 소득감소는 믿을 수 없다는 소리다.
통계청장을 갈아치울만 했다는 소리다.

이게 왜 개소리인가?
좀 더 정확히 말해서, 개소리일 가능성이 왜 높은가?


1) 과거와 비교를 위해 반드시 패널조사를 할 필요는 없다.

대통령 선거에서 1000명에서 2000명의 표본으로 2천만 이상의 인구를 대표하는 지지율을 추정한다.
조사방법에 여러가지 논란이 존재하지만 표본 수는 저정도면 충분하다고 인정된다.
또한 같은 집단을 대상으로 지지율의 변화를 보는 패널조사가 더 정확한 예측결과를 내놓는다고 주장도 있지만, 반드시 그런 것도 아니다.
누가 어떻게 하는지에 따라서 미국에서도 다른 결과가 나오고, 작년의 한국 대선에서 패널조사를 한 경우는 아예 본 적이 없다.
그럼에도 불구하고 갤럽이든 리얼미터이든 같은 업체의 결과는 대개 일관성있는 결과를 보여주었다.
서로 다른 업체의 결과도 여러개가 존재하는 경우 한 업체의 연속적인 자료를 보는 것 못지않게 현실을 파악하는데 도움이 된다.

어떤 방법이 최선인지는 상황에 따라 다를 수 있다.
그러나 많은 경우에는 최선이 어떤 것인지도 알기 어렵다.

통계청, 한국은행의 통계 중에 어떤 것이 설문조사인지는 기억해도, 어떤 것이 패널을 구성해서 하는 조사인지는 기억도 나지 않는다.
이렇게 여기저기서 사기꾼들이 떠들 만한 일도 아니다.



2) 통계청 패널의 크기가 충분히 크다.

한국의 가구수는 2천만이 되지 않는다.
통계청의 표본은 8천에서 5천 사이에서 변동이 있었다고 하지만, 대선과 비교하면 충분히 많은 표본이다.
이 정도 크기면 조사시점마다 새로운 표본을 뽑아서 조사해도 충분히 과거와 비교할 수 있다.
소득에 따라 10분위로 나누고 또 근로자가구, 비근로자가구로 나누는 등 구분해야 할 변수가 많으니 더 필요할 수도 있다.
그러나 그런 것을 반영해서 그런 규모의 표본수를 유지했다면 17년, 18년의 변화가 큰 문제가 될 리 없다.



3) 전체 모집단의 성격이 빠르게 변하면 패널조사는 실제 상황을 반영하지 못할 수 있다.

모집단의 변화를 반영하기 위해 패널의 구성을 바꾸어도 그렇다는 것이다.
16년까지 조사마다 표본의 일부를 교체해서 일년에 1/3씩 표본의 구성이 바뀌었다고 한다.

왜 1/3을 바꾸었을까?

이렇게 바꾸면 1년 후에 2/3가 남고
2년 후에 2/3*2/3 = 4/9가 남고...

0      
1 2 3 66.7%
2 4 9 44.4%
3 8 27 29.6%
4 16 81 19.8%
5 32 243 13.2%
6 64 729 8.8%
7 128 2187 5.9%
8 256 6561 3.9%
9 512 19683 2.6%
10 1024 59049 1.7%

계산해보면 10년 후에 98% 이상이 바뀐다.
사과에서 배로 바뀌는데 10년이 걸리는 방식이다.

2/3씩 바꾸면 어떻게 되나?
1/3, 1/9. 1/27, 1/81, 1/243.
사과에서 배로 바뀌는데 5년이 걸린다.

이것들아 60%나 30%나 그렇게 큰 차이가 아니다.
바뀌는데 둘 다 오래 걸린다.


처음 패널이 대표성이 떨어지면 조사결과가 현실을 덜 반영할 수 있지만, 새로운 패널을 현실을 잘 반영하도록 선정해서 포함시키면 점점 차이가 감소한다.
또 어떤 사건이나 지속적인 변화로 인해 모집단의 구성에 큰 변화가 생겼는데 우연히 패널이 그 영향을 적게 받았을 경우에도 시간이 지나면 모집단의 변화를 반영하게 될 것이다.

그런 사건이 몇년에 걸쳐서 벌어지는 일이라면 저런 방식으로 충분히 대응이 될 것이다.



그러나 불가능한 경우도 발생할 수 있다.
극단적인 예를 들어보자.

내일 갑자기 통일이 되어서 남한과 북한이 합쳐진다면?
남북한 인구가 다 섞여버렸고, 말투도 구분할 수 없다면?

북한가구 1000만이 남한가구 2000만에 더해져서 모집단이 완전이 바뀌었지만, 표본이 현실을 반영하는데 최소 7-8년이 걸리니 나오는 통계는 대략 쓸모가 없다.

그럼 어떻게 할까?
1) 사과와 배를 비교하면 안 되니까 하던대로 한다.
2) 모집단의 변화를 반영할 수 있게 북한가구에서만 표본을 4000개 뽑아서 기존의 8000개에 더한다.
3) 남북한 합쳐서 표본을 새롭게 선정한다.


생각해보면 더 좋은 방법이 있을 것이다.
그러나 사과와 배정도 구분하는 자들의 방식만 피하면 어떤 방법도 상관없다고 본다.
어떤 쓰레기는 경질된 통계청장과 통계청을 대상으로 국정조사까지 해야된다고 지*을 한다.
적반하장도 유분수라더니...




-----------

문제가 된 통계청의 자료를 가지고 청와대에서 하청을 받았던 자들이 소득주도성장을 방어하기 위한 세미나를 했던 모양이다.
신임 통계청장도 거기서 발표를 했고 이후 감투를 썼다.

소득분배의 현황과 정책대응 토론회
https://www.kli.re.kr/kli/dscsnSeminarView.do?key=47&dscsnSeminarNo=2319






나는 자료집에 나오는 저 그림을 보고 충격을 받았다.

기존의 2703명에 새로 3907명을 추가해서 6610명의 표본을 대상으로 조사를 했다.
그런데 기존의 표본과 추가된 표본의 분포가 확연히 다르다.

소득의 양극화가 급격히 진행된 것을 추가된 표본의 분포만으로 알 수 있다.


이것을 저들은 표본의 선정에 문제가 있던 것으로 본다.




1분위에만 추가표본의 비중이 높은 것은 소득이 적은 가구가 추가표본에 많이 포함되었기 때문이라고 한다.
만약 이것이 어떤 의도를 가지고 그런 것으로 보인다면 문제를 삼을 수 있다.

ㅇ조사 과정에서 의도치 않은 결과인가?
- 표본 설계시에 소득을 기준으로 하지 않기 때문에 가능성이 있음 

위 자료를 만든 사람도 본문 중에 저렇게 언급한다.

전 통계청장이 비정치적인 인물이고 소득의 양극화를 예상하지 못했거나 예상하고도 진실을 보여주기 위해 주어진 조건에서 최선의 자료를 만든 것이라면, 이후에 누가 통계청장이 되어도 다른 결과를 얻기 어렵다.


그래서 나는 추가표본이 패널표본과 다른 것은, 기존 표본보다 훨씬 큰 추가표본의 문제가 아니라 모집단의 구성이 단시간에 급격히 변화한 증거라고 본다.
기존표본과 비교하면 추가표본에 나타나는 소득의 양극화는 매우 극적이다.

아니라고?

그것을 다시 조사해보지 않고 어떻게 아나?
다시 조사해도 그렇게 나오면 믿기는 하겠나?





논란 많던 1분기 자료이다.
자기들끼리는 세부자료를 전부 보고 있던 모양이다.
전체표본과 패널표본을 구분해서 분석해보니 저렇다고 한다.
전체표본에서 추가표본의 비중이 높으니, 추가표본과 패널표본이라고 해도 좋다.

논란이 되는 1분위에서 추가된 표본의 숫자를 다른 분위와 비슷하게 조정해서 봐도 2-5분위에서 소득감소(정체가 아니고)가 명확하다.



현 정권이 원하는 것은 최소한 패널표본이 보여주는 빨간 선일 것이다.
그래봐야 양극화는 마찬가지이지만, 소득이 전체적으로 증가하는 그림이다.
소득 전문가라는 신임 청장을 통해 저들이 원하는 결과가 나올 때까지 통계를 주무르면, 원하는 결과는 반드시 얻을 수 있을 것이다.
표본을 흡족할 때까지 변경할 수도 있고, 표본을 뽑는 방식도 변경할 수 있고, 통계청장 전공이라는 소득 계산 방식을 바꿀 수도 있다.

그러나 무슨 짓을 해도 진실을 가릴 수는 없기 때문에 다시 한번 최저임금이 10% 인상되는 내년 1분기 이후 고용지표 등 다른 통계에서 다시 한번 참상이 펼쳐질 것이다.

저들은 자신들의 무덤을 파고 있다.
나는 그들을 지지하는 2-5분위의 국민을 위해서라도 저들이 소득주도성장이라는 무당짓을  그만 두기 바란다.



--------------
추가

"표본 오류로 소득격차↑"…靑·與 '편의적 해석' 진실은
https://news.naver.com/main/read.nhn?oid=421&sid1=101&aid=0003567229&mid=shm&mode=LSD&nh=20180902062633

오랫만에 보는 볼만한 기사




댓글 12개:

  1. 보건사회연구원 들어가셔서 자료 보셧군요...
    강신욱 신임 청장 역시 홍장표 경제수석과 같은 라인입니다.
    ILO에 김대중 노무현 정부때 자문 위원으로 활동하셧던 이 정부 경제정책의 원천인 사람들입니다.

    매번 ILO에서도 소득주도 성장을 권고했다면서 언론플레이 하는데...
    http://news.tvchosun.com/site/data/html_dir/2018/08/29/2018082990037.html
    OECD나 ILO 두곳모두 임금주도성장 개념은 있지만 소득 주도 성장이란 말은 없다고합니다.

    실제로 주변에 경제학 교수님들에게 물어보니...
    ILO주류 이론이 아니라 홍장표 전 경제수석을 필두로 자기들끼리 논문쓰고 발표하고 했답니다.
    그걸 장하성 정책실장이 인용해서 저러구잇는거구요...

    하나씩 하나씩 알수록 참 무섭습니다.
    지표가 급속하게 악화되니 하는 말이...소득주도성장을 더 속도 있게 추진하라는 역설이라고합니다...

    답글삭제
    답글
    1. 찾아봤지만 임금주도성장도 이해가 안 되기는 마찬가지입니다.
      저 집단 전체가 사이비종교 추종자처럼 보입니다.

      삭제
  2. 이번 정권이 참 아쉽습니다.
    촛불 민심에 따라 적폐만 깨끗하게 청산하고 남북문제만 잘 해결해도....
    그 업적이나 국민들의 성원이 대단할텐데...

    왜 이들이 왜이렇게 무리수를 주고 있나?? 곰곰히 생각해봤는데....
    결국은 과유불급이지 않겟습니까??
    이들이 집권할때 세계 경기도 호황이고 반도체를 필두로한 한국 경제도 언제보다도 좋았고
    국정지지율도 높앗고 그러다보니 뻔히 실패(?)할지 알면서도 어느때보다 외부변수에 묻어서
    성공한것 처럼 보일수 있는 절호의 기회였지 않나싶습니다...

    그리고 만약에 성공한 것처럼 보이기만 한다면...
    대한 민국 경제사에 족적을 남길 업적이 되어서 박정희때보다 더 높게 평가받을수 있으니...
    즉 실패해도 잃는것 보다는 성공까지는 아니더라도 실패만 하지않으면 리워드가 수십배니...
    민주당 20년 정권의 발판이자 지난 10년간 눌러있던 진보성향의 학자,방송인등 인사들의 입신양명 기회까지...
    무조건 해볼 만한 도박이었지 않나 싶습니다...

    답글삭제
    답글
    1. 경제가 불을 뿜고 있었다면 최저임금인상의 충격이 완충될 수 있겠지만, 작년의 수출호황으로도 그런 정도는 아니었다고 봅니다. 이전 정권들에서 최저임금이 높게 나타났던 시기는 명목성장률이 현재의 두배였고 최저임금의 수준자체도 현재보다 훨씬 낮았기 때문에 가능했던 것이라서 처음부터 무리한 욕심이었다는 생각입니다.

      http://runmoneyrun.blogspot.com/2017/07/164.html

      최저임금인상으로 발생한 불균형과 가계부채문제까지 한번에 해결할 방법은 올해 내년에 합쳐서 20%의 물가상승이 나오는 수밖에 없을 것 같습니다. 성장률이 그렇게 나오면 더 좋겠지만 그럴리가 없으니, 최저임금수준의 소득 증가가 없던 가계에는 불행한 일이겠지만 말입니다.

      삭제
  3. 걱정할 단계를 넘어 이제는 화가납니다. -_-

    답글삭제
  4. 상식적으로 경제를 몰라도 이번 정권의 정책의 결과로 소득양극화는 당연한거지요...
    자영업장을 7개 운영하는 입장에서 쉽게 풀어보면...

    1.최저임금의 급격한 상승은

    2.과당경쟁으로 인해 매출은 늘지않고 인건비 급증으로 인해 비용만 증가 시키므로 수익성 악화

    3.겨우 자기 인건비 따먹는 영세한 한계 사업자들의 시장에서 퇴출

    4.결국은 좋은 입지에 위치한 높은 매출을 올리는 영업장들은 이전에도 최저임금 이상으로
    인건비를 지급하고 영업하였고 매출이 높기에 오히려 정책(일자리안정자금)의 과실을 그대로 누리면서
    퇴출된 사업자들의 파이를 추가적으로 가지면서 매출 상승으로 양극화 심화

    뜻하던 뜻하지 않았던 앞에서는 분배를 외치지만 이건 박정희 시절 대기업 위주 정책을 편거처럼
    현재 자영업 시장에서 규모큰 사업장 위주 정책이라는 것은 부정할 수 가 없네요

    답글삭제
    답글
    1. 한국은행 총재는 최저임금의 영향을 조심스럽게 인정하네요. 임기보장이니 바꾸지는 않겠죠.

      "총재는 31일 서울 중구 한은 본관에서 열린 금융통화위원회 본회의 직후 기자간담회를 갖고 "현재 고용 부진 상황은 업황 부진과 구조조정, 인구구조변화 등이 복합적 원인으로 작용했다"면서도 "최저임금이 금년 큰 폭으로 인상되면서 고용에 부정적인 영향을 준 것은 사실"이라고 말했다.
      이 총재는 다만 "얼마만큼 영향을 줬는지 개량적으로 판단하기는 어렵다"며 "최저임금이 워낙 민감인 이슈가 돼 말씀드리기 조심스럽다"고 덧붙였다."

      삭제
  5. 원래 소득주도성장하면 중산층이 생기고 최하층민이 노동시장에서 탈락하는 구조고 시간이 지나야 중산층 돈이 최하층민에 돌아가는 구조인데 (흑인 한국인 관계처럼) , 왜 손가락으로 하늘을 가릴라고 하는지 모르겠습니다.

    답글삭제
    답글
    1. 지지율이 높아서 거칠 것이 없나 봅니다.

      삭제
  6. 통계청이 샘플링 방법을 공개하진 않았으나, 가계소득 분위의 대표성을 유지하기 위해 최소한의 bias로 제대로 조사하고 있다면 아마도 아래와 같이 할 겁니다. 일단 통계청이 이런 조사를 샘플링으로 하는 이유 자체가 각 분위별 소득이라는 '모수'를 모르기 때문이고, 그렇다면 실상 모수 자체를 제대로 알고 있는 인구주택총조사 등을 기반으로 해서 샘플링 룰을 짰을거라고 봐야합니다.

    1. 전체 인구를 지역/연령/성별 등으로 쪼개서 인구 숫자 비례로 랜덤 샘플링을 한다
    2. 해당 연령대별로 소득을 구한 뒤 해당 인구들을 각 소득분위로 분배한다 (즉 위 기준으로 취한 랜덤 샘플을 이후 소득분위로 다시 분배)

    이렇게 추출했다고 가정하면, 주인장 말씀대로 신규샘플의 상당부분이 1분위에 잡힌 것은 소득분배 변화의 결과이지, 샘플링 오류로 통계가 왜곡되었다 해석할 것은 아닐겁니다. 부가가치 창출능력이 상대적으로 부족한 계층들이 특정 연령대에 집중되었다는 증거겠지요.

    물론 혹자의 말대로 통계청이 악의를 가지고 샘플을 꼬아놨을수도 있는데, MB때도 박근혜때도 굳건하던 통계청이 '소통' 잘하는 민주정부에서, 그것도 현 정권이 직접 꼽은 사람이 정부에게 사기를 쳤다? ㅎㅎ 차라리 샘플링 우연의 연속으로 '그런데 그것이 실제로 일어났습니다'하는 상황이라고 하면 이해를 하겠네요.

    물론 저쪽의 의견인 '1인 가구도 포함해야 한다'는 일리가 있습니다. 하지만 1인가구들의 재정상태를 생각해보면 1인가구 포함시 소득분배 지표는 개선되지 않을 가능성이 높아보입니다. 무엇보다도 1년만에 1인가구의 수가 폭발적으로 늘진 않았으니, 그런 논리라면 자신들의 1년전 자료도 부정해야 할겁니다.

    답글삭제
    답글
    1. 자세한 답글 감사합니다.
      표본 설계시 소득은 고려하지 않는다고 위자료를 만든 사람이 언급하고 있습니다. 세대주 나이, 가구원수는 기본적으로 고려할텐데 지역이나 다른 변수들을 어떻게 고려하는지는 모르겠네요.
      소득을 추적하는 조사에서 과거의 다른 데이타를 기반으로 모집단의 소득 분포를 가정해서 샘플을 뽑거나 자료를 표준화하는 것이 정당화될 수 있는지 의심스럽지만, 만약 그렇게 한다면 통계 제작자의 의도가 반영될 가능성이 높아질 것 같네요.
      많은 사람들이 소득통계의 결과뿐 아니라 제작과정에 엄청난 관심을 갖게 되었고 신임 청장의 전공분야라니 3분기 이후 나오는 데이타와 딸린 참고자료가 압권일 것 같다는 기대가 크네요.

      삭제