최저임금도, 소득주도성장도 신물이 난다.
그러나 답답해서 한번만 더 쓴다.
통계청장 경질 이후 개나 소나 통계를 가지고 떠들어도 그러다 말겠거니 했다.
그런데 점점 더 심해지는 것을 보니 뭔가 특별한 통계가 정말 필요한 모양이다.
"가계소득 조사대상 60% 다른데... 사과와 배 비교한 셈"
http://www.ohmynews.com/NWS_Web/View/at_pg_w.aspx?CNTN_CD=A0002467927&CMPT_CD=P0010&utm_source=naver&utm_medium=newsearch&utm_campaign=naver_news
사과와 배를 비교했으니 말이 안 된다는 소리다.
18년의 가계소득 통계를 17년 이전과 비교할 수 없다는 소리다.
지난 2분기 동안 벌어진 하위 40%의 소득감소는 믿을 수 없다는 소리다.
통계청장을 갈아치울만 했다는 소리다.
이게 왜 개소리인가?
좀 더 정확히 말해서, 개소리일 가능성이 왜 높은가?
1) 과거와 비교를 위해 반드시 패널조사를 할 필요는 없다.
대통령 선거에서 1000명에서 2000명의 표본으로 2천만 이상의 인구를 대표하는 지지율을 추정한다.
조사방법에 여러가지 논란이 존재하지만 표본 수는 저정도면 충분하다고 인정된다.
또한 같은 집단을 대상으로 지지율의 변화를 보는 패널조사가 더 정확한 예측결과를 내놓는다고 주장도 있지만, 반드시 그런 것도 아니다.
누가 어떻게 하는지에 따라서 미국에서도 다른 결과가 나오고, 작년의 한국 대선에서 패널조사를 한 경우는 아예 본 적이 없다.
그럼에도 불구하고 갤럽이든 리얼미터이든 같은 업체의 결과는 대개 일관성있는 결과를 보여주었다.
서로 다른 업체의 결과도 여러개가 존재하는 경우 한 업체의 연속적인 자료를 보는 것 못지않게 현실을 파악하는데 도움이 된다.
어떤 방법이 최선인지는 상황에 따라 다를 수 있다.
그러나 많은 경우에는 최선이 어떤 것인지도 알기 어렵다.
통계청, 한국은행의 통계 중에 어떤 것이 설문조사인지는 기억해도, 어떤 것이 패널을 구성해서 하는 조사인지는 기억도 나지 않는다.
이렇게 여기저기서 사기꾼들이 떠들 만한 일도 아니다.
2) 통계청 패널의 크기가 충분히 크다.
한국의 가구수는 2천만이 되지 않는다.
통계청의 표본은 8천에서 5천 사이에서 변동이 있었다고 하지만, 대선과 비교하면 충분히 많은 표본이다.
이 정도 크기면 조사시점마다 새로운 표본을 뽑아서 조사해도 충분히 과거와 비교할 수 있다.
소득에 따라 10분위로 나누고 또 근로자가구, 비근로자가구로 나누는 등 구분해야 할 변수가 많으니 더 필요할 수도 있다.
그러나 그런 것을 반영해서 그런 규모의 표본수를 유지했다면 17년, 18년의 변화가 큰 문제가 될 리 없다.
3) 전체 모집단의 성격이 빠르게 변하면 패널조사는 실제 상황을 반영하지 못할 수 있다.
모집단의 변화를 반영하기 위해 패널의 구성을 바꾸어도 그렇다는 것이다.
16년까지 조사마다 표본의 일부를 교체해서 일년에 1/3씩 표본의 구성이 바뀌었다고 한다.
왜 1/3을 바꾸었을까?
이렇게 바꾸면 1년 후에 2/3가 남고
2년 후에 2/3*2/3 = 4/9가 남고...
0 | | | |
1 | 2 | 3 | 66.7% |
2 | 4 | 9 | 44.4% |
3 | 8 | 27 | 29.6% |
4 | 16 | 81 | 19.8% |
5 | 32 | 243 | 13.2% |
6 | 64 | 729 | 8.8% |
7 | 128 | 2187 | 5.9% |
8 | 256 | 6561 | 3.9% |
9 | 512 | 19683 | 2.6% |
10 | 1024 | 59049 | 1.7% |
계산해보면 10년 후에 98% 이상이 바뀐다.
사과에서 배로 바뀌는데 10년이 걸리는 방식이다.
2/3씩 바꾸면 어떻게 되나?
1/3, 1/9. 1/27, 1/81, 1/243.
사과에서 배로 바뀌는데 5년이 걸린다.
이것들아 60%나 30%나 그렇게 큰 차이가 아니다.
바뀌는데 둘 다 오래 걸린다.
처음 패널이 대표성이 떨어지면 조사결과가 현실을 덜 반영할 수 있지만, 새로운 패널을 현실을 잘 반영하도록 선정해서 포함시키면 점점 차이가 감소한다.
또 어떤 사건이나 지속적인 변화로 인해 모집단의 구성에 큰 변화가 생겼는데 우연히 패널이 그 영향을 적게 받았을 경우에도 시간이 지나면 모집단의 변화를 반영하게 될 것이다.
그런 사건이 몇년에 걸쳐서 벌어지는 일이라면 저런 방식으로 충분히 대응이 될 것이다.
그러나 불가능한 경우도 발생할 수 있다.
극단적인 예를 들어보자.
내일 갑자기 통일이 되어서 남한과 북한이 합쳐진다면?
남북한 인구가 다 섞여버렸고, 말투도 구분할 수 없다면?
북한가구 1000만이 남한가구 2000만에 더해져서 모집단이 완전이 바뀌었지만, 표본이 현실을 반영하는데 최소 7-8년이 걸리니 나오는 통계는 대략 쓸모가 없다.
그럼 어떻게 할까?
1) 사과와 배를 비교하면 안 되니까 하던대로 한다.
2) 모집단의 변화를 반영할 수 있게 북한가구에서만 표본을 4000개 뽑아서 기존의 8000개에 더한다.
3) 남북한 합쳐서 표본을 새롭게 선정한다.
생각해보면 더 좋은 방법이 있을 것이다.
그러나 사과와 배정도 구분하는 자들의 방식만 피하면 어떤 방법도 상관없다고 본다.
어떤 쓰레기는 경질된 통계청장과 통계청을 대상으로 국정조사까지 해야된다고 지*을 한다.
적반하장도 유분수라더니...
-----------
문제가 된 통계청의 자료를 가지고 청와대에서 하청을 받았던 자들이 소득주도성장을 방어하기 위한 세미나를 했던 모양이다.
신임 통계청장도 거기서 발표를 했고 이후 감투를 썼다.
소득분배의 현황과 정책대응 토론회
https://www.kli.re.kr/kli/dscsnSeminarView.do?key=47&dscsnSeminarNo=2319
나는 자료집에 나오는 저 그림을 보고 충격을 받았다.
기존의 2703명에 새로 3907명을 추가해서 6610명의 표본을 대상으로 조사를 했다.
그런데 기존의 표본과 추가된 표본의 분포가 확연히 다르다.
소득의 양극화가 급격히 진행된 것을 추가된 표본의 분포만으로 알 수 있다.
이것을 저들은 표본의 선정에 문제가 있던 것으로 본다.
1분위에만 추가표본의 비중이 높은 것은 소득이 적은 가구가 추가표본에 많이 포함되었기 때문이라고 한다.
만약 이것이 어떤 의도를 가지고 그런 것으로 보인다면 문제를 삼을 수 있다.
ㅇ조사 과정에서 의도치 않은 결과인가?
- 표본 설계시에 소득을 기준으로 하지 않기 때문에 가능성이 있음
위 자료를 만든 사람도 본문 중에 저렇게 언급한다.
전 통계청장이 비정치적인 인물이고 소득의 양극화를 예상하지 못했거나 예상하고도 진실을 보여주기 위해 주어진 조건에서 최선의 자료를 만든 것이라면, 이후에 누가 통계청장이 되어도 다른 결과를 얻기 어렵다.
그래서 나는 추가표본이 패널표본과 다른 것은, 기존 표본보다 훨씬 큰 추가표본의 문제가 아니라 모집단의 구성이 단시간에 급격히 변화한 증거라고 본다.
기존표본과 비교하면 추가표본에 나타나는 소득의 양극화는 매우 극적이다.
아니라고?
그것을 다시 조사해보지 않고 어떻게 아나?
다시 조사해도 그렇게 나오면 믿기는 하겠나?
논란 많던 1분기 자료이다.
자기들끼리는 세부자료를 전부 보고 있던 모양이다.
전체표본과 패널표본을 구분해서 분석해보니 저렇다고 한다.
전체표본에서 추가표본의 비중이 높으니, 추가표본과 패널표본이라고 해도 좋다.
논란이 되는 1분위에서 추가된 표본의 숫자를 다른 분위와 비슷하게 조정해서 봐도 2-5분위에서 소득감소(정체가 아니고)가 명확하다.
현 정권이 원하는 것은 최소한 패널표본이 보여주는 빨간 선일 것이다.
그래봐야 양극화는 마찬가지이지만, 소득이 전체적으로 증가하는 그림이다.
소득 전문가라는 신임 청장을 통해 저들이 원하는 결과가 나올 때까지 통계를 주무르면, 원하는 결과는 반드시 얻을 수 있을 것이다.
표본을 흡족할 때까지 변경할 수도 있고, 표본을 뽑는 방식도 변경할 수 있고, 통계청장 전공이라는 소득 계산 방식을 바꿀 수도 있다.
그러나 무슨 짓을 해도 진실을 가릴 수는 없기 때문에 다시 한번 최저임금이 10% 인상되는 내년 1분기 이후 고용지표 등 다른 통계에서 다시 한번 참상이 펼쳐질 것이다.
저들은 자신들의 무덤을 파고 있다.
나는 그들을 지지하는 2-5분위의 국민을 위해서라도 저들이 소득주도성장이라는 무당짓을 그만 두기 바란다.
--------------
추가
"표본 오류로 소득격차↑"…靑·與 '편의적 해석' 진실은
https://news.naver.com/main/read.nhn?oid=421&sid1=101&aid=0003567229&mid=shm&mode=LSD&nh=20180902062633
오랫만에 보는 볼만한 기사