Pages

2014년 3월 4일 화요일

pmi, kospi, fact, knowledge


ism pmi 와 미국 GDP는 관련성이 높다.
또한 ism pmi 와 kospi는 관련성이 높다.

통계학을 처음 배우는 사람들이 꼭 알아야 할 것이 상관관계와 인과관계는 구분해야 된다는 것이다.
대개는 거기까지만 공부한다. 한학기 또는 한권.
그런데 데이타 다루는 일을 20년 넘게 해도, 할 수 있는 얘기가 보통은 딱 거기까지이다.

그럼 인과관계를 어떻게 알 수 있나?
데이타를 넣으면 신통력을 가진 특별한 패키지를 돌려서 인과관계를 찾을 수 있나?
그럴 리가 없다.

요새는 빅데이타에 대해 비슷한 환상을 가진 사람들이 있다고 하는데 아직 한국에서는 그런 분석이 대중적이지도 않은 것 같으니...
뭐든 기계를 돌려서 주장할 만한 신기한 결론이 뚝 떨어지기를 기대하는 경우에, 대개는 의미없거나 믿을 수 없는 쓰레기가 나온다.
연구방법론 등에 관련한 책에는 좀 더 자세히 나와있기도 할 것이다.
그러나 생각나는 대로 나열해 본다.

일단 가설을 세운다. 천재가 아니면 상식적으로.
다음 가설을 뒷받침하는 증거를 모은다.
서로 독립적인 증거가 3가지가 쌓이면 일단 무언가를 주장한다.
2개 이하에서 주장하면 게으름뱅이 소리를 들을 수 있다.
신뢰도가 약한 증거로 주장하면 바보나 사기꾼 소리를 들을 수 있다.
갯수는 세기가 쉽지만, 신뢰도는 어떻게 판단하나?
그건 대개 말로 할 수 있는 것은 적고, 몸과 시간으로 배운다.

증거가 하나씩 더 추가될 때마다 확신의 강도가 기하급수적으로 증가하고, 목소리를 높일 수 있다.
반대 증거가 생기면 저울질을 시작한다.
비슷한 신뢰성을 가진 비슷한 갯수의 대립되는 증거가 보이면 가설을 장점 폐기한다.
그렇다고 그전에 한 말이 거짓말인가? 아니다.
왜? 그게 지식이 형성되는 과정이다.
그래서 지식은 자체보다 형성되는 과정이 중요하고, 출처가 중요하다.
내 머릿 속의 지식이든, 전체 사회의 지식이든 다르지 않다.

그러다 보면 몇개월짜리, 몇년짜리 사실과 그보다 오래 유지될만한 사실을 구분할 수 있다.
그러나 대부분의 사람들은 '우연히' 처음에 믿던 바를 그냥 믿는다.
기존의 지식과 부합하는 사실을 흡수하고, 대치되는 사실을 배격한다.
대개는 다르게 지식을 쌓아가는 방법을 모르기 때문이다.

내가 가진 지식이 의미가 있거나, 쓸모가 있으려면 끊임없이 생겨나는 새로운 증거로 시험을 해야한다. 그래서 검증을 통과해야 한다.
만약 새로운 사실이 기존의 나의 생각과 부합하지 않는다면 변화가 앞에 놓여 있을 가능성이 높다.

투자자로서는 기회가 발생하고 있는 것이다.






pmi가 내려가고 있는지, 딸꾹질을 한 번 한 것인지는 아직 알 수 없다.
그러나 관련된 증거들은 12월이 좀 유난했다는 점을 시사한다.
날씨때문인지는 여전히 알 수 없다.



경기지수 원지수는 상승중이다.
발표된 순환변동치도, 계산한 전년동월비도 우상향이다.
그러나 kospi가 다른 얘기를 한다.




ecri 스타일의 kospi growth도 지금 재미없다고 한다.



통계청의 경기지수는 이제는 전혀 쓸모가 없다.
적어도 나는 쓸모를 찾을 수가 없다.
그러나 그것만 빼면 함께 발표되는 나머지 지표들은 여전히 중요하다.








댓글 없음:

댓글 쓰기