칼럼

[칼럼] 같은 데이터를 보고 다르게 분석하는 법


간혹 내가 작성한 시장 분석보고서를 참조하고 그 정보의 출처 기재 방법에 대해서 문의해 오는 경우가 있다. 예를 들어 정부에서 공식 자료로 고시한 정보가 있다고 가정해 보자. 이를 가공해 어떤 언론사에서 자료로 올렸다면 그 자료의 출처는 어디일까? 그 데이터가 정부에서 고시되었으니 출처는 정부라 할 수 있겠으나 충분히 가공된 정보라면 수정한 곳의 출처도 밝혀야 한다. 만약 특정한 형태의 정보로 가공되었다면 출처를 “정부 고시 자료를 아무개가 가공한 정보에서 참조”라는 식으로 쓰는 것이 보다 명확할 것이다.


이런 말을 하는 이유는 같은 정보라도 그것을 보는 관점에 따라 전혀 다르게 해석할 수 있기 때문이다. 물이 반 정도 남은 잔에서 어떤 이는 물이 반 밖에 남지 않았다고 하고 어떤 이는 물이 반이나 남았다고 하는 것처럼, 정보를 받아들이는 것은 해석하는 사람에 달려있다. 긍정적으로 보느냐, 부정적으로 보느냐의 문제가 아니라, 같은 정보라도 어떻게 해석하느냐에 따라 다르다.


[최근 4개월 와인 통관 물량 추이]


예를 들어 2025년 3월의 와인 통관 물량(2리터 이하)은 35,832헥토리터다. 1월의 통관량이 43,149헥토리터니 분명히 많이 줄어들었다. 2월의 통관량도 38,271헥토리터니 이 정보로 판단했을 때 시장 규모가 줄어들고 있다는 시그널이 분명해 보인다. 여기에 증거를 조금 더 얹어보자. 2024년 12월의 통관 물량은 45,145헥토리터를 기록했다. 4개월의 통관 수치를 해석하면 명확하게 시장은 줄어들고 있으며 침체되고 있다.


[전년 동월 및 주요 월별 통관 물량 비교]


그렇다면 여기에 반대의 의견을 달아 보겠다. 2024년 11월은 통관 물량이 35,464헥토리터로 오히려 2025년 3월보다 적다. 또한 2024년 9월 34,623헥토리터, 6월 33,089헥토리터도 2025년 3월보다 적다. 게다가 2024년 3월은 32,160헥토리터로 오히려 2025년의 수치보다 더 적다. 2025년 3월은 전년 대비 늘어난 것이다. 2024년 1월 통관량도 38,233헥토리터인데 2025년 1월의 통관량은 43,149헥토리터니, 이 두 달의 정보를 비교하기만 해도 시장이 늘어났다고 해석될 수 있을 것이다. 즉, 앞서 이야기한 '최근 월별 추세 기준으로 시장이 감소하고 있다'는 주장을 반박하는 논리로 해석될 수 있을 것이다.


며칠 내 발표될 4월 통계자료를 바탕으로 2025년 4개월간 시장 동향에 대해 칼럼으로 쓸 예정이나, 시장 데이터는 이처럼 하나의 단편적인 자료를 보는 것으로 해석하는 데 한계가 있다. 유통시장은 강물과 같아서 큰 흐름도 봐야 하지만 작은 지류나 바닥의 흐름도 면밀하게 봐야 한다. 하나의 사실 정보만 보고 오판하는 실수를 해서는 안 된다. 매일 숫자를 확인해야 하는 와인 시장 관계자들은 항상 다음의 사항을 마음에 둔다면 판단 오류에 의한 손실을 줄일 수 있지 않을까 생각한다.


첫째, 월별 데이터에 일희일비하지 말고 분기 데이터에 집중한다. 지금까지 시장 분석을 하면서 느낀 점은 월별 데이터의 경우 변인이 과도하게 많다는 점이다. 연휴가 있거나 정치적 이벤트가 있는 경우에도 영향을 받는다. 이러한 정보들은 통상 분기별로 큰 흐름을 보여주는데, 2년가량의 분기 데이터 흐름을 보면 시장의 특징을 이해하는 데 도움이 된다.


둘째, 전월/전분기 데이터보다 전년 대비 데이터가 더 좋다. 우리가 뉴스를 보면 “수출이 전년 대비 몇 퍼센트 줄었다/늘었다”하는 이야기를 많이 듣게 된다. 이는 이미 시장 통계에서 “전년대비”라는 정보가 시장 상황을 파악하는 데 좋은 통찰력을 준다는 것이 입증되었기 때문이다. 상대적으로 내가 덜 신뢰하는 정보는 CAGR(연평균 성장률)이다. 시장이 성장하는지 줄어드는지 볼 수 있지만, 그 중간에 발생되는 변인들을 과도하게 제거해 의사결정에 착시효과를 줄 수 있다. 국내 와인시장의 CAGR을 2019년~2024년 기준으로 보면 꽤 높게 나올 것이다. 와인 시장을 조금이라도 아는 사람이라면 이 CAGR을 믿고 지금 투자할 사람은 거의 없을 것이다. 


셋째, 메타데이터(분류체계)를 잘 관리한다. 설문조사를 하면 마지막에 연령대, 직업, 성별 등을 짧게 물어보는 경우가 있다. 우리는 별 중요한 사항이 아니라 생각할 수도 있지만, 설문조사 과정에서 이 정보는 매우 중요한 구분 정보가 된다. 지금의 와인 시장이 전체적으로는 침체기지만, 뉴질랜드 와인은 다른 통계와 전혀 다른 추세를 보여주고 있다. 만약 개별 수집 통계 자료에 국가 구분이 없다면 이 정보는 찾을 수 없을 것이다. 한국의 통관 코드에 레드, 화이트가 구분된 것도 다른 나라에 비해 통계 정확도를 높이는 데 도움이 된다. 참고로 세분류 정보는 국가별 소관이며 일본의 통관 데이터에는 레드와 화이트 와인의 구분이 없다. 이 분류체계 하나 덕분에 내 보고서도 더 풍성해지는 셈이다. 어느 데이터를 보더라도 이 정보를 관리하고 일관성을 유지하는 것이 정확한 데이터 분석의 시발점이다.


넷째, 정규화(normalize)한다. 정규화라는 것은 '일반화' 혹은 '표준화'라고 한다. 예를 들어 정부에서 제공하는 무역 통계 정보는 모두 달러를 기준으로 한다. 만약 각 국가별 통화와 시점별 환율에 따라 변동된다고 가정해보자. 아마 무역 통계는 제대로 나오지 않을 것이다. 수입 금액이 유로화 얼마, 달러 얼마, 엔화 얼마, 위안 얼마라는 식으로 나올 테니 합계를 낼 수 없고 규모도 모를 것이다. 그래서 정부에서는 통관 집계를 달러로 통일해 우리가 큰 맥락을 이해할 수 있게 한다. 정규화된 자료가 아니라 여러 다른 기준으로 정의된 숫자를 읽다 보면 인간은 쉽게 방향성을 잃어버린다. 눈에는 다 같은 아라비아 숫자이기 때문이다. 이 숫자에 대해 기준을 잡고 읽는 것은 오로지 사람의 몫이니 혼란을 주는 숫자 기준이 없는지 늘 살펴야 한다.


하나의 데이터를 보면 좌절할 때도 있고, 기뻐할 때도 있다. 그러나 그 데이터는 단편적인 경우가 많다. 큰 맥락을 보면 흐름을 읽게 되고, 앞으로의 전망도 떠오른다. 여담이지만 짧은 동영상에 길들여진 뇌는 큰 맥락을 읽는 데 어려움을 겪을 수밖에 없다. 단편적으로 자극적인 수치에 익숙해지다 보면 큰 흐름을 읽을 수 없다. 큰 흐름을 읽지 못하면 곧 손실로 이어진다. 마치 숏폼에 익숙해지듯 단편적인 시장 통계에 매몰되지 말고, 긴 호흡으로 데이터를 본다면 손실은 줄어들고 이익이 따라오지 않을까 생각한다.


* 4월까지 통계 자료가 발표되는 5월 15일 이후 시장 현황에 대한 분석 칼럼을 기고할 예정이다.

Copyrights © 와인21닷컴 & 미디어. 무단 전재 및 재배포 금지

  • 5월 도슨트
  • 5월 책갈피 <바베트의 만찬>
  • 조지아 와인 판매 행사
  • 탭샵바 5월 큐레이션 & 페어링
  • 탭샵바 6월 와인

이전

다음

뉴스레터
신청하기

TOP