칼럼

[칼럼] 그는 어떻게 '해보고 싶던 것'을 해냈는가

[사진: Shutterstock]


와인 시장을 분석하다 보면 항상 가려운 구석이 있다. 주변에서 묻는 질문들도 많다. 지역별 수입 규모는 얼마나 되는지, 밭 단위로 추적이 가능한지, 품종이나 스타일별로 얼마나 수입되는지 등을 알고 싶어한다. 그러나 관세청 데이터는 전체적인 흐름만 제공할 뿐, 세부적인 수준의 정보까지는 확인하기 어렵다. 대신 활용할 수 있는 다른 경로가 있다. 식품의약품안전처에서 제공하는 '수입식품정보마루'를 통해 과실주 정보를 조회하는 방식이다. 하지만 이 역시 완전하지는 않다.


결측치는 다양하다. 레드, 화이트, 스파클링 등 기본적인 종류 정보부터 지역, 등급, 품종 정보까지 대부분 누락돼 있으며, 세부적으로는 내추럴이나 바이오다이내믹 여부 같은 양조 정보도 포함되지 않는다. 데이터에는 오직 제품명(한글/영문), 제조·작업·수출업소명(실질적으로는 생산자), 제조국과 수출국 정보 정도만 있을 뿐이다. 그렇다면 이 제한된 정보를 바탕으로 원하는 분석 결과를 어떻게 도출할 수 있을까?


방법은 간단하다. 개별 와인 정보를 하나씩 검색하고, 해당 생산자와 포도원 데이터를 확인한 뒤, 각각에 대해 일일이 라벨링하는 방식이다. 상당히 번거롭고 시간이 많이 드는 작업이지만, 충분히 가능한 일이다. 경우에 따라서는 이를 전담하는 인력이 필요할 수도 있다. 다만 이 작업은 와인에 대한 상당한 수준의 지식 없이는 수행하기 어렵다.


예를 들어 와인의 등급 정보를 매긴다고 생각해보자. 보르도 지역 메독(Médoc)의 그랑 크뤼 5등급 체계는 비교적 구조가 명확하고 변화도 적어 정리 자체는 어렵지 않다. 그러나 실제 데이터는 그렇게 단순하지 않다. 수입식품 신고 과정에서 수입자가 명칭을 자유롭게 기재하기 때문에 동일한 와인이라도 표기가 제각각이다. 샤토 마고(Château Margaux)의 경우 'Chateau Margaux'로 입력되기도 하고, 'S.C.A. Chateau Margaux'로 기재되기도 한다. 약칭으로 'CH. Margaux'가 사용되기도 하며, 전체 명칭을 그대로 쓰는 경우도 있다. 여기에 알코올 도수를 붙여 'Chateau Margaux 13.5%'로 입력하거나, 빈티지를 포함해 'Chateau Margaux(2020)'처럼 표기되는 사례도 흔하다.


이처럼 동일한 와인을 모두 하나로 정규화해 '샤토 마고'의 식검 이력을 정확히 집계하는 것부터가 생각보다 쉽지 않은 작업이다. 여기에 세컨드 와인도 있다. 파비용 블랑(Pavillon Blanc), 파비용 루즈(Pavillon Rouge)처럼 독립된 제품군을 모두 통계 단위로 정제하고 분리하는 작업은 쉽지 않다. 


그랑 크뤼의 경우는 더 복잡하다. 앞서 언급한 메독 지역은 비교적 구조가 고정돼 있지만, 생테밀리옹(Saint-Émilion)은 상황이 다르다. 약 10년 주기로 등급 체계가 개정되며, 그에 따라 분류 기준과 포함되는 샤토의 개수 자체가 달라진다. 샤토 슈발 블랑(Château Cheval Blanc), 샤토 오존(Château Ausone), 샤토 앙젤뤼스(Château Angélus)는 2021~2022년 생테밀리옹 등급 체계의 공정성과 객관성에 문제를 제기하며 탈퇴했다. 반면 샤토 파비(Château Pavie)는 잔류했다. 그 결과 1등급에는 샤토 피작(Château Figeac)과 샤토 파비가 남게 되었다. 이 지점부터 데이터를 다루는 사람에게 어려움이 닥친다. 단순히 그랑 크뤼 개수나 '그랑 크뤼 Class A, B' 여부로 라벨링할 것인지, 혹은 시기별 등급 체계를 분리해 반영할 것인지에 따라 결과 자체가 달라지기 때문이다. 특히 2021년 이전 빈티지를 어떻게 처리할 것인가에 따라 통계 해석은 완전히 달라질 수 있으며, 이에 따른 수치 변화는 어떻게 설명할 것인지도 별도의 문제로 남게 된다.


2026년 4월까지 식검이 진행된 횟수는 총 12,765건에 달하며, 이는 곧 동일한 수의 와인 이름 데이터가 존재한다는 의미다. 2025년 한 해에만 35,363건의 식검이 이루어졌으니, 매우 많은 데이터가 지속적으로 축적되고 있다. 이처럼 방대한 데이터를 일관된 기준으로 분석하는 일은 결코 단순하지 않다. 현재 누적 데이터는 2020년부터 약 224,378건에 이르며, 나는 이를 구조화해 의미 있는 분석을 해보고 싶었다.


그러던 중 인공지능과 에이전트 기반 분석 도구가 등장했다. 이 시스템을 활용해 데이터 정제와 분류 작업을 자동화할 수 있게 되었고, 나는 해당 작업을 AI에 맡기기로 했다. 엑셀 환경에서 세부 지침을 자세히 설정했다. 다음은 내가 준 지침서를 바탕으로 앤스로픽(Anthropic)이 만든 스킬의 일부다. 이를 활용해 우선 이탈리아 지역 데이터를 정리하는 작업부터 진행했다.


### K (Class) — France only, blank for Italy/USA

- Médoc 1855: GCC1 … GCC5 (mains), GCC1S … GCC5S (seconds)

- St-Émilion 2022: SE1 (Premier GCC A), SE2 (Premier GCC B), SE3 (Grand Cru Classé)

- Sauternes 1855: ST1 (Yquem + 11 Premier Cru), ST2 (Deuxième Cru), ST1S (seconds)

- Champagne: NM, RM, NM Grand Cru, RM Grand Cru, Grand Cru (when NM/RM unclear)

- Burgundy: 1er Cru, Grand Cru

- Alsace: Grand Cru

- Rhône / Beaujolais: Cru

- Otherwise: blank


### L (AOC/DOC) — France/Italy/USA only

- France: big → small with / separator. Examples:

  - Bordeaux / Médoc / Pauillac, Bordeaux / Médoc / Saint-Estèphe

  - Bordeaux / Saint-Émilion, Bordeaux / Sauternes

  - Bourgogne / Côte de Nuits / Gevrey-Chambertin

  - Bourgogne / Côte de Beaune / Meursault

  - Bourgogne / Chablis / Chablis

  - Champagne

  - Rhône / Châteauneuf-du-Pape, Rhône / Côtes du Rhône

  - Alsace

  - When appellation only covers a large region, stop at that level (e.g. Médoc, Châteauneuf-du-Pape)

- Italy: <명칭> — examples: DOCG Barolo, DOCG Chianti Classico, DOC Langhe, IGT Toscana. Apply IGT only if text contains IGT/I.G.T OR matches the FAMOUS map (super-Tuscans etc.)

- USA: AVA name only — Napa Valley, Paso Robles, Willamette Valley, Walla Walla, etc.

- Otherwise: blank


### M (Region) — France/Italy/USA only

- France (big region only): Bordeaux, Bourgogne, Champagne, Rhône, Loire, Alsace, Languedoc-Roussillon, Provence, Jura, Beaujolais, Corse

- Italy: Toscana, Piedmonte (note: Korean transliteration, not "Piemonte"), Veneto, Sicilia, Puglia, Umbria, Marche, Abruzzo, Campania, Sardegna, Lombardia, Trentino-Alto Adige, Friuli-Venezia Giulia, Emilia-Romagna, Lazio, Calabria, Basilicata

- USA: California, Washington, Oregon, New York

- Otherwise: blank


다음은 이러한 과정을 통해 엑셀에서 정리한 2026년 1월부터 4월까지의 식검 횟수 지역별 결과(이탈리아 기준)다. 예상보다 비교적 깔끔하게 데이터가 정리되어 매우 만족스럽게 생각한다. 다만 이 수치는 물량 기준이 아니기 때문에 실제 수입 물량을 정확히 추정하는 데에는 한계가 있다. 그럼에도 불구하고 소비자 성향의 변화나 고급 와인 수입 흐름을 읽어내는 데 있어서는 충분히 유의미한 지표로 활용될 수 있다.


[제공: 정휘웅]


질문과 답변 과정을 거치며 AI는 비교적 충실하게 작업을 수행했고, 기대보다 우수한 결과물을 만들어냈다. 다만 여전히 한계점은 있다. 예를 들어 그랑 크뤼 5등급 분류나 부르고뉴 아펠라시옹 검색과 같은 작업에서는 약 10% 정도의 오류가 발생한다. 최종 검증 단계에서는 여전히 사람이 직접 확인해야 한다는 의미다. 그럼에도 불구하고 고급 와인 아펠라시옹 정보를 정리하고 검토하는 과정에서 AI를 활용하는 것만으로도 업무 부담이 크게 줄어들 수 있다. 와인 업계 종사자들도 이러한 도구를 적절히 활용한다면 업무 효율을 혁신적으로 개선하는 데 큰 도움을 받을 수 있을 것이다.


만약 이 작업을 누군가에게 급여를 지급하며 맡기고 있었다면 그 사람은 일자리를 잃었을 것이다. 그렇다고 해서 직업이 사라질까? 그렇지 않다. 오히려 반복적이고 소모적인 작업이 줄어들면서 보다 창의적이고 고차원적인 업무에 집중할 수 있는 환경이 만들어진다. 이 작업은 기존의 앤스로픽 Opus 4.6 모델에서는 성능이 낮았지만, 최근 공개된 앤스로픽의 Opus 4.7 모델은 이전 버전 대비 더욱 향상된 성능을 보여주었다. 불과 며칠 사이에도 성능 개선이 이루어지고 있다는 점은 주목할 만하다.


빠르게 변화하는 인공지능 시대에는 무엇을 자동화할 것인지, 무엇에 인간의 시간을 투입할 것인지를 스스로 정의하는 것이 중요해지고 있다. 적절히 활용한다면 업무는 줄어들고, 오히려 더 많은 가치를 창출할 수 있는 시대가 될 것이라 확신한다.


참고로 내추럴 와인과 바이오다이내믹 와인에 대한 정보를 요청했을 때, AI는 다음과 같은 형태로 결과를 정리해 처리 결과를 제공한다.


처리 결과

범위: 211615~224379행 (12,765행, 고유 생산자 2,393개)

isBiodynamic = Y: 244행 (24개 생산자)

isNatural = Y: 191행 (16개 생산자)

바이오다이내믹으로 표기한 생산자 (Demeter/Biodyvin 인증 또는 공개적으로 명확히 표방한 곳만)

부르고뉴: Domaine Leroy, d'Auvenay, Leflaive, Vougeraie, de Montille, Dujac, Chandon de Briailles, Simon Bize, Marquis d'Angerville, d'Eugénie, Trapet

보르도: Pontet-Canet, Palmer

알자스: Zind-Humbrecht, Marcel Deiss, Barmès-Buecher

론: M. Chapoutier

샹파뉴: Françoise Bedel

루아르: Bellivière, Clau de Nell

이탈리아: Emidio Pepe, Valentini, Fontodi


내추럴 와인으로 표기한 생산자 (vins nature 운동에 명확히 동참한 곳만)

Philippe Pacalet, Prieuré Roch, Recrue des Sens, Chassorney, Fanny Sabre, Patrick Bouju, Mas Coutelou, Maxime Magnon, Dard et Ribo, Julien Meyer, Christian Binner, Gérard Schueller, Arianna Occhipinti, Emidio Pepe, Valentini, Ligas

Copyrights © 와인21닷컴 & 미디어. 무단 전재 및 재배포 금지

최신 이벤트 전체보기

최신 뉴스 전체보기

  • 로제 스파클링 기획기사
  • 5월 도슨트
  • 조지아 와인 판매 행사
  • 탭샵바 5월 큐레이션 & 페어링

이전

다음

뉴스레터
신청하기

TOP