작성일
2021.06.08
수정일
2021.06.08
작성자
김한새
조회수
2634

축구에서도 통계, 데이터 분석이 주목 받고 있다

축구에서 통계, 데이터 분석이 주목 받게 된 과정

사실 축구에서 본격적으로 통계를 활용해 의미 있는 분석을 한지는 그리 오래 되지 않았다.

참고로 야구에서는 머니볼, 세이버매트릭스(Sabermetrics) 개념이 훨씬 빨리 자리를 잡았는데, 이는 야구라는 스포츠의 속성이 애초에 그렇기 때문일 거다. 플레이를 끊어서 독립시행으로 이뤄지는, 마치 통제된 실험실에 가깝기 때문이다.

반면 축구는 멈추지 않고 상황이 동시다발적으로 발생하는 스포츠이다보니 제대로 수집할 수 있는 데이터가 없었다. 그나마 골, 파울, 옐로/레드 카드, 교체 및 출전시간 정도는 쉽게 집계할 수 있지만, 다른 지표들은 그 기준을 설정하는 게 너무 어렵기 때문이다. 예를 들면 어시스트도 시대에 따라 리그마다 기준이 다르고, 포지션이라는 것도 명확하게 정해진 게 아닌 데다가 슛 개수 셀 때도 이게 슛인지 패스인지 모를 것들도 있고, 슛을 하더라도 발로 한 건지 종아리로 한 건지, 머리로 한 건지 어깨로 한 건지… 아무튼 모든 게 다 불명확하다.

그러다가 2003년 즈음부터 옵타(Opta)라는 곳을 필두로 여러 기관에서 좀 더 전문적이고 세분화된 축구 통계 지표들을 공개하기 시작한다. 어시스트와 키패스를 합쳐 슈팅으로 연결된 패스라는 의미의 CC(chance created), 명백한 찬스를 뜻하는 CCC(clear-cut chances)와 같은 지표가 대표적이다. 그리고 이런 식으로 재가공된 주요 통계 지표들이 계속 세미나나 언론에 공개되면서 축구계 전반에서 이와 관련한 관심이 높아졌다. 이 시기에 잉글랜드 몇몇 클럽에서는 새롭게 등장한 지표들을 가지고 특정 선수들을 영입할 때 활용했다고도 한다. 다우닝, 앤디캐롤, 찰리아담 등이 대표적이다.

 

요즘 주목 받는 통계 지표들

최근에는 xG(expected goals)라는 개념이 인기인 것 같다. 우리말로 하면 기대 득점. 이 xG는 도움의 유형 (땅볼인지, 공중볼인지), 슈팅할 때의 거리와 각도, 슈팅을 한 부위(발로 했는지 헤더로 했는지), 어떤 상황이었는지(프리킥이었는지, 오픈 플레이인지, 역습인지, 빅 찬스였는지), 슈팅할 때 경로에 있는 수비 숫자 등 다양한 요인들을 가지고 계산한다.

xG 외에도 패킹(packing)임팩트(impect) 개념도 주목을 받고 있는 것 같다. 상대를 얼마나 통과했느냐에 대한 지표인데, 결국 축구라는 경기에서 골을 넣으려면 수비를 뚫고 전진을 해야 하기 때문이다. 실제로 브라질 월드컵 경기들에서 이 지표를 가지고 사후 분석을 해본 결과, 승부 예측 정답률이 92% 정도 나왔다고 한다. 어마어마한 수치다.

축구 통계 제공 사이트

축구계에서도 데이터를 가공해서 분석하는 곳이 정말 많아졌다. 대표적인 해외 사이트 몇개만 가져와봤다.

옵타나 스탯츠밤 같은 곳은 아예 전문적인 솔루션 형태로 비싸게 제공하는 것 같고, 와이스카웃은 API 형태로 제공하는 거 같긴 한데 역시나 유료다. 그나마 언더스탯이나 후스코어드 같은 곳은 무료로 몇가지 지표들을 검색해서 확인할 수 있다.


축구 데이터 시각화 by @DatoBHJ

위에서 소개한 데이터들은 결국 숫자이기 때문에, 이 숫자를 사람들이 보고 이해할 수 있는 형태로 시각화하는 것도 당연히 중요한 영역이다.

포스팅에서 소개하고 싶은 데이터 시각화 예시는 DatoBHJ 라는 분의 트위터에서 가져왔다. 개인 트위터 계정에 취미로 축구 데이터를 시각화해서 업로드 해왔는데, 이게 대외적으로(?) 인정을 받아서 언론사에서 기사나 잡지를 낼 때 같이 소개되기도 할 정도. 이제 외주 작업도 좀 하시는 것 같긴 하다.

아무튼 인상 깊어서 대표적인 사례 몇 가지만 가져와봤다.

홀란드 도르트문트 이적 후 스탯. 90분당 xG가 거의 1개다.

오른발/왼발 사용 비율을 시각화 한 게 재밌다. 데브라이너 히트맵 보면 하프 스페이스가 눈에 딱 띈다.

 

내 생각:  축구는 굉장히 보수적인 스포츠이다. 다른 스포츠와 달리 과학적 기술을 도입하는 것도 되게 최근이며, 2018월드컵때 VAR을 제대로 도입했으며, 다른 스포츠들과 달리 과학적인 기술이 되게 부족하다. 데이터가 도입된다는 말에 되게 반가웠다. 이젠 사람들이 많은 선수들의 데이터를 확인하고 평가 할 수 있게 됬다는 것이 되게 반가웠으며, 앞으로도 계속해서 과학적 기숳이 도입됬으면 좋곘다.

출처: http://hleecaster.com/football-statistics-visualization/

첨부파일
첨부파일이(가) 없습니다.