사의 신년사를 보면 한 해 중점적으로 생각하는 사업/목표에 대해 살펴볼 수 있다. 보통 취준하는 분들이 기업분석을 할 때 많이 살펴보는 요소 중 하나이다.
소셜미디어에 다른 주제는 많이 보이는데, [데이터 표준화]에 대해선 없어서 먼저 꺼내보려고 한다.
1990년대 이후 한국야구가 틀린 용어 바로잡기, 통일성 등을 위해 일본식 야구표현, 콩글리쉬 개선을 시작한다. 바로 '언어의 표준화'이다.
특히 2006년 '야구용어위원회'를 발족하여 보다 순화된 야구 용어 개선에 나섰다. 참고로 이때 위원장으로 지내시던 분이 오늘날 총재로 계신다.
개선 되기 전인 옛날 옛적의 서적, 기사, 중계 영상을 보면 이런 표현을 쉽게 볼 수 있다.
랑데부 홈런
방어율
톱타자
포볼, 데드볼
... (추억돋음)
물론 직구나 시합같이 여전히 바뀌지 않는 것도 많다.
과거엔 이런 언어의 대한 통일이 필요했다면, 현재는 데이터에 대한 기준이 필요하다고 생각한다.
가령 투구한 공이
스피드건 기준 145km/h,
PTS(Pitch F/X)는 146km/h,
랩소도, 트랙맨, 호크아이는 148km/h
라면, 어떤게 기준이 되어야 하는가 하는 것이다.
*사실 투구의 구속 측정은 오차가 크거나 스케일이 다르지가 않다.
반면 회전수, 무브먼트, 타구속도+발사각도는 업체(혹은 방송사)마다 중구난방으로 오차가 큰 편이다.
부정확하게 측정되는 것도 있고, 계산 기준이 달라서 생긴 것도 있다.
개인적으론 현재 통용되는 포터블 디바이스나 서번트의 기준을 일부 따라갔으면 한다.
이 부분이 프로 구단 및 선수는 자체적으로 정리가 잘 되어있는 듯한 느낌을 받는데, 일반 팬이나 유소년 선수 등은 아직이란 생각이 많이 든다.
개인적으론 지난해 유소년 측정을 하면서 이 점을 크게 느꼈다. 측정을 하고 수치를 전달하면 오히려 내게 잘못 측정된 거 아니냐고 되묻는 선수들이 많았다.
이런 이유 중 하나가 미디어로부터 노출되는 '비표준화된 데이터' 사용 때문이 아닐까 한다.
이러면 분석가와 선수간의 신뢰가 깨질 뿐만 아니라, 데이터나 과학에 거리가 멀어질 가능성이 있다.
장비의 비용의 대한 문제로 어쩔 수 없이 쓰고 있다라고 얘기할 수 도 있겠으나 개인적으론 핑계라고 생각한다. 부정확하면 안 써야 되는 거 아닌가.
그리고 물리학 수식을 조금만 손 본다거나, 통계적인 근거로 스케일 조정하는 등 단시간 내 쉽게 해결할 수 있도 있다.
작년부터 어디 발표할 때나, 온라인 강의, 몇 관계자 분들 만나뵐 때 등에서 필요성을 누차 얘기해온 얘기를 조심스럽게 글로 꺼내본다.
#데이터표준화 #KBO #신년사
'세이버메트릭스' 카테고리의 다른 글
2024 KBO 신년사 분석4 : 피치클락 (0) | 2024.01.17 |
---|---|
2024 KBO 신년사 분석3 : 자동 투구 판정 시스템(ABS) (1) | 2024.01.16 |
피치디자인 장비 셋팅부터 실전까지 (2) | 2023.11.03 |
유소년 야구선수 연령별 투구/타구 데이터 (0) | 2023.10.25 |
KBO 2022~2023 홈승률 5할 붕괴 (0) | 2023.07.31 |