Δwp(델타wp)
저 뿐만이 아니라 자료를 다루는 사람이라면 한번쯤 생각해봤을 만한 자료 아닌가 싶네요
아이디어는 이렇습니다.
현재 가장 널리 사용되고 인정되는 wp라는 경기 지수를 이용해서
두 선수가 경기를 wp 차이를 이용해서 예측할 수 있느냐 입니다.
간단하게 wp가 높은 선수가 이길확률이 높을꺼다...라는 생각을 바탕으로
그럼 wp차이에 따라서 얼마나?? 이런 생각을 해보는 것입니다.
Davi4ever 님의 현 wp를 살펴보면(포모스 인용)
순위 이름 소속 WP
1위 ↑1 이영호T KTF 1998.0
2위 ↓1 이제동Z 르까프 1996.5
3위 = 박지수T 르까프 1603.0
4위 = 도재욱P SK텔레콤 1408.0
5위 ↑1 김구현P STX 1251.0
6위 ↓1 염보성T MBC게임 1233.0
7위 = 박영민P CJ 1225.5
8위 = 허영무P 삼성전자 1205.5
9위 = 송병구P 삼성전자 1166.0
10위 = 박찬수Z 온게임넷 1146.5
괄호() 안에 자료는 전적검색에 자료 인용
이영호 이제동 선수의 wp 차이는 1.5 (3:4)
이영호 박지수 선수의 wp 차이는 대략 395(1:1)
이영호 염보성 선수의 wp 차이는 765(0:0)
...........................
~~~~~~~
박지수 도재욱 선수의 wp 차이는 200정도..(0:0)
도재욱 박영민 선수의 wp 차이는 380 (3:0)
상식적인 추측을 바탕으로 wp 차이가 클 수록 승률이 높을것이라는 추측을 통해
wp 자료를 x 축으로 하고
승률을 y좌표로 잡고...
회귀함수 처리를 한다면
대략 우상향 그래프(기울기가 양인 어떤 선~~)를 추축할 수 있지 않을까 하는 아이디어입니다.
하지만 현실적으로 엄청난 계산량..
대략 60명의 wp를 계산한다 할지라도
60*59/2 라는 엄청난 계산량이 필요합니다.
그것을 통해 얻을수 있는것도 일종의 회귀함수구요.
결론 데이터가 우상향일꺼라는 상식적인 결론은 쉽게 도출할 수 있지만.
그 선이 어떤 값을 가질지는 알수 없습니다.
하지만 지극히 상식적인 추론을 하나 하자면
Δwp=0 (델타wp)
wp 차이가 적을수록 승률은 50%에 근접해야 합니다.
(0이란 것은 자신의 실력과 똑같은 상대 실제로는 근사하지 않을수도 있습니다.)
또한 상식적으로 Δwp 함수는 y축 대칭이어야 합니다.
y 값에 0.5는 50%를 의미한다고 치면
정확히 말하자면 (0 , 0.5) 이점에 대해서 점대칭 이어야 하며
Δwp=∞ 는 1에 근접해야 하며
Δwp=-∞는 0에 근접해야 합니다.
물론 가장 바람직한 것은 일종의 직선입니다만..
식의 특성상 다른 식들에 근접시키는 것이 옳다고 봅니다.
가장 가까운 곡선을 추론하면
3차 함수의 역함수를 추론할 수 있습니다.
대략 (y-0.5)=ax^0.333+b
저런 식에 근사한다는 가정하에 a,b 값을 찾는것이 가장 무난해 보입니다.
조금더 수학적인 지식이 있다면 arctan(역탄젠트) 함수를 이용해서 추론할 수 있다고 봅니다.
θ대신에 편차가 0.5이므로 180θ를 해준다면 이용할 수 있다고 봅니다.
arctan를 이용하더라도. y-0.5=a*arctan(x)/180+b
고등수학 과정에서 사용되는
미분값이 대칭을 이루고 특정값이 존재한다는 것을 이용해서 y'(∞)=0 y'(-∞)=0 등으로 식을 변형시키면
오차함수(error function)를 이용할수 있습니다.
http://ko.wikipedia.org/wiki/%EC%98%A4%EC%B0%A8_%ED%95%A8%EC%88%98
이 경우도 숫자 2->1로 바꾸고 t^2->a*t^2 erf x -> erf x - 0.5 고처준 이후에 상수 값을 찾아 주면 됩니다.
그리고 Δwp의 특성상 오차함수를 따를 확률이 가장 높으므로
Δwp 보다는 wp/wp를 이용해서 델타값을 로그값으로 잡았을때 직선이 나타날수 있다는 것을 추론할 수 있습니다.
따라서 Δln(wp)를 x축으로 이용하면 식은 y=ax+b 꼴의 형태로 나타낼 수 있다는 것을 의미합니다.
이 경우에도 wp/wp=1인 경우Δln(wp)=0 0.5 되므로 b=0.5임을 추론할 수 있습니다. 하지만
실제 데이터는 다를수도 있으므로 a,b 둘다 찾아줘야겠죠
Δwp에 대한 수학적인 모델이 저런 결과들을 따를수 있다 분이지 실제로는
R값이 나타내는 유사성을 보고 추론할 수 밖에 없습니다.
물론 현실적으로 데이터의 보정이 필요합니다.
두 선수의 전적이 4:1인 경우 일종의 가수를 도입해서선수당 +2정도
6:3 정도로 보정해주는 것이 옳다고 봅니다.
물론 현실적으로 데이터의 보정이 필요합니다.
두 선수의 전적이 4:1인 경우 가수를 도입해서 선수당 +2정도
6:3 정도로 보정해주는 것이 옳다고 봅니다.
얼핏 보면 그냥 닥치고 전적을 이용하면 되지라고 쉽게 생각할 수 있겠지만.
가수를 이용해서 2:2로 부터 전적을 출발해 주는것이 오히려 데이터해석에 도움이 된다고 봅니다.
더군다나 1:0 이라고 해서 승률을 100%로 바로 주는것 보다는 오히려 가수를 이용하는것이
승률 데이터라는 반영 할 수 있기 때문입니다.
또한 wp 지수처럼 기간에 따른 차등적용이 가능하면 좋켔습니다만.
계산량이 너무 복잡해지기 때문에 제대로된 연산툴을 만드는 것이 쉽지 않을듯 싶습니다.
된다면 더 좋켔습니다만...
조금 생각을 확장한다면 종족별 wp (테저전 저플전 테플전 테테,저저,플플)
6종류의 wp가 존재할수 있다고 봅니다만.
수치화 시킨다면 테테전만 충분한 데이터화가 가능하고
각 전적인 1/6로 줄기 때문에 wp의 특성상 전적수*상대의이진전적수 라는 관계를 생각해 볼때
현재 점수의 1/20~1/50 이하로 점수가 줄어버립니다.
충분히 벌어지고 있는 테테전을 제외한다면
지금 2000점 정도되는 이영호 선수조차 다른 wp 지수가 테저전 관련해서 100~50 정도라는 수치화가 될 가능성이 높습니다.
따라서 대 종족별 wp는 매우 차이가 작기에 수치화 하는데 매우 어려움이 있을꺼 같습니다.
이론상으로는 가능하지만 실제로는 어려운...대 종족별 wp를 만든다면 현실적으로 데이터에 대한 많은 타협이 필요합니다.
그런데 Δwp 함수를 데이터 분석해서 실제로 찾아낸다고 과연 유용할까??
글쎄요 e-sports 스타크래프트가 한국야구 정도의 인기만 가지더라도..
유용할듯 싶은데... 실제 데이터로 산출하기 위해서 기술을 만들고 프로그램을 완성하 더라도..
(사용해줄 사람이 있을지..)
이해하기도 그렇다고 감이나 주관적인 생각으로 예측하는것 보다 특별이 경쟁력이 있다고 보긴 어렵네요...
하지만 wp 자료를 보면 기회가 되면 한번 꼭 만들어서 확인해 보고 싶네요..