2005년 10월 21일
Minimax, Maximin & Saddle Points
원문: Minimax, Maximin & Saddle Points, 도표는 원문을 참고할 것!!!

게임이론(game theory)은 인간 관계 및 사회의 많은 측면을 밝혀준다. 게임이론은 인간 합리성에 대한 연구에서 중요하다. 게임이론에서 얻어진 결과를 가지고 인간 합리성을 획일화하여 일반화된 이론을 얻겠다는 생각은 문제가 있다. 그 대신 상황에 좌우되는 인간 합리성의 복잡성을 보여주는 데 게임이론은 훌륭한 도구를 제공해 준다. 게임 자체가 판단 및 선택을 둘러싼 갈등 상황과 관련되기 때문에, 그러한 상황의 적절한 단순화는 인간 합리성에 대한 구체적 토론 주제를 제공해준다. 무엇보다도 수학자들이 게임이론에 관심을 갖는 이유는 재미가 있기 때문이다. 그래서 당신은 수학자의 사회적 무관심을 탓할 것인가? 나의 답은 그렇게 탓하는 것이 당신의 재미 거리가 될 수 있듯이, 그냥 재미있어 연구한다는 것도 하나의 중요한 이유이다. 이론의 사용과 관련된 결과는 집단적 합의 절차를 거치기 때문에, 개인으로서 연구자의 성향을 탓하기 전에 그러한 절차에 관심을 먼저 가져야 할 것이다.
게임은 게임 참가자의 수, 게임 참가자의 목적과 성향, 견제와 공동협력 그리고 게임 상황을 제약하는 여러 변수에 좌우된다. 모든 게임들을 표상해주는 추상적인 보편적 서술은 없다. 유사한 게임들에 대한 그러한 서술만이 가능하다. 게임이론을 출발하는 데 가장 단순한 상황은 다음이다.

1. 게임 참가자의 수는 2명이다.
2. 각 참가자에게 주어진 선택지는 2개이며, 한번의 선택만이 가능하다. 이 한번의 선택은 독립된 사건으로 여겨져야 한다.
3. 선택의 목적과 관련된 참가자의 성향은 안정적이다. 그것은 상황에 별로 좌우되지 않는다.

이렇게 단순화된 상황에서 초보적인 게임이론을 구성하는 하나의 문제가 떠오른다.

주어진 조건 1-3하에 게임 상황을 제약하는 변수들 자체에서 기대할 수 있는 전략이 있는가?

이러한 질문에 대한 대답으로서 나온 것이 미니맥스(minimax) 전략이다. 따라서 이 전략은 특정 조건아래 작동하는 게임의 상황에만 해당한다. 먼저 미니맥스 개념의 수학적 서술 방식을 간략히 다루고, 미니맥스 전략이 통용되는 게임을 살펴보자.


위 도표에서 검은색의 수들은 2칸 2열를 구성한다. 각 칸에서 가장 큰 수는 그 칸 아래 파란색으로 표현되었다. 각 열에서 가장 작은 수는 그 열의 오른 편에 파란색으로 표현되었다. 미니맥스는 각 칸에서 최고 큰 수들 중에 가장 작은 수를 뜻한다. 이 도표의 경우 1이 되며, 파란색 열의 제일 오른쪽에 위치한 수이다. 맥시민(maximin)은 각 열의 제일 작은 수들 중에서 가장 큰 수를 뜻한다. 이 도표의 경우 1이 되며, 파란색 칸의 제일 아래 오른쪽에 위치한 수이다. 이 도표에서 발견할 수 있는 특징은 맥시민과 미니맥스가 동일하다는 것이다. 이렇게 미니맥스와 맥시민이 동일한 경우 해당 수는 조준점(saddle point)으로 불린다.

약간 수학적으로 바꿔보자. 다음 도표를 살펴보자.


위 도표의 수들은 n열과 m칸으로 구성되었다. 각 칸의 제일 큰 수들을 max1(a11,a12,...,an1), max2(a12,a22,...an2), ...., maxM(a1m,a2m, ...., anm)이라고 하자. 이렇게 얻어진 수들 중 가장 작은 수를 minimax라고 한다. 반대로 각 열의 제일 작은 수들을 mini1(a11,a12,...,a1m), mini(a21,a22,...,a2m), ...., miniN(an1,an2,....,anm)이라고 하자. 이렇게 얻어진 수들 중 가장 큰 수가 maximin이 된다. 여기서 하나의 수학 정리가 얻어진다.

주어진 n열과 m칸의 수들에 대해 항상 minimax가 maximin보다 크거나 같다.

이 정리는 수학적 귀납법(mathematical induction)에 의해 쉽게 증명된다. 이제 현실 세계로 돌아오자. 미니맥스와 맥시민이 동일한 게임의 상황은 어떤 것일까? 수학 자체는 이러한 게임 상황에 대해 아무것도 알려주지 않는다. 그러한 상황에서 추상화된 것이 수학적 모델이기 때문이다. 미니맥스와 맥시민의 직관적 의미는 수학적 모델에 반영될 수 있는 것이지 수학적 모델에서 도출되는 것이 아니다. 그 의미를 살펴보자.

- 미니맥스: 네가 게임을 통해 얻을 수 있는 것은 최대의 기대치 중 가장 적은 것이다. 혹은 네가 게임을 통해 예측할 수 있는 기대치는 큰 기대치들 중 가장 작은 것이다.
- 맥시민: 네가 게임을 통해 얻을 수 있는 것은 최소의 기대치 중 가장 큰 것이다. 혹은 네가 게임을 통해 예측할 수 있는 기대치는 적은 가능 기대치들 중 가장 큰 것이다.

이러한 두 직관을 현실 세계에 반영할 때 조준점 있는 상황은 어떤 경우일까? 이 문제를 먼저 도입부에서 언급한 세 조건아래서 따져보자. 게임 참가자 A의 선택은 다른 참가자 B에게 선택지를 제공하는 것이다. A의 선택 결과는 B에 의존한다. 만약 B가 자신에게 유리한 선택지를 택한다면 그리고 A도 B와 마찬가지로 자신에게 유리한 결과를 기대한다면, A의 최적 전략은 미니맥스가 된다. B에게 돌아갈 큰 이득 중 가장 적은 것이 나오도록 A는 노력한다. 대칭적으로 B는 A가 제공할 이득들 중 기껏해야 적은 것 중에 제일 큰 것을 고를 수 밖에 없음을 안다. 조준점은 이러한 미니맥스와 맥시민 전력이 평형을 이룬 상태이다. 하나의 보기를 보자.

A는 착한왕이다. B는 그의 섹시한 아내이다. 물질적 분배에서는 착한왕만큼 자기 중심적으로 생각하는 여자이다. 착한왕의 월급은 1천만원이다, 그는 이 돈을 부인과 나눠야 한다. 분배의 기득권은 착한왕에게 있지만, 분배된 돈의 선택권은 부인에게 있다. 착한왕이 선택할 수 있는 최적 전략은 미니맥스이다. 그가 800대 200백으로 나누면 부인은 바로 800을 가져간다. 600대 400으로 나누면 부인은 600을 가져간다. 그에게 유리한 분배는 결국 1천만원을 가급적 절반으로 쪼개는 것이다. 이 전략은 그가 택할 수 있는 최대 기대치, 곧 500백만원에서 1천만원 중에서 최소값이다. 반대로 부인은 착한왕이 어떤 식으로 월급을 나눌지 예측할 수 있을까? 그가 550대 450으로 나누면 당연히 섹시한 부인은 550을 선택한다. 착한왕이 절대 그녀에게 그런 호의를 베풀지 않을 것임을 그녀는 잘 안다. 그녀가 기대할 수 있는 최소치는 1원에서 500백만원 사이이다. 자기만큼 자기 중심적인 착한왕이기에 그녀는 자신에게 돌아올 돈이 500백원 근처임을 예상한다. 그녀의 이러한 예상은 맥시민 전략을 따른 것이다.


위 도표에서 500백만원이 조준점이 된다. 착한왕이 월급을 비균형적으로, 곧 절반 이상을 기준으로 나누면, 그에게는 적은 양 B가 돌아간다. 섹시한 부인이 절반 이상인 1000-B를 선택하기 때문이다. 결국 그가 할 수 있는 것은 가급적 월급을 절반으로 나누는 것이다. 잔돈이 없는 경우 딱 500대 500으로 나눌 수 있고, 이 경우 500이 조준점이 된다. 1000-B가 500+A보다 크자고 하자. 착한왕의 경우 각 칸의 최대치는 500과 1000-B이다. 이 둘 중 최소값, 곧 미니맥스는 500이다. 왕마눌의 경우 각 열의 최소치는 500과 B이다. 이 들 중 최대값, 곧 맥시민은 500이다. 1000-B가 500+A보다 작은 경우도 마찬가지이다.

이러한 사례는 현실 세계에서 거의 나타나지 않는다. 어린 형제 혹은 자매 사이에 사탕 나누기 혹은 재산 분배 등에서나 볼 수 있다. 게다가 이 사례는 도입부에 언급된 세 가지 조건을 전제하고 있다. 현실 속의 게임 상황에서 게임 참가자 수는 2명으로 제한되어 있지 않다. 선택은 독립적인 사건이기보다는 다른 사건에 좌우된다. 참가자의 성향이 상황과 무관하게 안정적이라는 보장도 없다. 두 명의 게임에서도 일반적으로 조준점은 존재하지 않는다. 게임 참가자의 수, 성향, 게임의 횟수 및 상황의 변수를 어떻게 설정하는가에 따라 게임의 양상은 달라진다.

게임이론은 주로 게임 참가자의 성향을 자기 중심적으로 취급하면서 조준점, 곧 양자가 만족할 수 있는 평형점을 찾아왔다. 죄수의 딜레마가 논쟁이 되는 이유는 그러한 조준점이 있지만 양자에게 득이 되지 않는 상황을 보여주기 때문이다. 이 죄수의 딜레마를 둘러싼 논쟁은 다음 기회로 미루자. 어쨌든 착한왕과 왕마눌의 보기는 우리에게 무엇을 시사하는가? 그런 게임 상황은 현실 세계 속에 별로 없거나 중요하지 않은 경우이다. 서로 이득을 추구하는 외교는 그런 게임 상황의 조건을 만족하지 않는다. 따라서 한 국가가 다른 국가에게 선택지를 제공할 때 때 미니맥스 전략을 택하는 짓은 역으로 비합리적이다. 이러한 상식적 판단에 근거해 게임이론을 비판하는 자들 또한 비합리적이다. 미니맥스 전략이 최적인 게임은 게임이론에서도 특수한 경우일 뿐이기 때문이다. 누군가 게임이론에 관심이 있다면, 그는 수학을 잘하는 것도 중요하지만 각 이론에 등장하는 모델들이 어떤 조건을 만족하는지에 관심을 가져야 한다. 게임이론의 많은 모델은 현실 세계의 측면들을 반영하는 것이지, 현실 세계가 게임이론의 응용 장소는 아니기 때문이다.
by 취어생 | 2005/10/21 12:02 | 트랙백


<< 이전 페이지 | 다음 페이지 >>