게임이론이란 게임을 하는 것을 말합니다!
여기서 게임이란 흔히 알고 있는 비디오 게임, 온라인 게임, 보드게임 등이 아니라 의사결정을 하는 상황을 게임, 정확히는 게임상황이라고 합니다.
게임이론에는 크게 협조적 게임이론과 비협조적 게임이론으로 나눠지는데 이 분야를 처음 접한 사람은 협조와 비협조의 어감 차이 때문에 착각하는 경우가 종종 있습니다.
협조적 게임이론은 참가하는 사람의 인간성이 좋아 다른 사람과 협조를 잘하는 게임이론이고 비협조적 게임이론은 매우 나쁜사람들이 참가하는 게임이론일까요??
게임이론의 전제조건이 하나 있습니다.
바로 참가하는 모든 사람들은 이성적이라는 것이죠 이 이성적이라는 것은 착하고 나쁘고를 떠나서 항상 합리적인 판단만한다는 것입니다.
그렇다면 협조적과 비협조적이라는 것은 무엇일까요??
협조적 게임이론은 사람들이 강제가 아닌 자기의지로 구속력 있는 계약을 맺을 수 있는 상황을 분석합니다.
여기서 구속력 있는 계약이란 A와 B가 계약을 맺었는데 A가 그 계약을 깨버렸습니다!!
그 때 B는 C, D, E 등등 다른 사람한테 가서 호소하여 계약을 위반한 A를 처벌할 수 있는 게임이론이 바로 협조적 게임이론입니다.
비협조적 게임이론은 게임의 규칙이 허용하는 구속력 있는 계약은 맺을 수 있지만 게임의 규칙에 있지 않는 계약은 맺지 못합니다. 그래서 규칙에 있지 않은 계약을 맺은 경우 A가 계약 위반 했을 때 처벌할 수 없습니다.
먼저 이 포스트에서 주로 다루게 될 내용은 비협조적 게임이론입니다.
몇가지 게임이론의 용어가 있는데 저기 위에 있는 문명 5 게임의 간디 짤방으로 이야기를 해보겠습니다.
플레이어 : 간디와 문명 5 게임을 하고 있는 여러분
전략집합 : 각 플레이어가 선택할 수 있는 전략 (간디의 경우 (돈받기, 선빵필승) 문명5의 플레이어(돈주기, 선빵필승))
보수 : 특정 전략을 취함으로써 얻을 수 있는 이익
그러면 이러한 게임을 다음과 같이 표로 나타낼 수 있습니다.
나 | 간디 | 돈받기 | 선빵필승 |
돈주기 | -5 , 5 | -15,5 |
선빵필승 | 5,-25 | -20,-20 |
만약 자신이 돈을 주게 되고 간디도 순순히 돈을 받게 된다면 자신은 -5원 손해를 입고 간디는 5원을 얻습니다.
만약 자신이 돈을 주게 되는 상황에서 간디가 주먹을 날리면 돈도 뺏기고 치료비 때문에 -15원을 잃습니다
그리고 간디는 해맑게 돈받을 준비를 하고 있는 상황에서 자신이 선빵을 치면 간디의 소지금을 털어 얻을 수 있고 간디는 치료비와 소지금을 -25원 잃습니다.
마지막으로 둘다 선빵을 때리면 둘다 중환자실에 가서 -20원씩 잃습니다.
이 상황에서는 과연 어떤 선택이 가장 최선일까요??
그런데 게임이론에서 중요한 사실하나 알고 계신가요??
바로 간디는 여러분이 무엇을 선택할지 알고 있습니다!!!
그러면 간디는 독심술사여서 무엇을 선택할지 알고 있는것일까요??
그런데 충격적인건 여러분 또한 간디가 무엇을 선택할지 알고 있습니다!!
어떻게 이런 상황이 가능할까요??
그것은 아까전 이야기했던 참가자는 모두 이성적이다! 라는 가정에 의한 것입니다.
이성적이면 어떻게 되는가? 간디는 여러분이 쓸 전략을 모두 알고 있고 여러분 또한 간디가 쓸 전략을 모두 알고 있습니다. 또한 간디는 여러분이 이성적이라는 것을 알고 있고 여러분 또한 간디가 이성적이라는 것을 알고 있습니다.
이것을 공통 지식(Common knowledge)라고 합니다.
그러면 서로 이성적인 것을 알고 이성에 의한 로지컬 띵킹으로 모든 전략에서 가장 자신의 이익이 최대화 되는 쪽으로 선택하겠죠?
위의 표를 다시 가져와 봅시다.
나 | 간디 | 돈받기 | 선빵필승 |
돈주기 | -5 , 5 | -15,5 |
선빵필승 | 5,-25 | -20,-20 |
이 행렬을 보수행렬이라고 하며 각 선택한 전략에 따른 이익(보수)를 보여주고 있습니다.
그러면 과연 이성적인 여러분과 간디는 어떤 전략을 취하게 될까요?
둘다 선빵 때리는것은 손해가 크니까 안하겠죠?
자 로지컬 띵킹을 해봅시다
여러분이 돈주기 전략을 택한다면 간디의 전략 돈받기를 할시 -5 , 선빵을 할 시 -15 해서 총 -20의 손해를 봅니다.
똑같이 여러분이 선빵 전략을 택한다면 간디의 전략 돈받기를 할 시 5, 선빵을 할 시 -20을해서 총 -15의 손해를 보는군요.
따라서 여러분은 손해가 적은 선빵전략을 택하게 됩니다.
간디도 마찬가지입니다.
간디가 돈받기 전략을 택한다면 여러분이 전략 돈주기를 할시 5 , 선빵을 할 시 -25 해서 총 -20의 손해를 봅니다.
마지막으로 간디가 선빵 전략을 택한다면 여러분이 전략 돈주기를 할시 5 , 선빵을 할 시 -20 해서 총 -15의 손해를 봅니다.
따라서 간디도 선빵전략을 택하게 되죠
이렇게 다른 전략에 비해서 가장 높은 보수를 보장하는 전략을 강우월전략이라고 합니다.
근대 어라??? 둘다 선빵을 때리는 건 손해가 극심한데 이성적으로 생각을 해도 결국 둘다 선빵을 때렸습니다.
이러한 상황을 죄수의 딜레마라고 합니다.
이런 상황도 생각해봅시다.
대기업 A와 중소기업 B가 다음과 같은 계약 상황에 놓여있다고 해봅시다.
대기업 | 중소기업 | 파기 | 협력 | 합병 |
거절함 | 1, 1 | 10, 0 | 1, -1 |
받아들임 | 0, 0 | 10, 2 | 0, -1 |
중소기업의 파기와 합병 선택에 대해서 대기업은 거절이 받아들임 보다더 큰 이득을 줍니다
그리고 대기업 입장에서는 중소기업의 협력에 대해서 동일한 이득(10)을 얻을 수 있습니다.
그러면 대기업은 어찌되건 거절하는게 받아들이는 전략보다 이득이므로 거절할 준비를 합니다.
그러면 자동적으로 중소기업은 파기(1)를 선택하겠죠
그러면 둘다 (1, 1)의 이득을 얻습니다.
그런데 대기업이 "난 큰게 좋아" 하면서 받아들임을 선택한다고 중소기업에게 문서를 보내면 중소기업은 얼쑤 좋다! 하면서 협력을 선택하여 최종적으로는 (10, 2)를 얻게 됩니다.
이렇게 중소기업과 대기업 모두 중간의 (10,0)과 (10,2)에 관한 이득이 가장 큰 것을 알고 있으면서도 실제 전략은 이성에 의하여 대기업은 거절을하고 중소기업은 파기를 하게 됩니다. 이러한 대기업의 거절함 전략을 약우월전략이라고 합니다.
이렇듯 약 우월전략에서는 협상이나 여러 변수에 의하여 항상 강우월전략처럼 가장 이득이 큰 전략을 택한다는 보장이 없습니다.
그런데 게임이론에서는 강우월전략이나 약우월전략이 없는 경우도 있습니다.
이럴 때는 어떻게 선택해야될까요?? 그냥 정신줄 놓고 찍신 강림하면 될까요?
흠.. ? 위 동영상에 내쉬균형의 대한 내용도 담고 있네요
근대 너무 간략하게 넘어가네요 그럼 다른 포스트에서 내쉬균형이라는 주제로 찾아오겠습니다.
'운용과학' 카테고리의 다른 글
비선형계획법 아시는구나! 겁.나.어.렵.습.니.다 (1) | 2020.06.19 |
---|---|
우린 언제나 그랬듯이 답을 찾아낼 것이다(일반화된 분지절단법) (0) | 2020.06.12 |
동적계획법에 확률같은걸 끼얹나? (확률적인 동적계획법 문제) (0) | 2020.06.06 |
동적계획법! 그렇게 다이나믹하지 않아요 (0) | 2020.06.05 |
여러 문제를 정수계획법으로 고치는 방법에는 어떤 방법이 있을까요? (1) | 2020.06.04 |
WRITTEN BY