Теория игр

Федеральное государственное образовательное учреждение среднего профессионального образования

«Омский промышленно-экономический колледж»


КУРСОВАЯ РАБОТА

по дисциплине «Математические методы»

Тема: «Теория игр»


Выполнил:

Каримов Руслан Ринатович

3 курс, БП 2 - 117

Руководитель:

Белгородцева Наталья Александровна

Оценка:________________

Дата защиты:___________


2010

Содержание


Введение

Обзор литературы

1. Основные понятия теории игр

2. Игры с противодействием и нулевой суммой

3. Графический метод решения игровых задач с нулевой суммой

3.1 Решение задач графическим методом

4. Сведение задач теории игр к задачам линейного программирования

4.1 Решение задач

5. Игры с природой (без противодействия)

5.1 Решение задач

Заключение

Список используемой литературы


Введение


Проблема выполнения различных вычислений была актуальна во все времена. По мере развития общественно-экономических отношений усложнялись поставленные задачи, которые для своего решения требовали разработки новых методов вычислений. На смену простейшим арифметическим и геометрическим вычислениям пришли алгебраические и тригонометрические вычисления. Организация современного производства требует не только наличия современных станков и оборудования, но и разработки новых технологических процессов и современных методов управления производством. Для решения каждой из поставленных задач разрабатываются математические модели, анализируя которые удается найти наилучшее решение поставленной задачи. Создание математической модели – сложная кропотливая работа, которая в современных условиях под силу коллективам разработчиков. Для создания математической модели одного и того же объекта различные коллективы могут использовать различный математический аппарат. После создания математической модели специалистами-аналитиками за дело принимаются специалисты-программисты, которые реализуют созданную модель в виде программных кодов. Далее с математической моделью работают специалисты-практики. Целенаправленно воздействуя на модель, они изучают ее поведение и подбирают оптимальный режим работы для реального объекта. Одной из таких моделей является игровая модель и поиск стратегий поведений в условиях полной или частичной неопределенности. В очень редких (исключительных) случаях для игровых моделей можно определить количественную оценку или указать оптимальное решение. В игровых моделях не ставится задача найти какое-то числовое решение, а требуется лишь или очертить область возможных решений, или предоставить некоторые дополнительные сведения о возможном развитии событий и рекомендовать правила поведения.

Обзор литературы


Для написания курсовой работы по дисциплине «Математические методы» на тему «Теория игр» я воспользовался следующей литературой:

-« Математические методы в программировании » : / Агальцов В.П., Волдайская И.В. Учебник : – М . : ИД «ФОРУМ» : ИНФРА-М, 2006. – 224с. : ил. – (Профессиональное образование). – (Учимся программировать).

-Лекции по дисциплине «Математические методы».

-«Математические методы: Учебник» / Партика Т.Л., Попов И.И. – М: ФОРУМ: ИНФРА, 2005.

-«Математическое программирование» / Костевич Л., издательство «Новое знание», 2003.

В одной из книг например «Математические методы в программировании»: / Агальцов В.П., Волдайская И.В. Учебник : – М . : ИД «ФОРУМ» : ИНФРА-М, 2006 написано понятней, если сравнивать с другими книгами, которыми я пользовался. Но в этой книге есть темы, которые отсутствуют или объяснены без теории, а на конкретном примере и тогда сложнее понять, о чем идет речь данной теме. Тогда я обращаюсь к другим источникам литературы в них, конечно, есть теория, но она сложнее и более углубленная. В одном из источников мне понравилась тема «Игры с природой (без противодействия)» и я решил изучить ее самостоятельно.


Основные понятия теории игр


Цель теории игр – выработка рекомендаций для различного поведения игроков в конфликтной ситуации, т.е. выбор оптимальной стратегии для каждого из них. Различают два больших класса игровых моделей: модели без противодействия (или их еще называют «играми с природой») и модели с противодействием (действия конкурентов на рынке).

Игры с противодействием часто называют конфликтными ситуациями, которые широко распространены в обществе. Например, конкурентная борьба в экономике, в спортивных соревнованиях, состязание сторон в ходе судебного заседания и т.д. Игровая модель, в отличии от конфликтной ситуации, строится по определенным законам, а игроки придерживаются определенных правил.

Развитие игры во времени представляется как ряд последовательных «ходов». Ходы могут быть сознательные и случайные. Случайный ход – результат, получаемый не решением игрока, а каким либо механизмом случайного выбора (покупательский спрос, задержка с поставкой материалов и т.п.). Сознательный ход – выбор игроком одного из возможных вариантов действия (стратегий) и принятие решения о его осуществлении.

Конфликтная же ситуация, строго говоря, развивается спонтанно.

Участниками игры (конфликтной ситуации) могут быть минимум два человека (парная игра) или несколько человек (множественная игра). Игра развивается по оговоренным правилами. Игроки по очереди делают свои ходы. Естественно, перед каждым ходом игрок может или сохранить предыдущую стратегию или применить новую стратегию. Если игрок при выборе очередного хода придерживаются каких-либо правил, то такая игра носит название стратегической. Однако игрок во время игры может менять вариант своего поведения (но не правил), т.е. сменить стратегию.

Возможные варианты (исходы) игры сводятся в прямоугольную таблицу (табл. 1.1) – платежную матрицу, в которой строки соответствуют различным стратегиям игрока А, столбцы – стратегиям игрока В, ai j называется выигрыш первого игрока.


Таблица 1.1

Стратегии В1 В2 В n
А1 a11 a12 a1n
А2 a21 a22 a2n
А m am1 am2 amn

Если игра содержит ограниченное количество стратегий, то такая игра называется конечной. В противном случае – бесконечной.

Стратегия, приносящая игроку максимальный выигрыш, называется оптимальной. Для нахождения оптимальной стратегии необходимо проанализировать все возможные стратегии и рассчитывать на то, что разумный противник на каждую из них будет отвечать такой, при которой выигрыш игрока А минимален. Обычно минимальные числа в каждой строке обозначаются α i и выписываются в виде добавочного столбца матрицы (табл. 1.2). В каждой строке будет свое α i = min aij . Предпочтительной для игрока А является стратегия, при которой α i обращается в максимум, т.е.


α = max (min aij),


где α – гарантированный выигрыш (максимин).

Если придерживаться максиминной стратегии, то при любом поведении стороны В (конкурента) гарантирован выигрыш, во всяком случае не меньше α . Поэтому α называют также ценой игры – тот гарантированный минимум, который можно обеспечить при наиболее осторожной (перестраховочной) стратегии.

Очевидно, что аналогично распределения можно провести и для конкурента В, который должен рассмотреть все свои стратегии, выделяя для каждой из них максимальные значения выигрыша:


β = min (max aij),


которое дает минимаксный выигрыш, или минимакс.

Такая β – стратегия – минимаксная, придерживаясь которой стороне В гарантировано, что в любом случае она проигрывает не больше β, поэтому β называют верхней ценой игры.

Если α = β = С, то число С называют чистой ценой игры или седловой точкой.

Для игры с седловой точкой нахождение решения состоит в выборе пары максиминной и минимаксной стратегий, которые являются оптимальными, так как любое отклонение от этих стратегий приводит к уменьшению выигрыша первого игрока и увеличению проигрыша второго игрока по сравнению с ценой игры С.


Таблица 2


В1 В2 В n α i
А1 a11 a12 a1n α 1
А2 a21 a22 a2n α 2
А m am1 am2 amn α i
βi β1 β2 βn

Наиболее полно разработан математический аппарат игр с нулевой суммой, когда выигрыш одного игрока равен проигрышу другого игрока, т.е. общая сумма выигрыша всех игроков равна нулю.

При построении игровых моделей предполагается, что каждый из игроков будет выбирать только лучшую (для себя) стратегию.

Результатом исследования игровой модели является определение наиболее осторожной стратегии поведение игрока, либо обеспечение гарантированного выигрыша (как правило, минимального), либо сведение к минимуму проигрыша. Риски при получении большого выигрыша не учитываются и не оцениваются.

Таким образом, результаты исследования игровых моделей указывают на оптимальную стратегию поведения (гарантированный выигрыш), а какой стратегией воспользуется игрок в реальной жизни – дело самого игрока.


Игры с противодействием и нулевой суммой


Предположим, что имеются две конкурирующие фирмы, выпускающие однотипные товары. Для обеспечения наибольшей прибыли обе фирмы разработали стратегии реализации товара. В общем случае это можно записать в виде матрице (табл. 1.1).

Теория игрПусть фирма А разработала четыре стратегии, а фирма В – пять стратегий.

Теория игрТо есть фирма А - А1; А2; А3; А4 Аi , где i = 1,4.

Теория игрТеория игрФирма В соответственно - В1; В2; В3; В4; В5 Вj , где j = 1,5.

Каждая фирма от реализации своей стратегии предполагает получить какой-то доход (табл. 2.1).


Таблица 2.1

Стратегии В1 В2 В3 В4 В5
А1 5 8 7 5 4
А2 1 10 5 5 6
А3 2 4 3 6 2
А4 3 5 4 4 3

Если фирма А выберет первую стратегию, то минимальный доход составит 4. Минимальный доход от второй стратегии – 1; от третьей – 2; от четвертой – 3. У фирмы В имеется в наличии пять стратегий. Использование первой стратегии обернется убытком в 1 единицу; второй (убыток) – 4; третьей – 3, четвертой – 4 и пятой – 2.

На первый взгляд фирма А должна избрать вторую стратегию (А2), чтобы получить выигрыш 10, но в ответ вторая фирма изберет первую стратегию (В1) и выигрыш фирмы А составит только 1.

Поэтому цель первой фирмы можно сформулировать так: получить максимальный доход из возможных минимальных. Введем в табл. 2.1 дополнительную строку и дополнительный столбец, в которых укажем возможные минимальные прибыли и максимальные (табл. 2.2).


Таблица 2.2

Стратегии В1 В2 В3 В4 В5 Минимальная прибыль фирмы А
А1 5 8 7 5 4 4
А2 1 10 5 5 6 1
А3 2 4 3 6 2 2
А4 3 5 4 4 3 3
Максимальный убыток фирмы В 5 10 7 6 6

Исходя из данных (табл. 2.2) фирме А надо придерживаться стратегии А1 , а фирме В – стратегии В1 . Таким образом, гарантированный минимальный доход фирмы А составит 4, а минимально возможный убыток, который понесет фирма В, составит 5 (минимально возможный проигрыш).

Минимальный гарантированный выигрыш называется нижней ценой игры. При плохой игре фирмы В выигрыш может быть и большим.

Минимально возможный проигрыш называется верхней ценой игры.

Для нашего примера нижняя цена игры составляет 4 (минимальный гарантированный выигрыш фирмы А), а верхняя цена игры – 5 (минимально возможный проигрыш фирмы В). Приведенные выше рассуждения хороши, если конкурирующая фирма заранее не знает, как себя поведет противник. Если конкурирующая фирма ознакомлена с планами конкурента, то она может выбрать другую стратегию (отличную от осторожной стратегии) и получить больший выигрыш (доход).

Таким образом, приведенные осторожные стратегии являются неустойчивыми по отношению к дополнительной информации.

На практике иногда случается, что нижняя цена игры равна верхней цене игры. В этом случае говорят об устойчивых стратегиях игроков (конкурирующих фирм) или о задачах с седловой точкой. Задача с седловой точкой представлена в (табл. 2.3).


Таблица 2.3

Стратегии В1 В2 В3 В4 В5 Минимальная прибыль фирмы А
А1 4 8 7 5 4 4
А2 1 10 5 5 6 1
А3 2 4 3 6 2 2
А4 3 5 4 4 3 3
Максимальный убыток фирмы В 4 10 7 6 6

Стратегии обоих противников в задачах с седловой точкой называются оптимальными и не зависят от дополнительно полученной информации. В специальной литературе доказано, что если при исследовании игровой модели известна вся предыстория (все ранее сделанные ходы), то существуют оптимальные (чистые) стратегии поведения игроков (конкурентов).

Если игровая задача не имеет седловой точки, то на практике конкурирующие фирмы (игроки) используют смешанные стратегии, т.е. попеременно используют две или более стратегий. В этом случае использование фирмой А нескольких стратегий можно записать как сумму вероятностей использования каждой стратегии Sa= p1+ p2+ …+ pm .

Соответственно, использование нескольких стратегий фирмой В можно записать Sb= q1+ q2+ …+ qn . Поэтому в общем случае исследование игровой модели сводится к определению вероятностей использования конкретных стратегий каждой фирмой (игроком).


3. Графический метод решения игровых задач с нулевой суммой


Суть графического метода состоит в том, что из матрицы удаляют дублирующие и поглощаемые строки и столбцы. Дублирующими называют полностью одинаковые строки или столбцы. Доминирующей строкой называется такая строка, которая содержит элементы, большие или равные соответствующим элементам другой строки, называемой поглощаемой. Доминирующим столбцом называется такой, который содержит элементы, меньше или равные соответствующим элементам другого столбца, который называется поглощаемым.

Воспользуемся табл. 2.1.

Строка (стратегия) А1 является доминирующей по отношению к строке (стратегии) А4 , так как содержит элементы, большие соответствующих элементов строки А4 . Соответственно строка А4 является поглощаемой и из дальнейшего рассмотрения удаляется (табл. 3.1).


Таблица 3.1

Первый шаг упрощения таблицы

Стратегии В1 В2 В3 В4 В5
А1 5 8 7 5 4
А2 1 10 5 5 6
А3 2 4 3 6 2

Первый столбец является доминирующим по отношению ко второму, третьему и четвертому столбцам (поглощаемым). Поступаем аналогично (табл. 3.2).


Таблица 3.2

Второй шаг упрощения таблицы

Стратегии В1 В5
А1 5 4
А2 1 6
А3 2 2

Еще раз рассматриваем строки. Первая строка поглощает третью строку. Поглощаемые строки (столбцы) содержат самые плохие стратегии. Окончательно получим (табл. 3.3).


Таблица 3.3

Третий шаг упрощения таблицы

Стратегии В1 В5
А1 5 4
А2 1 6

Вероятность использования первой фирмой первой стратегии обозначим через p1. Тогда вероятность использования второй стратегии первым игроком будет p2 = 1- p1 . Ожидаемый выигрыш фирмы А от применения


Теория игр (3.1)


вторым игроком первой стратегии составит:

Аналогичным способом получим ожидаемый выигрыш фирмы А от применения вторым игроком:


Теория игр(3.2)


В выражения (3.1) и (3.2) подставим конкретные значения.

Теория игр


Теория игр


На оси х отложим две точки 0 и 1. Через эти точки проведем прямые линии, параллельные оси у. Затем в первое выражение подставим 0 вместо p1, а потом – единицу. И по двум точкам построим прямую линию.

Аналогично построим вторую прямую линию. Пересечение двух прямых линий и даст решение задачи (рис. 3.1).


Теория игрТеория игрТеория игрТеория игрТеория игрТеория игрТеория игрТеория игрТеория игрТеория игр


Рис. 3.1 . Графический способ определения стратегий фирмы А


4p1 + 1= - 2p1 + 6


4p1 + 2p1 = - 1 + 6


6p1 = 5

p1 = 0,83

Итак, вероятность использования первой стратегии фирмой А составляет 0,83 (p1 = 0,83), а второй стратегии p2 = 1 – 0,83 – соответственно 0,17 (p2 = 0,17).

Аналогично определим оптимальную стратегию поведения фирмы В:

Пусть у1 – вероятность выбора второй игрой 5 стратегией, у2 - 6 стратегией. (p4 + p5 = 1, p5 = 1- p4)


(a11 – a12) · у1 + a12 = (5 – 4) у1 + 4 = у1 + 4;


(a21 – a22) · у1 + a22 = (1 – 6) у1 + 6 = -5 у1 + 6.


Теория игрТеория игрТеория игрТеория игр

Теория игрТеория игр


Теория игрТеория игр

Теория игр


Рис. 3.2 . Графический способ определения стратегий фирмы В


у1 + 4 = -5 у1 + 6


6 у1 = 2

у1 = 0,33

Вероятность использования первой стратегии фирмой В составляет 0,33 (у1 = 0,33), а второй стратегии у2=1- 0,33 – соответственно 0,67 (у2 = 0,67).


3.1 Решение задач графическим методом


Пример 1: Рассмотрим игру заданной платежной матрицей:

Теория игрТеория игрТеория игрТеория игрТеория игр


Теория игр


Теория игрТеория игр


Решение:

Проверим есть ли седловая точка :

α = max (2,2,3,2) = 3

β = min (7,6,6,4,5) = 4 α ≠ β

Седловой точки нет, игра в чистых стратегиях не решается. Найдем смешанную стратегию игроков. Посмотрим, можно ли удалить не выгодную стратегию для игроков. Для первого игрока невыгодной считается та стратегия, которая, обеспечивает выигрыш меньший, чем какая либо другая. Для второго игрока считается та стратегия не выгодной, которая обеспечить проигрыш больший, чем другая стратегия.


Невыгодные стратегии для первого игрока: 4, 2
Невыгодные стратегии для второго игрока: 1, 2, 3

Теория игр

Теория игр

Теория игр

Теория игрТеория игрТеория игр


Пусть p1 – вероятность с которой первый игрок должен применять 1 стратегию, p3 – вероятность применения 3 стратегией, p3 = 1- p1 .

Ожидаемый выигрыш 1 игрока, если второй выбрал 4 стратегию:


p1 · 4 + (1 - p1) · 3 = p1 + 3;

Ожидаемый выигрыш 1 игрока, если второй выбрал 5 стратегию:


p1 · 2 + (1 - p1) · 5 = -3 p1 + 5;


Теория игрТеория игрТеория игр

Теория игр

Теория игрТеория игр


Теория игрТеория игрТеория игр


p1 + 3 = -3 p1 + 5


4 p1 = 2


p1 = 1/2 , p3 =1/2 .


Первому игроку для получения гарантированного выигрыша 3,5 (1/2+3) рекомендуется чередовать стратегии 1 и 3.

Рассмотрим второго игрока.

Пусть p4 – вероятность выбора вторым игроком 4 стратегией, p5 - 5 стратегией. (p4 + p5 = 1, p5 = 1- p4)

Ожидаемые проигрыш второго игрока, если первый выберет 1 стратегию.


p4 · 4 + (1- p4) · 2 = 2 p4 + 2


Ожидаемые проигрыш второго игрока, если первый выберет 3 стратегию.


p4 · 3 + (1- p4) · 5 = -2 p4 + 5


Теория игр

Теория игрТеория игр

Теория игрТеория игрТеория игр


Теория игрТеория игрТеория игр


2 p4 + 2 = -2 p4 +5


4 p4 =3


p4 =3/4


p5 =1/4


ν = 3/4 · 2 + 2 = 3,5


Ответ : Из 4 игр 3 надо сыграть 4 стратегией, 1 игру – 5 стратегией, и тогда проигрыш будет не больше 3,5, для первого игрока 1 надо сыграть 2 стратегией и 1 – второй стратегией.

Пример 2: Решить игру, заданную матрицей

Теория игр

Теория игр


Теория игр


Решение:

Проверим если ли седловая точка:


α = max (2,4) = 4


β = min (6,5) = 5 α ≠ β


седловой точки нет, игра в чистой стратегии не решается. Найдем смешанную стратегию игроков. Т.к. игровая матрица задана первоначально в размерности 2Ч2, значит убирать столбцы или строки не нужно.

Ожидаемый выигрыш 1 игрока если второй выбрал 1 стратегию:


А1 · 2 + (1 - А1) · 6 = -4А1 + 6;


Ожидаемый выигрыш 1 игрока если второй выбрал 2 стратегию:


А1 · 5 + (1 - p1) · 4 = А1 + 4;


Теория игрТеория игр

Теория игрТеория игр

Теория игр

Теория игр


Теория игрТеория игрТеория игр


- 4 А1 + 6 = А1 + 4


- 4 А1 + А1 = 4 – 6


- 5 А1 = - 2


А1 = 2/5 , А2 = 3/5.

Первому игроку для получения гарантированного выигрыша 4Теория игр,

(2/5+4) рекомендуется играть 1 стратегией.

Рассмотрим второго игрока.

Пусть В1 – вероятность выбора второй игрой 4 стратегией,


(В1 + В2 = 1, В2 = 1- В1)


Ожидаемый проигрыш второго игрока, если первый выберет 1 стратегию.


В1 · 2 + (1- В1) · 5 = - 3 В1 + 5

Ожидаемый проигрыш второго игрока, если первый выберет 2 стратегию.


В1 · 6 + (1- В1) · 4 = 2 В1 + 4


Теория игр

Теория игрТеория игр

Теория игрТеория игрТеория игр


Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.
Подробнее

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту

Похожие рефераты: