В одной из предыдущих колонок я привёл пример того, как равновесие Нэша проявляет себя в реальности, дабы показать, что это понятие является не просто абстрактным термином, а обобщением реально существующей закономерности. Однако, несмотря на наглядность примера, на основании только его одного может показаться, что мы наткнулись на какой-то вырожденный случай. Поэтому имеет смысл рассмотреть и более общее описание данного правила.
Многие читатели, возможно, знакомы с равновесием Нэша по одному весьма распространённому его частному случаю — так называемой «дилемме заключённого». Его суть примерно в следующем.
В тюрьме находятся два заключённых, которых взяли с поличным по отдельности, но ещё подозревают в более тяжких преступлениях. Если участие докажут, то срок заключённых возрастёт до десяти лет. Сейчас же они отсиживают по году каждый. Следствие предлагает каждому из них пойти на сделку и дать показания против второго. В этом случае первому срок скостят до полугода, а второй сядет на десять. Однако заключённые понимают, что если они оговорят друг друга, то вряд ли их обоих пощадят — скорее добавят каждому ещё лет по пять.
Расклад можно отобразить при помощи следующей таблицы.
Легко видеть, что «зелёные» варианты (1, 2) и (2, 1) являются симметричными, в двух же других положение заключённых будет идентичным. Поэтому можно рассмотреть логику ситуации с точки зрения только одного из заключённых — для второго она будет такой же.
Заключённый, разумеется, хочет наименьшего срока для себя. Но если он будет хранить молчание, то, возможно, его коллега даст против него показания, чем повысит ему срок до десяти лет. Если бы не обещанное снижение срока, то можно было бы тешить себя мыслью «а зачем мне это?», но соблазн снизить срок слишком вели́к. Кроме того, второй заключённый, как понимает первый, будет подозревать его, первого, в том, что он даст показания против второго и повысит тем самым ему срок.
«Обидно будет оказаться крайним и загреметь на десять лет», — думает первый. Но «и второй наверняка думает так же, и так же подозревает меня, — понимает он, — а потому шансов, что коллега меня не заложит, очень мало. Выходит, надо давать показания: если второй каким-то чудом промолчит, то будет полгода, проговорится — пять. Ну хоть не десять, которые я неизбежно получу из-за разоткровенничавшегося со следствием моего подельника!».
«Оранжевый» вариант (1, 1) является удобоваримым для обоих и в каком-то смысле это оптимум в данной ситуации. Однако у каждого есть ещё лучший вариант — соответствующий «зелёный» (1, 2) или (2, 1). В результате чего на деле будет реализован «красный» вариант (2, 2).
Можно сказать, что для каждого из заключённых он не так плох: всего пять лет против десяти в «зелёном» варианте в пользу подельника. Однако представим, что в «красном» варианте обоим дадут по десять. Логика в данном случае чуть-чуть поменяется: «если я его сдам, то хотя бы есть шанс отвертеться от десяти лет, а если промолчу — шансов нет, он меня наверняка заложит по тем же соображениям». Однако тут система подталкивает заключённых выбрать наихудший вариант из возможных. Действуя, что характерно, строго ради своей выгоды.
Рассмотрим теперь ещё одну ситуацию. Есть две фирмы — А и Б. Каждая из них может воспользоваться стратегией — Икс или Игрек. Однако на результаты оказывает влияние не только стратегия, выбранная самой фирмой, но и стратегия второй фирмы тоже. Выигрыш или проигрыш каждой из фирм мы представим в виде следующей таблицы.
Я специально для повышения накала страстей подобрал числа так, чтобы убыточное для обеих фирм состояние лишь незначительно отличалось бы от «соседних» с ним: тем удивительнее, что будет реализовано именно оно. Фирмы, действуя строго в своих интересах, с большой вероятностью захотят получить тысячу рублей вместо ста и тем самым не получат ничего, а наоборот, даже утратят. Переход же одной из фирм на стратегию Икс ещё сильнее ухудшит её положение — другая фирма будет обогащаться, а вторая терять ещё больше, хотя и незначительно больше.
Запишем вышеприведённые матрицы в более общем виде, абстрагировавшись от «фирм», «заключённых», «сроков» и «рублей». Положим, что у нас просто есть два игрока А и Б, играющие в некоторую игру, где на каждом ходе можно совершить один из двух ходов — Икс или Игрек. Выигрышем являются просто некие «баллы», наибольшее число которых каждый игрок и стремится набрать.
Правила игры, представленные данной матрицей, будут «подталкивать» игроков к реализации «красного» варианта (2, 2), даже если выигрыши игроков в этом случае существенно меньше, чем во всех остальных вариантах. Правда, в зависимости от соотношения выигрышей (которые могут быть в том числе отрицательными — то есть проигрышами), обозначенных буквами «a» и «b» с индексами, частота реализации каждого из вариантов будет разной.
В частности, на выбор может влиять среднее арифметическое выигрышей при выборе каждой из стратегий, а также предположительная вероятность, с которой игрок сделает тот или иной ход (которая, кстати, может быть аппроксимирована частотой ходов, сделанных в предыдущих раундах). Так, в простейшем случае игрок А для оценки хода Икс складывает a0 и a2 и делит результат на два, полагая выбор хода со стороны Б равновероятным. То же самое он проделывает для хода Игрек — складывает a1 с a3, после чего делит результат на два — и сравнивает результаты. В более сложном случае игрок считает сумму a0*px + a2*py, где px и py — вероятности ходов Икс и Игрек, сделанных игроком Б. Результат сравнивается с a1*px + a3*py.
Можно было бы, конечно, снова поделить результат на два, но поскольку деление на два имеет место быть для обоих вариантов хода, для сравнения величин эта операция необязательна, как, впрочем, и в случае «равновероятных ходов».
Также игрок может ориентироваться на сами величины. Например, если один из ходов означает вероятный проигрыш — особенно крупный, такой, какой игрок не может себе позволить, — игрок, не исключено, будет выбирать другой ход, даже если предположительный выигрыш при другом ходе в среднем ниже, но зато в обоих случаях положительный.
Наконец, надо помнить, что люди часто, скажем так, «помнят о другом игроке». Если второй игрок — конкурент или даже враг, то, возможно, будет иметь место тенденция выбирать такой ход, который навредит другому игроку, даже если первый игрок из-за этого выиграет мало, и даже, не исключено, проиграет. Если второй игрок — друг, то чаще будет выбираться ход, позволяющий чуть-чуть выиграть и ему тоже — в том случае, если «игра» — это не заранее заявленное соревнование, а какой-то процесс из реальной жизни. Возможности мести и поблажек, разумеется, зависят от соотношений в матрице — при некоторых из них скорее забудут, что соперник — твой друг, чем начнут ему слегка подыгрывать.
Иными словами, рассматриваемый нами принцип отображает именно что тенденцию, а не детерминированность. Чем сильнее соотношения значений выигрышей и проигрышей подобны фигурировавшим в «дилемме заключённого», тем чаще и быстрее система будет подводить игроков к «наихудшему» варианту и тем «более наихудшим» будет этот вариант.
Есть как бы «невидимая рука рынка», которая как бы невидимо подталкивает игроков… ну, вы знаете. Точнее, нет, может быть, и не знаете. В классическом варианте «рука рынка» как бы подталкивает куда всем надо, а тут она толкает совсем не туда. Не во всеобщее благо, а в перманентный кризис, которого при иных раскладах можно было бы избежать, что нам иллюстрирует и «дилемма заключённого», и гипотетический пример с конкуренцией фирм, и реальный пример с неизбежным завышением сроков разработки софта, о котором речь шла в предыдущей статье.
Рынок толкает игроков к равновесию Нэша, которое сколь угодно далеко может отстоять от их общего и личного блага.
В данном случае мы рассматривали только двух игроков и игру с двумя ходами, однако возможно и более широкое обобщение, которое как раз и является формулировкой равновесия Нэша:
Если в некоторой игре с произвольными количеством игроков и матрицей выигрышей существует такое состояние, что при выборе не соответствующего ему хода любым из игроков в отдельности его личный выигрыш уменьшится, то это состояние окажется «равновесным» для данной игры.
Кроме того, в ряде случаев ходы игроков будут иметь тенденцию стремиться к этому состоянию, даже если в этой игре есть другие состояния, в рамках которых выигрыш игроков в целом и/или по отдельности выше.
Приводить примеры такого общего случая способом, подобным ранее использованному, ощутимо тяжелее, поскольку добавление каждого игрока будет добавлять ещё одно измерение к матрице выигрышей. Однако об этом — позже.
Статус: |
Группа: Посетители
публикаций 0
комментариев 240
Рейтинг поста:
Выбор Украины - это условие её успеха или неудачи. Остальным это "постольку, поскольку...". И её подталкивают выбирать одно из двух. Кто же здесь заключённый? Хотя, конечно, пример с заключёнными здесь не очень подходит. "Рынок толкает игроков к равновесию Нэша, которое сколь угодно далеко может отстоять от их общего и личного блага.
В данном случае мы рассматривали только двух игроков и игру с двумя ходами, однако возможно и более широкое обобщение, которое как раз и является формулировкой равновесия Нэша".
--------------------
Статус: |
Группа: Гости
публикаций 0
комментариев 0
Рейтинг поста:
Введение в РФ такого вида наказания, как принудительные работы, застопорилось. Все откладывается до 2017-го. Меж тем эксперты заявили "Правде.Ру" о том, что принудительные работы могли бы пойти на пользу экономике — если будут такие осужденные, пропадет и нужда в мигрантах. Хотя есть и те, кто опасается, что это — возвращение "урановых рудников".
В России уже который год не могут решить вопрос с таким видом уголовного наказания, как принудительные работы. Подобная санкция достаточно нова для России: принудительные работы были включены в УК РФ в 2011 году и должны были начать применяться в 2013 году. Но введение нормы сначала было отсрочено до 2014 года, а теперь вот уже идет речь о 2017 годе. И все эти отсрочки из-за того, что не создана необходимая инфраструктура и нет достаточного финансирования.
"Реализация этой меры до 2017 года приостановлена. Будет введение в 2017 или 2018 году. Так что принудительные работы как метод наказания еще не рабочий, он еще только на бумаге. В настоящее время идут всевозможные согласования, разрабатываются акты, нормативы, инструкции. Но средств пока нет. Самый фундаментальный момент — это дорого!" — рассказывает "Правде.Ру" юрист, адвокат Владимир Хроменко.
Надо сказать, что введение такого наказания, как принудительные работы — довольно ожидаемая мера. По мнению многих экспертов, принудительные работы помогут решить сразу несколько проблем. Первое — это помогут разгрузить переполненные исправительные колонии (и проблема эта действительно серьезная). И второе — помогут уберечь граждан, совершивших впервые, например, не тяжкое или непредумышленное преступление, от тлетворного влияния тюремной обстановки. Ведь всем понятно, что исправительные колонии давно никого не исправляют, а, скорее, наоборот.
Есть и еще один важный момент, чисто экономический. Труд людей, осужденных на принудительные работы, можно направлять в те сферы хозяйствования, где наблюдаются серьезные проблемы и нехватка рабочей силы. "В России сегодня проблемы со строительством автомобильных дорог. Нам нужны мощные автобаны. И я считаю, что на строительство дорог как раз можно было отправлять таких осужденных. На этом поднялась Германия, на этом в 50-х годах поднялись США. И не только дороги можно строить. Много объектов, которые требуют рабочих рук, но у нас почему-то все эти проблемы решаются за счет мигрантов", — продолжает Владимир Хроменко.
Однако здесь есть один очень принципиальный момент. Дело в том, что принудительные работы все-таки сильно отличаются от тех же исправительных работ. Для организации принудительных работ нужна специальная инфраструктура, под принудительные работы создаются специальные исправительные центры, будут и надзиратели. Уже известно, что каждый такой центр будет рассчитан на 200 осужденных. Присматривать за ними будут 30 сотрудников тюремного ведомства.
То есть, по сути, одни специальные учреждения (исправительные колонии) заменяются другими (исправительными центрами). Так что может получиться, что в масштабах всей страны подобная "разгрузка" колоний и не будет очень-то ощутимой, так как исправительные центры тоже требуют и финансовых, и управленческих вложений.
Это не исправительные работы, которые отбываются либо по месту работы осужденного, либо в местах, определяемых органами местного самоуправления (и все это в районе места жительства осужденного). Здесь, в сущности, все равно получается некое подобие зоны. Как пишут некоторые эксперты, это будет нечто среднее между советской "химией" и колониями-поселениями. Поэтому получится ли создать некую гуманную альтернативу зоне, еще большой вопрос.
Однако эксперты смотрят на этот вопрос весьма оптимистично. "Это однозначно лучше, чем тюрьма. В тюрьме люди сидят в изоляторах с дважды и трижды судимыми и перенимают что-то из блатного мира. Все, кто там находятся, морально разлагаются, в том числе и сотрудники колоний. Потому что когда ты в роли палача, то хочется самые низменные свои качества проявлять.
Это однозначно улучшит ситуацию в пенитенциарной системе России. Потому что в колониях у нас действительно пыточная система. Да еще с экономическим уклоном, за все плати. Только клиент мой приехал на зону, его оперативник встречает и говорит: будешь, значит, платить — будешь хорошо жить, а не будешь платить — будешь в ШИЗО сидеть, в штрафном изоляторе. Вот такое отношение, а человек мог на исправительных или на принудительных работах работать.
В принудительных работах всего этого нет. И вообще, труд облагораживает человека, дисциплинирует и исправляет. То, что там начинают придумывать про урановые рудники, химические производства, про то, что это будет возвращение к советским спецлагерям, то это сказки, конечно. Это будут обычные производства", — заключил Владимир Хроменко.
При этом, конечно, эксперты отмечают, что принудительные работы должны назначаться только за не тяжкие преступления или, например, за экономические преступления. Те же, кто совершил такие тяжкие и особо тяжкие преступления, как убийство, разбой, изнасилование, действия сексуального характера в отношении несовершеннолетних (педофилия), измена Родине, шпионаж и так далее, должны отбывать наказание в колониях и тюрьмах.
http://www.pravda.ru/society/how/08-10-2013/1177310-year-0/#
Статус: |
Группа: Посетители
публикаций 0
комментария 4082
Рейтинг поста:
это другая задача, в которой выбор Украины - условие успеха или неудачи двух других игроков. формально, это как бы вариант, когда решение за заключённых принимает третья сторона, а они не могут однозначно предопределить это решение своими действиями.
Статус: |
Группа: Посетители
публикаций 0
комментариев 1425
Рейтинг поста:
Статус: |
Группа: Посетители
публикаций 0
комментариев 240
Рейтинг поста:
и рыбкуассоциироваться с ЕС и не упустить участие в Таможенном союзе, а ей говорят: надо выбирать. Что она получит по равновесию Нэша?--------------------
Статус: |
Группа: Посетители
публикаций 0
комментарий 531
Рейтинг поста:
Какие-то заключённые, какие-то сроки. Зачем? Чтоб непонятно было?
Есть просто два объекта в состоянии А (срок по году) которым выгодно перейти в состояние Б (срок по полгода/ 5 лет). И всё. Если в задаче рассматривается нечто сверх перехода из А в Б, ну так опишите внятно и подробно. А то переживания какие-то, муки совести, драма тюремной жизни. Хотя, да, без этих переживаний ситуация станет предельно скучной.
Объект А перебрался через стену на волю (решал задачу получить полгода) и был застрелен до состояния Б (5 лет).
Ах, да, и это всё имеет отношение к общественному благу. Вроде тупой каменюки покатившейся под уклон. Из старого:
Вот, что по этому поводу говорит математик H.H.Моисеев.
"Ситуация, которую мы рассматриваем, как раз и относится к этому
специальному типу конфликта. Она называется "Путешественники в одной
лодке". Каждый из путешественников имеет собственные цели, но все
они связаны одной общей целью - доплыть на лодке, на одной и той же
лодке, до берега. Этот тип конфликта подробно изучался покойным
профессором МГУ Ю.Гермейером и сотрудником ВЦ АH СССР И.Вателем. Они
показали, что в рассматриваемом случае всегда существует эффективное
решение и оно устойчиво. Этот результат является строгой
математической теореммой."