DeletedUser5201
Guest
Здравствуйте, друзья. Играю я не так долго, но первый вопрос который у меня возник, и, наверно, у вас он возникал тоже, что же лучше - напасть на соседа, или бафнуть его (облагородить/мотивировать)? Я порылся на форуме, и выяснил, что никем из так называемых задротов, не было предложено сколько-нибудь действенной математической модели, которая бы объясняла что же выгоднее? Я думаю большинство скажет: "ну конечно напасть выгодно, ведь я получаю пвп очки которые идут в зачет пвп башни, очки рейтинга (которые расчитываются из соображений ipp/50 incoming pvp points) и возможность ограбить соседа, получив X золото/ресурсы/товары. Это действительно так, но на этом месте размышления большинства заканчиваются, и они пускаются в затяжные войны между соседями, забывая об обратной стороне медали - война будет вестить и на вашей территории.
Действительно, тут мы сделаем первое допущение - допустим, что сосед по силе равен, либо слегка уступает вам, его ответные действия будут отнюдь не дружелюбны. При этом, будем считать, что равный по силе сосед разобьет вашу армию защиты, так же как вы разбили его, тогда он получит ipp'/50 очков рейтинга, и Y золота/ресурсов/товаров. Таким образом, уже на данном этапе видно, что удачность нападения будет определяться не X и ipp/50, а разницами X-Y и ipp/50 - ipp'/50. Тут в ход идет полуэмпирика, и вы можете предложить а) не ставить в защиту армию, тогда сосед получит минимум ipp б) сказать, что вы ограбили нечто более ценное, чем ограбили у вас и что сравнивать X и Y нельзя. В действительности если рассматривать среднестатистический сценарий, то X и Y находятся в одной категории, равно как и ipp и ipp'
Давайте рассмотрим ситуацию, когда вы бафаете соседа. Опять же небольшое допущение - счастье мы рассматривать не будем, а будем оперировать в рамках золота/ресурсов. И второе допущение -если вы бафаете соседа, он бафает вас в ответ. К этому мы еще вернемся. В данном случае, при вашем баффе сосед получат 2X ресурсов, в ответ вы получаете 2Y ресурсов, количество ipp и у вас и у соседа по нулям.
Теперь, если учитывать возможность баффа, выгодность нападения будет в том случае, если
X-Y > 2Y
X> 3Y
Давайте осознаем этот момент. В левой части неравенства выгода от грабежа, в правой части неравенства - что бы вы могли получить, если бы сосед вас бафнул, а не напал, то есть удвоенные ваши ресурсы.
Таким образом, выгода при грабеже по сравнению с баффом наступает в том случае, если награбленное вами в три раза больше, чем то что у вас украл сосед. Пвп очки в данном случае нивилируются.
На самом деле, задача эта еще менее тривиальна, если мы не будем делать допущения о взаимном баффе - взаимном ответе на агрессию, и после этих рассуждений на пальцах, я бы хотел вернуться к названию статьи. Взаимотношение с соседями - это пример классической в теории игр дилеммы заключенного (Prisoner's dilemma), напомню тем, кто запамятовал университетский курс математических методов исследования операций.
Классическая формулировка дилеммы заключённого такова:
Есть два преступника - А и Б. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?
В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников, в экономической теории это состояние именуется равновесием нэша. Проще говоря, не важно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство. В этом и заключается диллема - рациональное решение не приводит к паретто-оптимуму, то есть такому состоянию, при котором значение каждого частного показателя, характеризующего систему, не может быть улучшено без ухудшения других - другими словами - это наилучшее состояние, которое соответствует ситуации что оба заключенных молчат.
Эта диллема классический вариант отношения игрок-сосед на первом ходу. Вы решаете - напасть на соседа, то есть предать, либо бафнуть его, то есть сотрудничать, при этом сами вы надеетесь, что сосед бафнет вас, а не будет нападать. То есть, если рассматривать ситуацию с этих позиций, то мы опять приходим к выводу, что нападать это рационально. Смотрим табличку - будем считать, что и вы, и сосед может ограбить примерно равное количество ресурсов (X=Y). Тогда если вы нападете, а сосед до этого бафнет вас, то вы получите 3Х ресурсов, а сосед ничего. Если и вы и сосед нападете - каждый получит по Х, наконец если оба бафнете - каждый по 2Х. В этой ситуации если мыслить рационально, то вы нападете, и тоже самое сделает ваш рационально мыслящий сосед, однако достигнутое равновесие не будет оптимальным по парето, ведь каждый из вас мог получить 2Х, без ущерба для себя любимого.
Вы нападаете: Сосед нападает - X:X
Вы нападаете: Сосед баффает - 3X: 0
Вы баффаете: Сосед нападает - 0:3X
Вы баффаете: Сосед баффает - 2X 2X
Однако останавливать размышления на этом нельзя. В игре мы имеем дело не с единичной, а с повторяющейся дилеммой заключенного. В ней участники делают выбор снова раз за разом и помнят предыдущие результаты, равно как и мы в игре помним тех, кто нас бафнул и тех, кто на нас напал вчера. Рассмотрение повторяющейся диллемы это проблема компьютерного моделирования с использованием различных алгоритмов. Сравнение разных программ показало, что «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса.
Лучшей из простых стратегией оказалась «Око за око» - сотрудничество на первом ходу после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт и нападает на вас, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства.
Анализируя стратегии, набравшие лучшие результаты, исследователи назвали несколько условий, необходимых, чтобы ваша стратегия игры получила высокий результат:
Добрая Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент.
Мстительная Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» игроки воспользуются этим и вы станете дойной коровой.
Прощающая Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать.
Не завистливая Последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.
Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением большего опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов.
На этом мой анализ подошел к концу, я надеюсь вы смогли подчерпнуть для себя что-то интересное. Если кто-то скажет, что не нападая на соседей, не завоевать первых мест в пвп турнирах, могу возразить, что это не так - пользуясь данными наработками я занимал первое места в каждой башне на протяжении всех веков в которых играл, вплоть до высокого средневековья, где я сейчас играю. В Высоком средневековье дважды имею первое место в пвп башне.
Спасибо за внимание, готов выслушать строго оформленную критику и замечания по моим выкладкам.
Действительно, тут мы сделаем первое допущение - допустим, что сосед по силе равен, либо слегка уступает вам, его ответные действия будут отнюдь не дружелюбны. При этом, будем считать, что равный по силе сосед разобьет вашу армию защиты, так же как вы разбили его, тогда он получит ipp'/50 очков рейтинга, и Y золота/ресурсов/товаров. Таким образом, уже на данном этапе видно, что удачность нападения будет определяться не X и ipp/50, а разницами X-Y и ipp/50 - ipp'/50. Тут в ход идет полуэмпирика, и вы можете предложить а) не ставить в защиту армию, тогда сосед получит минимум ipp б) сказать, что вы ограбили нечто более ценное, чем ограбили у вас и что сравнивать X и Y нельзя. В действительности если рассматривать среднестатистический сценарий, то X и Y находятся в одной категории, равно как и ipp и ipp'
Давайте рассмотрим ситуацию, когда вы бафаете соседа. Опять же небольшое допущение - счастье мы рассматривать не будем, а будем оперировать в рамках золота/ресурсов. И второе допущение -если вы бафаете соседа, он бафает вас в ответ. К этому мы еще вернемся. В данном случае, при вашем баффе сосед получат 2X ресурсов, в ответ вы получаете 2Y ресурсов, количество ipp и у вас и у соседа по нулям.
Теперь, если учитывать возможность баффа, выгодность нападения будет в том случае, если
X-Y > 2Y
X> 3Y
Давайте осознаем этот момент. В левой части неравенства выгода от грабежа, в правой части неравенства - что бы вы могли получить, если бы сосед вас бафнул, а не напал, то есть удвоенные ваши ресурсы.
Таким образом, выгода при грабеже по сравнению с баффом наступает в том случае, если награбленное вами в три раза больше, чем то что у вас украл сосед. Пвп очки в данном случае нивилируются.
На самом деле, задача эта еще менее тривиальна, если мы не будем делать допущения о взаимном баффе - взаимном ответе на агрессию, и после этих рассуждений на пальцах, я бы хотел вернуться к названию статьи. Взаимотношение с соседями - это пример классической в теории игр дилеммы заключенного (Prisoner's dilemma), напомню тем, кто запамятовал университетский курс математических методов исследования операций.
Классическая формулировка дилеммы заключённого такова:
Есть два преступника - А и Б. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?
В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников, в экономической теории это состояние именуется равновесием нэша. Проще говоря, не важно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство. В этом и заключается диллема - рациональное решение не приводит к паретто-оптимуму, то есть такому состоянию, при котором значение каждого частного показателя, характеризующего систему, не может быть улучшено без ухудшения других - другими словами - это наилучшее состояние, которое соответствует ситуации что оба заключенных молчат.
Эта диллема классический вариант отношения игрок-сосед на первом ходу. Вы решаете - напасть на соседа, то есть предать, либо бафнуть его, то есть сотрудничать, при этом сами вы надеетесь, что сосед бафнет вас, а не будет нападать. То есть, если рассматривать ситуацию с этих позиций, то мы опять приходим к выводу, что нападать это рационально. Смотрим табличку - будем считать, что и вы, и сосед может ограбить примерно равное количество ресурсов (X=Y). Тогда если вы нападете, а сосед до этого бафнет вас, то вы получите 3Х ресурсов, а сосед ничего. Если и вы и сосед нападете - каждый получит по Х, наконец если оба бафнете - каждый по 2Х. В этой ситуации если мыслить рационально, то вы нападете, и тоже самое сделает ваш рационально мыслящий сосед, однако достигнутое равновесие не будет оптимальным по парето, ведь каждый из вас мог получить 2Х, без ущерба для себя любимого.
Вы нападаете: Сосед нападает - X:X
Вы нападаете: Сосед баффает - 3X: 0
Вы баффаете: Сосед нападает - 0:3X
Вы баффаете: Сосед баффает - 2X 2X
Однако останавливать размышления на этом нельзя. В игре мы имеем дело не с единичной, а с повторяющейся дилеммой заключенного. В ней участники делают выбор снова раз за разом и помнят предыдущие результаты, равно как и мы в игре помним тех, кто нас бафнул и тех, кто на нас напал вчера. Рассмотрение повторяющейся диллемы это проблема компьютерного моделирования с использованием различных алгоритмов. Сравнение разных программ показало, что «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса.
Лучшей из простых стратегией оказалась «Око за око» - сотрудничество на первом ходу после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт и нападает на вас, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства.
Анализируя стратегии, набравшие лучшие результаты, исследователи назвали несколько условий, необходимых, чтобы ваша стратегия игры получила высокий результат:
Добрая Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент.
Мстительная Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» игроки воспользуются этим и вы станете дойной коровой.
Прощающая Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать.
Не завистливая Последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.
Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением большего опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов.
На этом мой анализ подошел к концу, я надеюсь вы смогли подчерпнуть для себя что-то интересное. Если кто-то скажет, что не нападая на соседей, не завоевать первых мест в пвп турнирах, могу возразить, что это не так - пользуясь данными наработками я занимал первое места в каждой башне на протяжении всех веков в которых играл, вплоть до высокого средневековья, где я сейчас играю. В Высоком средневековье дважды имею первое место в пвп башне.
Спасибо за внимание, готов выслушать строго оформленную критику и замечания по моим выкладкам.
Последнее редактирование модератором: