[TOC]
3 Screening
Screening theory:机制设计理论可以被看作是其多智能体的拓展。
概率论:是初始分析,广泛用于促进理论分析。
3.1 为单个不可分割的项目定价
模型
卖方寻求出售一件不可分割的物品。
卖方的目标是使预期收入最大化。
为什么收入最大化此福利最大化更复杂?
卖方被假设为风险中立。
风险中立,风险规避,风险追求?(举例)。
只有一个买家对该物品的价值为θ。
u={θ−t,0,Buyer pays t for this itemOtherwise
θ对买方来说是私有的并且取决于买方的类型。
3.1.1 对θ的假设
θ代表的是买方对物品的估价,卖方虽然不能直接获得,但是可以从以往的数据中找到大多数人对这个物品的购买价格(不包括非理性个体)。
- 假设卖方对θ的可能值有一个概率分布。
- 这种分布可以用CDF F和PDF f描述。
- F在一个区间[θ,θ]内,其中0<θ<θ;并且$f(\theta)>0,\forall \theta \in [\underline{\theta}, \overline{\theta}] $
- 在卖方看来,θ是一个具有CDF F的随机变量(但实际上它只由买方观察)
3.1.2 问题描述
卖方:找到一个出售物品的程序,使其预期收入最大化(即设计一个博弈和策略,又称机制的规则)。
买方:遵循设计好的机制,在知道θ值的情况下,选择自己的策略,使其预期效用最大化。
第一种猜测:卖方应该选择一种博弈,根据这种博弈,买方只有一种选择,即买方没有得到物品,但必须支付t,其中t可以是一些任意大的数字。(为什么要排除这种机制?)答案是个人理性!
第二种猜测:卖方应该使用"讨价还价"、“抽签”…(复杂)我们能否将注意力限制在一小部分机制上
定义
一个"直接机制"由函数q和t组成,其中
q:[θ,θ]⟶[0,1](Possibilities)t:[θ,θ]⟶R(TrueValue)
对直接机制的解释:
- 买方被要求报告θ(实话实说)。
- 买方以q(θ)的概率赢得该物品。
- 买方必须向卖方支付t(θ)
问题:我们总能找到一个直接的机制吗?
启示原则
命题(启示录原则)
给定一个具有相应平衡/解决方案的机制,存在一个直接机制,其中
- 买方如实报告其价值是一种均衡/解决方案。
- 结果与给定机制产生的结果相同。
很明显,这使我们能够大大简化我们的分析,因为它表明,在不丧失一般性的情况下,我们可以把寻找最优机制的工作限制在直接机制上。
确定q(θ)和t(θ),其中如实报告θ对买方是最优的。
考虑到直接机制,买方的预期效用变为
u(θ)=θq(θ)−t(θ)
3.1.3 特性
定义(激励相容性,IC)
如果对每一个买方类型来说,如实告知都是最优策略,也就是说这个直接机制具备激励相容性:
u(θ)=θq(θ)−t(θ)≥θq(θ′)−t(θ′),∀θ,θ′∈[θ,θ]
定义(个人理性,IR)
如果买方以真实的类型自愿参与拍卖,即这个直接机制满足个人理性:
u(θ)≥0,∀θ∈[θ,θ]
满足IC的条件
引理
如果一个直接机制是激励相容的,那么分配概率q随着θ的增加而增加。
引理
如果一个直接机制是激励相容的,那么买方的效用函数u是递增和凸的,并且满足:
u′(θ)=∂θ∂u(θ)=q(θ)
引理
如果一个直接机制是激励相容的,那么对于所有θ∈[θ,θ]有:
u(θ)=u(θ)+∫θθq(x)dx,t(θ)=t(θ)+(θq(θ)−θq(θ))−∫θθq(x)dx.
命题
一个直接机制(q,t)是激励相容的当且仅当下列条件
- q是θ的增函数。
- 对于任意θ∈[θ,θ],有
t(θ)=t(θ)+(θq(θ)−θq(θ))−∫θθq(x)dx.
IR的条件与影响
命题
当且仅当u(θ)≥0时,一个激励兼容的机制是个人理性的。
引理
有了IC和IR,为了使卖家的收入最大化,我们应该设定
t(θ)=θq(θ) and t(θ)=θq(θ)−∫θθq(x)dx
3.2 为无限可分的项目定价
模型
卖方试图将一个可无限分割的物品,如糖,卖给一个买方。
卖方的目标是使预期收入最大化(风险中立)。
卖方有一个线性生产成本,即生产数量q的物品的成本为cq,其中c>0是一个常数。
买方购买数量q≥0的物品,支付t的效用为:
u=θv(q)−t
这里,假设v(0)=0,v′(q)>0,v′′(q)<0,∀q≥0,也就是从0开始,增长的速度越来越缓慢,类似于边际效应。
θv(q)表示买方对数量q的物品的支付意愿。
3.2.1 对θ的假设
参数θ反映了买方对该物品的重视程度。
- 假设卖方对θ的可能值有一个概率分布。
- 这种分布可以用CDF F和PDF f描述。
- F在一个区间[θ,θ]内,其中0<θ<θ;并且$f(\theta)>0,\forall \theta \in [\underline{\theta}, \overline{\theta}] $
- 在卖方看来,θ是一个具有CDF F的随机变量(但实际上它只由买方观察)
定义
一个"直接机制"由函数q和t组成,其中
q:[θ,θ]⟶[0,1](可能性)t:[θ,θ]⟶R(真实值)
对直接机制的解释:
- 买方被要求报告θ(实话实说)。
- 买方以q(θ)的概率赢得该物品。
- 买方必须向卖方支付t(θ)
与单一不可分物品的不同是
买方的效用函数现在是u(θ)=θv(q(θ))−t(θ)而不是θq(θ)−t(θ)
3.2.3 特性
一个直接机制(q,t)是激励相容的当且仅当下列条件
- q是θ的增函数。
- 对于任意θ∈[θ,θ],有
t(θ)=t(θ)+(θv(q(θ))−θv(q(θ)))−∫θθv(q(x))dx.
一个激励兼容的机制是个人理性的当且仅当:
u(θ)=t(θ)−θv(q(θ))≥0
3.2.4 收益最大化
引理
有了IC和IR,为了使卖家的收入最大化,我们应该设定
t(θ)=θv(q(θ)) and t(θ)=θv(q(θ))−∫θθv(q(x))dx
剩余的问题:如何确定函数q(即资源分配)?
回顾一下,卖方的收入等于从买方收取的价格和其生产成本之间的差额。
取期望值并代入的表达式,我们有
对括号中的表达式进行导数,我们有
v′(q(θ))(θ−f(θ)1−F(θ))−c=0
即
v′(q(θ))(θ−f(θ)1−F(θ))=c
如果θ−f(θ)1−F(θ)≤0,那么最优选择是q(θ)=0,为什么?
如果θ−f(θ)1−F(θ)>0,但v′(0)(θ−f(θ)1−F(θ))≤c,那么最优解q(θ)=0。为什么?
如果θ−f(θ)1−F(θ)>0,但v′(0)(θ−f(θ)1−F(θ))>c,那么最优解q(θ)可以通过求解上述方程得到。
剩余的问题: q是否是θ的增函数?
给定以下假设,q一定是θ的增函数
假设
θ−f(θ)1−F(θ)是θ的增函数
注意
这就是所谓的 increasing hazard rate 条件。
如果一个分布F满足这样的条件,那么它就被称为 regular 的。
3.2.5 最优解决方案
命题
假设F是 regular 的。那么,一个预期利润最大化的q的选择是由以下公式给出
- 如果v′(0)(θ−f(θ)1−F(θ))≤c,我们有q(θ)=0;
- 否则,通过求解v′(q(θ))(θ−f(θ)1−F(θ))=c得到最优的q(θ)。
利润最大化的t由以下公式给出
t(θ)=θv(q(θ))−∫θθv(q(x))dx