运筹学 / 习题/考试 / 作业 / 4
从旧 .com 全量搬运的历史内容,来源路径:/math/课程/运筹学/exams/作业/4/
约 2 分钟阅读
迁移来源
Homework 4 #
姓名: 刘欣楠 班级: 数学强基 2301 学号: 2233310237
解:
设单件样品合格的概率为
p=0.4,1−p=0.6.
每次试制一批 n 件样品时的费用为
C(n)=200+100n,n=1,2,…,5,
其中 200 元为每批装配费,100n 为本批 n 件样品的制造费。
设在三个月内未能交出合格样品则需支付违约金 2000 元。
(1) #
将三次试制视作三个阶段 k=1,2,3。
在第 k 次试制前的状态变量记为
s_k=
\begin{cases}
0, & \text{到目前为止尚未制出合格样品},\
2mm]
1, & \text{到目前为止已经制出至少一件合格样品}.
\end{cases}
第 $k$ 阶段的决策变量为
x_k=n \in {1,2,3,4,5},
表示在本批中生产 $n$ 件样品
若在状态 $s_k=0$ 时选择 $x_k=n$,则本批中至少出现一件合格样品的概率为
1-(1-p)^n = 1-0.6^n,
全部不合格的概率为 $0.6^n$。于是有状态转移概率
P(sk+1=1∣sk=0,xk=n)P(sk+1=0∣sk=0,xk=n)=1−0.6n,=0.6n.
若某阶段前已经有合格品($s_k=1$),则以后一直保持有合格品且不再生产:
P(s_{k+1}=1\mid s_k=1)=1,\qquad
P(s_{k+1}=0\mid s_k=1)=0.
### (2)
把“第三次试制结束后”的时刻记为阶段 $k=4$。
令 $f_k(s)$ 表示在第 $k$ 阶段开始、系统处于状态 $s$ 时,
从该阶段起到合同结束的最小期望总费用。
终端阶段($k=4$):
$
f_4(1)=0, \qquad f_4(0)=2000.
$
对 $k=1,2,3$:
$
f_k(1)=0
$
当 $s_k=0$ 时要作决策 $x_k=n$,有
fk(0)=1≤n≤5min{C(n)+(1−0.6n)fk+1(1)+0.6nfk+1(0)}=1≤n≤5min{200+100n+0.6nfk+1(0)},
因为 $f_{k+1}(1)=0$。
\medskip
**向后递推计算:**
**阶段 3:**
f_4(0)=2000.
于是
f3(0)=1≤n≤5min{200+100n+0.6n⋅2000}=min{1500,1120,932,859.2,855.52}.
故 $f_3(0)=855.52$,最优决策为 $n_3^*=5$。
**阶段 2:**
f2(0)=1≤n≤5min{200+100n+0.6nf3(0)}=min{813.312,707.9872,684.79232,710.875392,766.5252352}.
故 $f_2(0)=684.79232$,最优决策为 $n_2^*=3$。
**阶段 1:**
f1(0)=1≤n≤5min{200+100n+0.6nf2(0)}=min{710.875392,646.5252352,647.91514112,688.749084672,753.2494508032}.
故 $f_1(0)=646.5252352$,最优决策为 $n_1^*=2$。
\medskip
**结论:**
该随机动态规划模型的最优策略为:
⎩⎨⎧第 1 批生产 2 件样品;若尚无合格品,第 2 批生产 3 件样品;若仍无合格品,第 3 批生产 5 件样品。
在此最优策略下,从最初状态 $s_1=0$ 出发的最小期望总费用为
f_1(0)\approx 646.53\ \text{元}。
讨论
评论
正在加载评论...