据说是一个monte carlo simulation的模拟,老毛子跟我说的,我不懂monte carlo。
一个系统有2000个cpu,有若干个任务(>>2000)等待执行,每个任务消耗CPU时间不等,
从几分钟到几小时都有。每个任务在结束的时候,都会产生一个输出文件,大小从几K
到100G不等。注意输出的文件大小跟运行时间没有关系。任务之间也是相互独立的。这
些文件产生之后通过网络写入到一个NFS server。整个过程就是这样。
现在这个系统的瓶颈在NFS的写入速度上。如果有大并发同时写NFS的时候,比如说超过
100个concurrent writers,NFS会崩溃,所有写入失败。
问怎样能提高这个系统的性能?这里的提高性能是指在不增加额外NFS的情况下,最大
限度的提高NFS的平均写入速率。
Answer:先用一些短的CPU任务去跑~~
星星@GZ#杂(3165281) 01:21:19
跑到NFS挂,多挂几次~~就能得到统计概率的任务长短分布和I/O分布~~
星星@GZ#杂(3165281) 01:21:46
然后根据这个样本得到的概率,来调度实际任务集的执行情况~~
No comments:
Post a Comment