摘要
流式生存数据是一个随时间延续而无限增长的动态生存数据集合,由于数据集以流的形式不断高速到达,一旦当前批次的数据到来,经过快速处理后就要被释放,不能继续保留在内存中。基于右删失流式生存数据来解析协变量与生存时间之间的相关性时,加速失效时间模型(AFT模型)是常被使用的模型之一。文章基于带流数据集的AFT模型,通过泰勒展开构造一个Working估计方程,提出可再生估计,该估计仅依赖历史批数据集的汇总统计量和当前批数据集,有效避免了计算机对历史批数据存储带来的压力。模拟分析和实证结果表明,基于带流数据集的AFT模型提出的可再生估计方法在有限样本中的运行性能较好,在实践中具有可操作性。
- 单位