蓄水池抽样算法(Reservoir Sampling)

Administrator @ 3个月前

给定一个数据流,数据流长度N很大,且N直到处理完所有数据之前都不可知,请问如何在只遍历一遍数据(O(N))的情况下,能够随机选取出m个不重复的数据。