示例:
我在一段时间内有100个样本.但我只能使用10个值来绘制折线图.如果我使用所有100个精确样本绘制它,我可以使用什么算法来计算这10个代表值以使图表看起来相似.
计算每10个样本的平均值的朴素算法不能很好地反映图表中的峰值.
您可以使用Douglas-Peucker算法来获得最佳欠采样表示.
该算法以仅原始数据集的端点开始构建欠采样集.在每个步骤中,原始数据集中距离欠采样表示"最远"(最大误差)的点被添加到欠采样集.以这种方式,算法包括原始数据集中的重要峰值,并构造最小误差的欠采样表示.
由于您的欠采样集中只允许10个点,因此您可以将算法设置为仅将欠采样集增加到10.
如果您的原始数据集包含太多峰值,那么您将无法捕获它们并满足大小约束.
希望这可以帮助.