在SciPy中拟合分布时如何检查收敛性

html5 • 2022年9月21日 pm4:06 • 问答

在 SciPy 中拟合分布时有没有办法检查收敛性？

我的目标是将 SciPy 分布（即 Johnson S_U 发行版）拟合到数十个数据集，作为自动数据监控系统的一部分。大多数情况下它工作正常，但一些数据集异常并且显然不遵循 Johnson S_U 分布。适合这些数据集静默地发散，即没有任何警告/错误/无论如何！相反，如果我切换到 R 并尝试在那里拟合，我永远不会得到收敛，这是正确的 - 无论拟合设置如何，R 算法都拒绝声明收敛。

数据：Dropbox 中有两个数据集：

data-converging-fit.csv...拟合很好地收敛的标准数据（您可能认为这是一个丑陋、倾斜且中心质量重的斑点，但 Johnson S_U 足够灵活以适应这样的野兽！）：

data-diverging-fit.csv ...拟合发散的异常数据：

代码拟合分布：

import pandas as pd
from scipy import stats

distribution_name = 'johnsonsu'
dist = getattr(stats, distribution_name)

convdata = pd.read_csv('data-converging-fit.csv', index_col= 'timestamp')
divdata  = pd.read_csv('data-diverging-fit.csv', index_col= 'timestamp')

在好的数据上，拟合参数具有共同的数量级：

a, b, loc, scale = dist.fit(convdata['target'])
a, b, loc, scale

[out]: (0.3154946859186918, 
 2.9938226613743932,
 0.002176043693009398,
 0.045430055488776266)

在异常数据上，拟合参数不合理：

a, b, loc, scale = dist.fit(divdata['target'])
a, b, loc, scale

[out]: (-3424954.6481554992, 
7272004.43156841, 
-71078.33596490842, 
145478.1300979394)

我仍然没有收到一条关于拟合未能收敛的警告。

通过在 StackOverflow 上研究类似的问题，我知道将我的数据装箱然后使用curve_fit. 尽管它具有实用性，但我认为该解决方案并不正确，因为这不是我们拟合分布的方式：分箱是任意的（分箱数）并且它会影响最终拟合。一个更现实的选择可能是scipy.optimize.minimize回调以了解收敛的进展；我仍然不确定它最终会告诉我算法是否收敛。

以上是在SciPy中拟合分布时如何检查收敛性的全部内容。

THE END

二维码

如何正确设置localStorage变量

< <上一篇

用于字符串中可选等号分隔符的Powershell正则表达式

下一篇>>

搜索内容

在SciPy中拟合分布时如何检查收敛性

目录

目录

推荐文章

最新文章