小编Jin*_*inx的帖子

使用python进行非线性回归 - 更好地拟合这些数据的简单方法是什么？

我有一些想要拟合的数据，因此我可以对给定温度的物理参数值进行一些估计。

我将 numpy.polyfit 用于二次模型，但拟合并不像我希望的那么好，而且我对回归没有太多经验。

我已经包含了numpy提供的散点图和模型： S vs Temperature; 蓝点是实验数据，黑线是模型

x 轴是温度（以 C 为单位），y 轴是参数，我们将其称为 S。这是实验数据，但理论上 S 应该随着温度的升高趋于 0，随着温度的降低而趋向于 1。

我的问题是：我怎样才能更好地拟合这些数据？我应该使用哪些库，什么样的函数可以比多项式更好地近似这些数据，等等？

如果有帮助，我可以提供代码、多项式系数等。

这是我的数据的 Dropbox 链接。（避免混淆的重要说明，虽然它不会改变实际回归，但此数据集中的温度列是 Tc - T，其中 Tc 是转变温度（40C）。我通过计算 40 使用 Pandas 将其转换为 T - X）。

python regression curve-fitting

Jin*_*inx

2018 08-23

14
推荐指数

2
解决办法

5万
查看次数

卡米洛特 PDF 尺寸

在发布此内容之前，我已经广泛搜索了 stackoverflow，但未能在 Camelot 页面尺寸上找到任何内容。有这个问题，建议使用table_region，但这并不能解决OP或我的问题。不幸的是，我无法发表评论来跟进OP，看看他们是否找到了解决方案。

\n\n

我正在尝试做的事情：

\n\n

我正在使用 Camelot 来识别表（显然）。有时，当我知道页面的哪个区域可能包含感兴趣的表时，我只想在该区域中进行搜索。camelot.read_pdf()使用\可以轻松完成此操作table_region- 我只需要提供一对坐标供 Camelot 进行搜索。

\n\n

问题是，我使用 PyMuPDF 获取这些坐标，因此它们位于 PyMuPDF 的坐标系中。我已经弄清楚如何翻译这些坐标，但我缺少来自 Camelot 的一条关键信息 - 页面的尺寸。这些值很容易在 PyMuPDF（Page 类.bound()，我需要 Camelot 等效值。如果有人认为之间可能有替代方案，我可以在这里提供代数的进一步解释

\n\n

到目前为止我已经尝试过的：

\n\n

我阅读了文档。由于文档中的这一行，我想知道这是否可以提供一种获取尺寸的方法：“在使用 Lattice 时，可能会出现检测到较小的线 don\xe2\x80\x99t 的情况。最小线的大小检测到的结果是通过将 PDF 页面\xe2\x80\x99s 尺寸除以名为的缩放因子来计算的line_scale计算的。默认情况下，其值为 15"

\n\n

我对替代方案持开放态度，本质上我要么想检查页面的某个区域是否包含表格（PyMuPDF坐标系中描述的区域，对于pdf页面，尺寸通常为（612, 792），原点位于顶部左角。camelot 的原点位于左下角），或者页面上的任何表格位于给定区域（如果有意义的话）。

python python-camelot pymupdf

Jin*_*inx

lucky-day

6
推荐指数

1
解决办法

2697
查看次数

Python将列表分组为具有约束的子组

我真的搜索了这个，因为我几乎可以肯定之前已经问过一些变化，但我无法在谷歌中输入正确的术语来获得与我想要做的结果相匹配的结果。一般来说，人们似乎在寻找不受限制的总组合。

我正在尝试执行以下操作：

给定一个这样的列表：

[1, 1, 2, 2, 3, 3]将其分为[1, 2, 3]尽可能多的组

所以

[1, 1, 2, 2, 3, 3]->[[1, 2, 3], [1, 2, 3]]

[1, 1, 2, 3, 3]->[[1, 2, 3], [1, 3]]

[1, 1, 3, 3, 5]->[[1, 3, 5], [1, 3]]

[1, 4, 4, 7]->[[1, 4, 7], [4]]

笔记：

输入总是会被排序，但这些数字的值是未知的，所以它需要在一般意义上工作。
我的想法是，我有一些具有某些属性的对象，需要将它们组合在一起以创建不同的对象，但有时我会得到重复（并且可能是不完整的重复）——即，我曾经认为我的对象的属性总是只是但[1, 2, 3]事实证明有时我可以得到[1, 1, 2, 2, 3, 3]，我需要一种方法将其分成两个[1, 2, 3]列表以在下游创建一个中间对象。

python grouping

Jin*_*inx

2022 04-01

3
推荐指数

1
解决办法

413
查看次数