作为机器学习部署项目的一部分,我构建了一个概念验证,我使用R glm函数和python 为二进制分类任务创建了两个简单的逻辑回归模型scikit-learn.之后,我PMML使用pmmlR中的from sklearn2pmml.pipeline import PMMLPipeline函数和Python中的函数将训练好的简单模型转换为s .
接下来,我在KNIME中打开了一个非常简单的工作流程,看看我是否可以将这两个人PMML付诸行动.基本上,这种概念验证的目标是测试IT是否可以使用PMML我简单地交给他们的s来获取新数据.这个练习必须产生概率,就像原始的逻辑回归一样.
在KNIME,我只读4使用行的测试数据CSV Reader节点,请阅读PMML使用PMML Reader节点,最后得到该模型用得分测试数据PMML Predictor节点.问题是预测不是我想要的最终概率,而是在此之前的一步(系数之和乘以自变量值,我猜是XBETA?).请参阅下图中的工作流程和预测:
要获得最终概率,需要通过sigmoid函数运行这些数字.所以基本上对于第一个记录,而不是2.654,我需要1/(1+exp(-2.654)) = 0.93.我确信该PMML文件包含启用KNIME(或任何其他类似平台)为我执行此sigmoid操作所需的信息,但我找不到它.那是我迫切需要帮助的地方.
我查看了回归和一般回归 PMML文档,我的PMML看起来很好,但我无法弄清楚为什么我无法获得这些概率.
任何帮助都非常感谢!
age credit payfreq gmi
25 550 4 1500
27 650 4 3400
35 600 2 3200
40 680 2 4000
Run Code Online (Sandbox Code Playgroud)
<?xml version="1.0"?>
<PMML version="4.2" xmlns="http://www.dmg.org/PMML-4_2" …Run Code Online (Sandbox Code Playgroud) Knime为我生成了一个PMML模型.这时我想将这个模型应用于python进程.这样做的正确方法是什么?
更深入:我开发了一个django学生出勤系统.该应用程序已经非常成熟,我有时间实现"我感觉很幸运"按钮,以自动填写出席表格.这就是PMML的用武之地.Knime已经生成了一个预测学生出勤率的PMML模型.另外,感谢django如此高效,以至于我为这项伟大的工作留出时间;)

我需要在将生成为 PDF 的报告上创建目录。不幸的是,BIRT 中的 TOC 机制在导出为 PDF 时是添加书签。但是,我需要放置一个报告
A 部分.................................................1
B 部分 .....................4
C节.................................................10
在报告的第一页。
我在有关此主题的书籍中找不到任何内容。这样做的机制是什么?任何建议将不胜感激。
谢谢。
在Knime中,如何为行创建顺序ID.我想用它们来分配维度中的主要ID.
另外我想知道,我如何只采用有限数量的行(如前5或后10),并随机获取样本
有没有一种简单的方法可以通过配置文件或菜单选项来增加 Knime 中可用的 RAM?
我在执行过程中不断遇到“堆空间”错误,默认情况下,它将分类变量的数量限制为 1,000,并且难以显示超过 n 个值(~10,000)的图表。
示例错误:
ERROR Decision Tree Learner 0:65 Execute failed: Java heap space
Run Code Online (Sandbox Code Playgroud)
谢谢!
我拥有许多科学出版物的XML数据,并且试图解析KNIME中的数据以提取所需的字段。这是一个示例:https : //eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pmc&id=PMC4400176
为了提取作者的姓名,我使用以下XPath查询: /pmc-articleset/article/front/article-meta/contrib-group/contrib[@contrib-type="author"]
但是,这返回:
BorisovaSvetlana A., KimHak Joong, PuXiaotao, LiuHung-wen*
我希望姓氏和名字之间用分隔符,逗号/空格隔开,而不同的作者姓名之间用分号隔开。这可能吗?还是有比我目前正在做的更好的方法来提取信息,这将使我获得理想的输出结果:
Borisova, Svetlana A.; Kim, Hak Joong; Pu, Xiaotao; Liu, Hung-wen*
[编辑]
当前的KNIME工作流程:
样品电流输出:
我尝试将所有出版物的所有作者姓名输出到收集单元中。(如果我将所有名称输出到多列中,那么最终会创建数百个包含缺失值的列。我什至尝试使用多个字符串操作来实现理想的输出,但是由于某些原因,它仍然不够完美作者名称具有多个名称,带连字符的名称或包含特殊字符的名称。)收集单元将所有作者名称与每个作者名称之间的逗号分隔符组合在一起,但将姓氏和给定名称组合在一起。我还可以对它们进行相同的上述字符串操作,但仍然遇到与上述相同的问题。
如果我将作者姓名分成多行,则会为每篇文章创建多行,因此我不确定该如何达到每篇文章的最终目标。
最终目标:
任何与作者解决此问题的想法将不胜感激!
我为eclipse(knime)写了一个插件.但是eclipse生成的jar不包含任何类:
jar tvf plugins/fr.inserm.umr915.knime4ngs.nodes_1.0.0.jar
0 Thu May 19 08:45:26 CEST 2011 META-INF/
2543 Thu May 19 08:45:24 CEST 2011 META-INF/MANIFEST.MF
7941 Thu May 19 08:45:24 CEST 2011 plugin.xml
Run Code Online (Sandbox Code Playgroud)
这是我的清单的内容:
Manifest-Version: 1.0
Bundle-ManifestVersion: 2
Bundle-Name: Node extension for KNIME Workbench
Bundle-SymbolicName: fr.inserm.umr915.knime4ngs.nodes;singleton:=true
Bundle-Version: 1.0.0
Bundle-Vendor: Pierre
Require-Bundle: org.eclipse.core.runtime,
org.knime.workbench.core,
org.knime.workbench.repository,
org.knime.base
Bundle-RequiredExecutionEnvironment: JavaSE-1.6
Export-Package: fr.inserm.umr915.knime4ngs.corelib.bio,
fr.inserm.umr915.knime4ngs.corelib.knime,
fr.inserm.umr915.knime4ngs.corelib.util,
fr.inserm.umr915.knime4ngs.nodes.bam.view,
fr.inserm.umr915.knime4ngs.nodes.sql.query;
uses:="org.knime.core.node,
org.eclipse.core.runtime,
org.osgi.framework,
org.knime.core.data,
org.knime.core.node.defaultnodesettings,
fr.inserm.umr915.knime4ngs.corelib.knime",
fr.inserm.umr915.knime4ngs.nodes.unix.echo;
(... other packages here ...)
uses:="fr.inserm.umr915.knime4ngs.nodes,
org.knime.core.node,
org.eclipse.core.runtime,
org.osgi.framework,
org.knime.core.node.defaultnodesettings"
Run Code Online (Sandbox Code Playgroud)
有帮助吗?谢谢
编辑:这是我的build.properties: …
我有一个姓氏和名字同时出现的名字列表:
BorisovaSvetlana A.; KimHak Joong; PuXiaotao; LiuHung-wen*
Run Code Online (Sandbox Code Playgroud)
我想在姓和名之间添加一个逗号和空格,以使输出为:
Borisova, Svetlana A.; Kim, Hak Joong; Pu, Xiaotao; Liu, Hung-wen*
Run Code Online (Sandbox Code Playgroud)
我在KNIME中使用一个String Manipulation节点,并且我想regexReplace($col1$, ,"")会使用它,也许使用[az]和[AZ]进行某种先行查找以直接在大写字母后写一个小写字母,但是我对regex不熟悉到目前为止,这就是我所拥有的。
我该如何解决这个问题?
执行包含大约 400k 行的 CSV 文件时收到以下错误
错误:
错误 CSV 读取器 2:1 执行失败:数据元素太少(行:2 (Row0),源:'file:/Users/shobha.dhingra/Desktop/SBC:Non%20SBC/SBC.csv')
我尝试用几行执行另一个 csv 文件,没有遇到问题。
我有一个数据集,其中每个缺失值都有 N/A,如何将其更改为列本身内部的实际缺失值。
我一直在尝试使用规则引擎节点,但它不起作用.. 有
什么建议吗?
knime ×10
pmml ×2
python ×2
birt ×1
csv ×1
data-science ×1
eclipse ×1
export ×1
file ×1
imputation ×1
missing-data ×1
nan ×1
r ×1
regex ×1
regex-greedy ×1
regex-group ×1
rows ×1
string ×1
xml ×1
xpath ×1