我在谷歌上搜索了几个小时,但没有看到任何要转换的代码/包。
对此的任何指导将不胜感激。
LDA 与朴素贝叶斯在机器学习分类方面的优缺点是什么?
我知道一些差异,比如朴素贝叶斯假设变量是独立的,而 LDA 假设高斯类条件密度模型,但我不明白什么时候使用 LDA,什么时候使用 NB 取决于情况?
classification machine-learning naivebayes linear-discriminant machine-learning-model
我正在编写一个文档,其中应该包含使用朴素贝叶斯(生成)和逻辑回归(判别)模型进行文本分类之间的主要区别。
在我的研究中,我遇到了朴素贝叶斯模型的这个定义:https : //nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html
文档
d在类中的概率c计算为......其中术语出现在类文档中p(tk|c)的条件概率......tkc
当我开始比较生成模型和判别模型时,我发现 StackOverflow 上的这个解释被接受了:生成算法和判别算法之间有什么区别?
一个生成模型学习的联合概率分布
p(x,y)和判别模型学习的条件概率分布p(y|x)-你应该读作“给定x和y的概率”。
在这一点上我感到困惑:朴素贝叶斯是一个生成模型并使用条件概率,但与此同时,判别模型被描述为好像它们学习了条件概率,而不是生成模型的联合概率。
有人可以对此有所了解吗?
谢谢!
随着 Google 最近发布了集成了所有 MLOps 平台的Vertex AI,我想知道在 GKE 上提供定制训练的 PyTorch/Tensorflow 模型与 Vertex AI(或 AI Platform Unified,因为刚刚进行了品牌重塑,并且 AI Platform 已经)有什么区别提供服务模型预测的能力)。
我做了很多研究,但几乎没有找到这方面的信息。我已经在 GKE 上托管我的 ML 模型,是否值得迁移到 Vertex AI?
注意:我还不打算在云上进行训练和其他数据预处理。
google-kubernetes-engine machine-learning-model google-ai-platform
我正在尝试保存一个经过微调的 bert 模型。我已经正确运行了代码 - 它工作正常,并且在 ipython 控制台中我可以调用 getPrediction 并让它产生结果。
我保存了体重文件(最高的是 model.ckpt-333.data-00000-of-00001
我不知道如何保存模型以供重复使用。
我正在使用 bert-tensorflow。
import json
import pandas as pd
import tensorflow as tf
import tensorflow_hub as hub
from datetime import datetime
from sklearn.model_selection import train_test_split
import os
print("tensorflow version : ", tf.__version__)
print("tensorflow_hub version : ", hub.__version__)
#Importing BERT modules
import bert
from bert import run_classifier
from bert import optimization
from bert import tokenization
#set output directory of the model
OUTPUT_DIR = 'model'
#@markdown Whether or not to clear/delete …Run Code Online (Sandbox Code Playgroud) 与我从.h5文件加载该训练模型时相比,在训练后测试 Keras LSTM 模型时,我有很大的不同(第一个的准确度总是 > 0.85,但后者的准确度总是低于 < 0.2,即随机猜测) .
但是我检查了权重,它们是相同的,而且 Keras 给我的稀疏布局 viaplot_model是相同的,但由于这只能检索粗略的概述:
是否可以显示 Keras 模型的完整布局(尤其是节点连接)?
visualization lstm keras recurrent-neural-network machine-learning-model
我试图加载我在训练期间保存的 keras 模型。所以我去了keras 文档,在那里我看到了这个。
从 TensorFlow 格式加载权重时,仅支持拓扑加载 (by_name=False)。请注意,对于从 tf.keras.Model 继承的用户定义类,TensorFlow 和 HDF5 格式之间的拓扑加载略有不同:HDF5 基于权重的扁平列表进行加载,而 TensorFlow 格式则基于属性的对象局部名称进行加载。层在模型的构造函数中分配。
能否请您解释一下上面的内容?
python computer-vision keras tensorflow machine-learning-model
是否可以从数据中学习二元决策图(BDD)(以机器学习的方式)?如果是这样,怎么办?
背景:我在 Python 中看到过一些工具可以在例如带有scikit-learn 的决策树(DT)中完成此任务,但我还没有看到任何用于 BDD 的工具。
举个例子,我想做的事情如下:
前三列对应于“输入”数据集(xi),标签为(y)。N 对应于计数,您可以使用后者来计算准确性。请注意,这不是割集矩阵。在中间,你可以看到一个对应的BDD(这是我想要获得的图),在右边是一个对应的DT。
python machine-learning binary-decision-diagram machine-learning-model
我训练了一个逻辑回归模型.现在我必须用新的训练数据集更新(部分拟合)模型.可能吗 ?
machine-learning scikit-learn logistic-regression machine-learning-model
我有超过一百万张我想用作训练数据的图像。如何在不损害安全性的情况下免费提供这些数据?
我希望用户能够快速将其用于培训目的,而又不给黑客提供机会从开源数据重建图像。同时,我不希望培训质量受到任何影响。
换句话说,如何安全地开源图像?
例如,此代码生成numpy数组。在这种情况下,我只想让从ndarray“ x”重建原始图像变得非常困难。
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img
i = load_img('some_image.jpg' )
x = img_to_array(i)
x = x.reshape((1,) + x.shape)
Run Code Online (Sandbox Code Playgroud)
一旦知道黑客无法使用数据并创建相同的映像,便可以共享数组x。
opencv conv-neural-network keras tensorflow machine-learning-model