标签: dataset

朴素贝叶斯分类的简单解释

我发现很难理解Naive Bayes的过程,我想知道是否有人可以用英语简单的一步一步解释它.我理解它需要按时间比较概率,但我不知道训练数据如何与实际数据集相关.

请给我一个关于训练集扮演什么角色的解释.我在这里给出一个非常简单的水果例子,例如香蕉

training set---
round-red
round-orange
oblong-yellow
round-red

dataset----
round-red
round-orange
round-red
round-orange
oblong-yellow
round-red
round-orange
oblong-yellow
oblong-yellow
round-red
Run Code Online (Sandbox Code Playgroud)

algorithm classification machine-learning dataset naivebayes

538
推荐指数
5
解决办法
35万
查看次数

在Pandas中将浮动转换为int?

我一直在处理从CSV导入的数据.Pandas将一些列更改为float,所以现在这些列中的数字显示为浮点数!但是,我需要将它们显示为整数,或者不使用逗号.有没有办法将它们转换为整数或不显示逗号?

python floating-point integer dataset pandas

192
推荐指数
9
解决办法
38万
查看次数

我应该Dispose()DataSet和DataTable吗?

DataSet和DataTable都实现了IDisposable,因此,通过传统的最佳实践,我应该调用它们的Dispose()方法.

但是,从我到目前为止所读到的,DataSet和DataTable实际上并没有任何非托管资源,因此Dispose()实际上并没有做太多.

另外,我不能只使用,using(DataSet myDataSet...)因为DataSet有一组DataTables.

所以,为了安全起见,我需要遍历myDataSet.Tables,处理每个DataTable,然后处理DataSet.

那么,在我的所有DataSet和DataTables上调用Dispose()是否值得麻烦?

附录:

对于那些认为应该处理DataSet的人:通常,处理的模式是使用usingor try..finally,因为你想保证将调用Dispose().

然而,这对于一个集合来说真的很快.例如,如果对Dispose()的一个调用抛出异常,你会怎么做?你吞下它(这是"坏"),以便你可以继续处理下一个元素?

或者,你是否建议我只调用myDataSet.Dispose(),而忘记在myDataSet.Tables中处理DataTables?

datatable dispose idisposable using dataset

187
推荐指数
7
解决办法
10万
查看次数

数据集与数据集

我目前使用DataTable从数据库中获取结果,我可以在我的代码中使用它.

但是,Web上的许多示例都使用DataSet代替并通过collections方法访问表.

使用DataSet或DataTables作为SQL结果的存储方法是否有任何优势,性能明智或其他方面?

c# datatable dataset

123
推荐指数
4
解决办法
11万
查看次数

"LINQ to Entities","LINQ to SQL"和"LINQ to Dataset"之间的区别是什么?

我已经和LINQ一起工作了很长一段时间.但是,提到的LINQ风格之间存在真正的差异仍然有点神秘.

成功的答案将包含它们之间的短暂区别.每种口味的主要目标是什么,有什么好处,是否会对性能产生影响......

PS我知道有很多信息来源,但我正在寻找一种"备忘单",它指示新手在哪里寻找特定的目标.

c# sql linq entities dataset

86
推荐指数
3
解决办法
3万
查看次数

如何将Scikit-learn数据集转换为Pandas数据集?

如何将数据从Scikit-learn Bunch对象转换为Pandas DataFrame?

from sklearn.datasets import load_iris
import pandas as pd
data = load_iris()
print(type(data))
data1 = pd. # Is there a Pandas method to accomplish this?
Run Code Online (Sandbox Code Playgroud)

dataset pandas scikit-learn

80
推荐指数
11
解决办法
6万
查看次数

如何在调试时查看DataTable

我刚刚开始使用ADO.NET和DataSet和DataTables.我遇到的一个问题是,在尝试调试时,似乎很难分辨数据表中的值.

有哪些最简单的方法可以快速查看DataTable中保存的值?有没有在调试时看到Visual Studio中的内容,或者是将数据写入文件的唯一选项?

我创建了一个小实用程序函数,它将DataTable写入CSV文件.然而,生成的CSV文件被切断了.应该是写出System.Guid中间最后一行的大约3行,文件就停止了.我无法判断这是我的CSV转换方法或DataTable的原始填充的问题.

更新

忘掉最后一部分,我忘了冲洗我的流作家.

csv debugging datatable ado.net dataset

77
推荐指数
1
解决办法
6万
查看次数

如何删除R中数据帧的第一行?

我有一个包含11列的数据集,每列超过1000行.列标记为V1,V2,V11等.我使用"c"命令将名称替换为对我更有用的名称.我没有意识到第1行还包含每列的标签,我的实际数据从第2行开始.

有没有办法删除第1行并减少?

r dataset

77
推荐指数
6
解决办法
33万
查看次数

按列名对数据框的列进行排序

这可能是一个简单的问题,但我不知道如何按字母顺序排列.

test = data.frame(C = c(0, 2, 4, 7, 8), A = c(4, 2, 4, 7, 8), B = c(1, 3, 8, 3, 2))

#   C A B
# 1 0 4 1
# 2 2 2 3
# 3 4 4 8
# 4 7 7 3
# 5 8 8 2
Run Code Online (Sandbox Code Playgroud)

我喜欢按字母顺序按列名排序,以实现

#   A B C
# 1 4 1 0
# 2 2 3 2
# 3 4 8 4
# 4 7 3 7
# 5 …
Run Code Online (Sandbox Code Playgroud)

sorting r dataset

76
推荐指数
6
解决办法
11万
查看次数

我如何过滤数据表?

我使用DataTable和有关用户的信息,我希望在此DataTable中搜索用户或用户列表.我试试但是不起作用:(

这是我的c#代码:

 public DataTable GetEntriesBySearch(string username,string location,DataTable table)
        {
            list = null;
            list = table;

            string expression;
            string sortOrder;

            expression = "Nachname = 'test'";
            sortOrder = "nachname DESC";

            DataRow[] rows =  list.Select(expression, sortOrder);

            list = null; // for testing
            list = new DataTable(); // for testing

            foreach (DataRow row in rows)
            {
                list.ImportRow(row);
            }

            return list; 
        }
Run Code Online (Sandbox Code Playgroud)

c# asp.net datatable filter dataset

68
推荐指数
6
解决办法
25万
查看次数