小编Grr*_*Grr的帖子

pandas,使用pd.to_hdf在h5文件中存储多个数据集

说我有两个数据帧,

import pandas as pd
df1 = pd.DataFrame({'col1':[0,2,3,2],'col2':[1,0,0,1]})
df2 = pd.DataFrame({'col12':[0,1,2,1],'col22':[1,1,1,1]})
Run Code Online (Sandbox Code Playgroud)

现在df1.to_hdf('nameoffile.h5', 'key_to_store','w',table=True) 成功存储,df1但我也想存储df2到同一个文件,但是如果我尝试相同的方法,那么df1就会过度编写.当我尝试加载它并检查按键时,我只看到了信息df2.如何将两者存储在df1df2表相同的h5文件中?

python pandas

4
推荐指数
1
解决办法
6943
查看次数

带有部分文件名的 OSX find 命令

我知道在 osx 终端中该命令find . -name 'filename.type'会找到我并向我返回该名称的文件。但是,我想知道是否有任何命令可以用来搜索部分文件名。

例如。假设我有一堆按顺序命名为“IMG_01”、“IMG_02”等的图像。是否有一个命令可以让我在一个或多个目录中搜索文件名中包含“IMG”的所有文件?

macos terminal

4
推荐指数
1
解决办法
4537
查看次数

如何以编程方式检测 Scikit-learn 警告

使用拟合模型时,sklearn.neural_network.MLPClassifier有时会在控制台中收到警告:

ConvergenceWarning:随机优化器:达到最大迭代次数 (300),优化尚未收敛。

有没有办法在运行时检测警告,以便我可以采取行动?

python python-3.x scikit-learn

4
推荐指数
1
解决办法
1497
查看次数

类型错误:__init__() 得到了一个意外的关键字参数“n_components”

我正在尝试应用LatentDirichletAllocation数据集。当我尝试为n_componentLDA的参数赋值时。我收到以下错误。

TypeError                                 Traceback (most recent call last)
<ipython-input-25-6f5cf163fcaf> in <module>()
     23 # tfidf = vectorizer.fit_transform(line)
     24 # print(tfidf)
---> 25 lda = LatentDirichletAllocation(n_components = 100)
     26 lda.fit(bag_of_words)
     27 tf_feature_names = vector.get_feature_names()

TypeError: __init__() got an unexpected keyword argument 'n_components'
Run Code Online (Sandbox Code Playgroud)

python lda scikit-learn

4
推荐指数
1
解决办法
7994
查看次数

to_string和convert.str()未在范围中声明

我在尝试将数字转换为字符串时遇到问题.目的是进行错误检查以确保数字具有特定长度.我尝试过使用to_string()convert.str()函数,但在尝试编译时会收到相同的错误.

我正在使用MinGw g ++进行编译和实现我需要告诉它我想要C++ 11标准,我相信我已经完成了.我的编译器代码如下:

NPP_SAVE
CD $(CURRENT_DIRECTORY)
C:\MinGW\bin\g++ -std=c++11 "$(FULL_CURRENT_PATH)" -o "$(NAME_PART).exe"
cmd /c $(NAME_PART).exe
Run Code Online (Sandbox Code Playgroud)

现在假设这是正确的,我的使用代码to_string()如下:

#include <iostream>
#include <sstream>
#include <string>
using namespace std;

int main() {
  int book_code = 0;

  cout << "Please enter the four digit book code: ";
  cin >> book_code;
  string code = to_string(book_code);

  while (!(cin >> book_code) || code.length() != 4){
    cin.clear();
    cin.ignore(10000, '\n');
    cout << "That is not a valid code." << …
Run Code Online (Sandbox Code Playgroud)

c++ tostring c++11

3
推荐指数
1
解决办法
1万
查看次数

在Visual Studio中禁用*.sbr

我想通过解决方案设置禁用在Visual Studio中制作*.sbr文件,因为我的项目有很多警告,如:

BSCMAKE:警告BK4503:.SBR文件'Foo.sbr'中的小错误被忽略

我得到的限制和缺点是什么?

c++ compiler-warnings visual-studio

3
推荐指数
1
解决办法
3836
查看次数

调用未定义的方法Illuminate\Database\Query\Builder :: withAccessToken()

当我使用postman与api.php文件时出现此错误.

在这里使用Laravel 5.4的文档示例是文件中的代码.

Route::get('/user', function (Request $request) {
return $request->user() ; })->middleware('auth:api');
Run Code Online (Sandbox Code Playgroud)

在邮差我有这些设置. 邮差的图象有接受和Auth设置的

由于HasApiTokens存在于相关模型中,因此出现这些错误似乎非常不寻常,那么问题是什么?

php laravel-5.3 laravel-passport laravel-5.4

3
推荐指数
1
解决办法
6590
查看次数

是否可以使用字符串元素作为sklearn中的输入?

我正在尝试使用 sklearn 分析我的数据,看看元素之间是否存在某种相关性。我的数据集是一个短的蛋白质基序,其序列非常多样化。我的输入如下所示:

  1p 2p 3p 4p 5p               genus
0  T  V  H  F  K  Enterobacteriaceae
1  T  V  M  F  M         Escherichia
2  E  I  H  V  K  Enterobacteriaceae
3  K  L  M  F  K  Enterobacteriaceae
Run Code Online (Sandbox Code Playgroud)

位置 1-5 有 20 个不同的字母可能性。

我想使用与 sklearn Iris 集所示类似的方法来检查不同位置的氨基酸和细菌属之间的依赖性。换句话说,我想看看字母序列是否特定于属,以及单个位置的字母是否与其他位置的字母有某种关系。

问题是,据我所知,只有数字可以用作 sklearn 的输入。我尝试用数字代替字母:每个字母从 1e-10 到 1e10,但后来我在数据可视化方面遇到了问题。我希望有其他更有效的方法来使用此类输入数据。我将非常感谢一些提示。谢谢!

python import data-visualization bioinformatics scikit-learn

3
推荐指数
1
解决办法
3000
查看次数

Pandas - 插入缺少数据的行

我有一个数据集,这是一个例子:

df = DataFrame({"Seconds_left":[5,10,15,25,30,35,5,10,15,30], "Team":["ATL","ATL","ATL","ATL","ATL","ATL","SAS","SAS","SAS","SAS"], "Fouls": [1,2,3,3,4,5,5,4,1,1]})


   Fouls  Seconds_left Team
0      1             5  ATL
1      2            10  ATL
2      3            15  ATL
3      3            25  ATL
4      4            30  ATL
5      5            35  ATL
6      5             5  SAS
7      4            10  SAS
8      1            15  SAS
9      1            30  SAS
Run Code Online (Sandbox Code Playgroud)

现在我想插入在 Seconds_left 列中缺少数据的行:

Id Fouls Seconds_left   Team
0      1            5    ATL
1      2           10    ATL
2      3           15    ATL
3    NaN           20    ATL
4      3           25    ATL
5      4           30 …
Run Code Online (Sandbox Code Playgroud)

python pandas

2
推荐指数
1
解决办法
1257
查看次数

创建NumPy数组时无法理解数据类型

我正在尝试创建一个2 * 3 numpy数组,如下所示:

x_sample= np.array([31000,28.69,7055.47],[79000,3.9,16933.26]);
Run Code Online (Sandbox Code Playgroud)

但是我得到:

TypeError: data type not understood
Run Code Online (Sandbox Code Playgroud)

为什么会出现错误?

arrays numpy

2
推荐指数
1
解决办法
4618
查看次数