小编InA*_*ash的帖子

在数据帧列 - 熊猫中应用'或'条件

我要检查,如果任何dataframe行的列给定数目有任何一组值(不同的套不同的列),并分配boolean相应的-我想我可能需要的组合apply()any(),但不完全击中它正是:

所以,对于数据帧:

bank_dict = {'Name' : ['A', 'B', 'C', 'D', 'E'],
        'Type' :     ['Retail', 'Corporate', 'Corporate', 'Wholesale', 'Retail'],
        'Overdraft': ['Y', 'Y', 'Y', 'N', 'N'],
        'Forex': ['USD', 'GBP', 'EUR', 'JPY', 'GBP']}
Run Code Online (Sandbox Code Playgroud)

有真相清单:

truth_list = [bank_df['Type'].isin(['Retail']), bank_df['Overdraft'].isin(['Yes']), bank_df['Forex'].isin(['USD', 'GBP'])]
Run Code Online (Sandbox Code Playgroud)

结果df应如下所示:

  Name       Type Overdraft Forex  TruthCol
0    A     Retail         Y   USD         1
1    B  Corporate         Y   GBP         1
2    C  Corporate         Y   EUR         1
3    D  Wholesale         N   JPY         0
4    E     Retail         N   GBP …
Run Code Online (Sandbox Code Playgroud)

python pandas

3
推荐指数
1
解决办法
40
查看次数

Null 处理程序在 python 日志记录中有何用途?

根据 python 的文档,

\n\n
\n

NullHandler 类位于核心日志记录包中,不执行任何格式化或输出。它本质上是一个供库开发人员使用的\xe2\x80\x98no-op\xe2\x80\x99 处理程序。

\n
\n\n

如果它不打印任何内容,那么这个处理程序有什么用呢?为什么人们会不遗余力地编写记录器,然后使用空处理程序不打印任何内容?

\n

python logging

3
推荐指数
1
解决办法
4171
查看次数

多进程与多线程Python时间

我有2个简单的函数(一个范围内的循环),可以单独运行而没有任何依赖.我正在尝试使用Python多处理模块以及多线程模块运行这两个函数.

当我比较输出时,我看到多进程应用程序比多线程模块多1秒钟.

我读多线程因为全局解释器锁而没那么高效......

基于以上陈述 -
1.如果两个进程之间没有依赖关系,最好使用多处理吗?
2.如何计算我可以在机器中运行的进程/线程数以获得最大效率
.3.另外,有没有办法通过使用多线程来计算程序的效率...

多线程模块......

from multiprocessing import Process

import thread
import platform

import os
import time
import threading
class Thread1(threading.Thread):
    def __init__(self,threadindicator):
        threading.Thread.__init__(self)
        self.threadind = threadindicator

    def run(self):
        starttime = time.time() 
        if self.threadind == 'A':
            process1()
        else:
            process2()
        endtime = time.time()
        print 'Thread 1 complete : Time Taken = ', endtime - starttime

def process1():
    starttime = time.time() 
    for i in range(100000):
        for j in range(10000):
            pass        
    endtime = time.time() 

def process2():
    for i in …
Run Code Online (Sandbox Code Playgroud)

python multiprocessing

2
推荐指数
1
解决办法
3339
查看次数

列中具有多个标签的一种热编码

我有一个简单的数据集。

id,question,category,tags,day,quarter,group_id

1,What is your name,Introduction,Introduction,1,3,0

2,What is your name,Introduction,"Introduction, work",1,3,1
Run Code Online (Sandbox Code Playgroud)

现在,如果您看到,该tags列中有多个用逗号分隔的输入。如果我尝试使用pandas 函数进行单热编码,get_dummies我会将其作为一列。但我想为每个标签创建列。我怎样才能做到这一点?

python dataset pandas one-hot-encoding

2
推荐指数
1
解决办法
1149
查看次数

为什么cin在包含String头之后接受字符串输入

我是C++编程的新手.我试图接受用户输入并将它们放在变量中,我正在使用cin.它适用于整数和其他的除外strings.所以,当我四处搜索时,发现我必须包含<string>标题.我只想了解,包含字符串标题会发生什么变化?我认为这cin是由字符串标题中定义的函数重载.所以,我开始研究字符串标题,我找不到cin重载或任何定义的函数.任何人都可以告诉我cin在包括之后如何开始接受字符串输入<string>

c++ string iostream cin

1
推荐指数
1
解决办法
73
查看次数

是否可以以相反的顺序使System.out.print排序变量?

是否可以以相反的顺序生成System.out.print 排序变量?我知道我可以使用和它,但我想知道如果有可能做到这一点与在Java中直接.谢谢:)StringsreverseSystem.out.print

java string int reverse system.out

1
推荐指数
1
解决办法
96
查看次数

在python中随机选择种子

我有两个列表a和b,长度与下面相同

a = [1,2,3,4,5]
b = [11,22,33,44,55]
Run Code Online (Sandbox Code Playgroud)

如何在使用random.choices中选择元素,以便选择b中的精确对应项.

a和b都将具有相同的长度.并且a和b的元素都基于索引相关.所以,简而言之,我要做的是在a中随机选择一个元素,然后能够在b中选择相应的元素.有一点是元素可能会重复.

python random

1
推荐指数
1
解决办法
656
查看次数

无法以字符串类型加入pandas数据框

我有两个DataFrames对象,其列如下

数据框1:

df.dtypes
Run Code Online (Sandbox Code Playgroud)

输出:

ImageID       object
Source        object
LabelName     object
Confidence     int64
dtype: object
Run Code Online (Sandbox Code Playgroud)

数据框2:

a.dtypes
Run Code Online (Sandbox Code Playgroud)

输出:

LabelName       object
ReadableName    object
dtype: object
Run Code Online (Sandbox Code Playgroud)

在这里,我正在尝试将这两个数据框组合如下

combined =  df.join(a,on='LabelName')
Run Code Online (Sandbox Code Playgroud)

但是,我收到以下错误

ValueError:您正在尝试合并object和int64列。如果要继续,则应使用pd.concat

但是,我将它们合并到只有字符串(对象数据类型)的LabelName上

我在这里想念什么吗?

python dataframe pandas

1
推荐指数
1
解决办法
3031
查看次数

结合Word embedding来获得句子嵌入的更好方法

我在许多kaggle内核和教程中看到,平均词嵌入被认为是获得句子的嵌入。但是,我想知道这是否是正确的方法。因为它丢弃了句子中单词的位置信息。有没有更好的方法来结合嵌入?也许以特定的方式将它们分层组合?

text-processing nlp deep-learning word-embedding

1
推荐指数
1
解决办法
1694
查看次数

在 Makefile 先决条件中包含头文件的原因

我正在阅读这个制作教程。在这里,他们在先决条件中提到了头文件。这真的有必要吗?我在没有标题的情况下运行了相同的代码并且它有效。例如,我有以下代码

funcs.h

#ifndef FUNCS_H
#define FUNCS_H

int add(int a, int b);

#endif
Run Code Online (Sandbox Code Playgroud)

funcs.cpp

#include "funcs.h"

int add(int a, int b){
    return a+b;
}
Run Code Online (Sandbox Code Playgroud)

main.cpp

#include<iostream>
#include "funcs.h"


int main(){
    std::cout << add(1,2) << "\n";
}
Run Code Online (Sandbox Code Playgroud)

Makefile

add : main.o funcs.o
    g++ -o add main.o funcs.o

main.o : main.cpp funcs.h
    g++ -c main.cpp

funcs.o : funcs.cpp funcs.h
    g++ -c funcs.cpp

clean :
    rm add main.o funcs.o
Run Code Online (Sandbox Code Playgroud)

即使我从目标中删除头文件funcs.omain.o它仍然有效。那么,还有其他原因需要放置头文件吗?

c++ makefile

0
推荐指数
1
解决办法
290
查看次数