小编InA*_*ash的帖子

在数据帧列 - 熊猫中应用'或'条件

我要检查,如果任何dataframe行的列给定数目有任何一组值(不同的套不同的列),并分配boolean相应的-我想我可能需要的组合apply()和any(),但不完全击中它正是:

所以,对于数据帧:

bank_dict = {'Name' : ['A', 'B', 'C', 'D', 'E'],
        'Type' :     ['Retail', 'Corporate', 'Corporate', 'Wholesale', 'Retail'],
        'Overdraft': ['Y', 'Y', 'Y', 'N', 'N'],
        'Forex': ['USD', 'GBP', 'EUR', 'JPY', 'GBP']}

Run Code Online (Sandbox Code Playgroud)

有真相清单:

truth_list = [bank_df['Type'].isin(['Retail']), bank_df['Overdraft'].isin(['Yes']), bank_df['Forex'].isin(['USD', 'GBP'])]

Run Code Online (Sandbox Code Playgroud)

结果df应如下所示:

  Name       Type Overdraft Forex  TruthCol
0    A     Retail         Y   USD         1
1    B  Corporate         Y   GBP         1
2    C  Corporate         Y   EUR         1
3    D  Wholesale         N   JPY         0
4    E     Retail         N   GBP …

Run Code Online (Sandbox Code Playgroud)

python pandas

sha*_*odh

2018 05-23

3
推荐指数

1
解决办法

40
查看次数

Null 处理程序在 python 日志记录中有何用途？

根据 python 的文档，

\n\n

\n
NullHandler 类位于核心日志记录包中，不执行任何格式化或输出。它本质上是一个供库开发人员使用的\xe2\x80\x98no-op\xe2\x80\x99 处理程序。
\n

\n\n

如果它不打印任何内容，那么这个处理程序有什么用呢？为什么人们会不遗余力地编写记录器，然后使用空处理程序不打印任何内容？

python logging

InA*_*ash

lucky-day

3
推荐指数

1
解决办法

4171
查看次数

多进程与多线程Python时间

我有2个简单的函数(一个范围内的循环),可以单独运行而没有任何依赖.我正在尝试使用Python多处理模块以及多线程模块运行这两个函数.

当我比较输出时,我看到多进程应用程序比多线程模块多1秒钟.

我读多线程因为全局解释器锁而没那么高效......

基于以上陈述 -
1.如果两个进程之间没有依赖关系,最好使用多处理吗？
2.如何计算我可以在机器中运行的进程/线程数以获得最大效率
.3.另外,有没有办法通过使用多线程来计算程序的效率...

多线程模块......

from multiprocessing import Process

import thread
import platform

import os
import time
import threading
class Thread1(threading.Thread):
    def __init__(self,threadindicator):
        threading.Thread.__init__(self)
        self.threadind = threadindicator

    def run(self):
        starttime = time.time() 
        if self.threadind == 'A':
            process1()
        else:
            process2()
        endtime = time.time()
        print 'Thread 1 complete : Time Taken = ', endtime - starttime

def process1():
    starttime = time.time() 
    for i in range(100000):
        for j in range(10000):
            pass        
    endtime = time.time() 

def process2():
    for i in …

Run Code Online (Sandbox Code Playgroud)

python multiprocessing

use*_*619

2018 10-08

2
推荐指数

1
解决办法

3339
查看次数

列中具有多个标签的一种热编码

我有一个简单的数据集。

id,question,category,tags,day,quarter,group_id

1,What is your name,Introduction,Introduction,1,3,0

2,What is your name,Introduction,"Introduction, work",1,3,1

Run Code Online (Sandbox Code Playgroud)

现在，如果您看到，该tags列中有多个用逗号分隔的输入。如果我尝试使用pandas 函数进行单热编码，get_dummies我会将其作为一列。但我想为每个标签创建列。我怎样才能做到这一点？

python dataset pandas one-hot-encoding

Nav*_*Raj

2018 05-25

2
推荐指数

1
解决办法

1149
查看次数

我是C++编程的新手.我试图接受用户输入并将它们放在变量中,我正在使用cin.它适用于整数和其他的除外strings.所以,当我四处搜索时,发现我必须包含<string>标题.我只想了解,包含字符串标题会发生什么变化？我认为这cin是由字符串标题中定义的函数重载.所以,我开始研究字符串标题,我找不到cin重载或任何定义的函数.任何人都可以告诉我cin在包括之后如何开始接受字符串输入<string>？

c++ string iostream cin

InA*_*ash

2018 06-14

1
推荐指数

1
解决办法

73
查看次数

是否可以以相反的顺序使System.out.print排序变量？

是否可以以相反的顺序生成System.out.print 排序变量？我知道我可以使用和它,但我想知道如果有可能做到这一点与在Java中直接.谢谢:)StringsreverseSystem.out.print

java string int reverse system.out

Joh*_*n.R

2018 06-14

1
推荐指数

1
解决办法

96
查看次数

在python中随机选择种子

我有两个列表a和b,长度与下面相同

a = [1,2,3,4,5]
b = [11,22,33,44,55]

Run Code Online (Sandbox Code Playgroud)

如何在使用random.choices中选择元素,以便选择b中的精确对应项.

a和b都将具有相同的长度.并且a和b的元素都基于索引相关.所以,简而言之,我要做的是在a中随机选择一个元素,然后能够在b中选择相应的元素.有一点是元素可能会重复.

python random

InA*_*ash

lucky-day

1
推荐指数

1
解决办法

656
查看次数

无法以字符串类型加入pandas数据框

我有两个DataFrames对象，其列如下

数据框1：

df.dtypes

Run Code Online (Sandbox Code Playgroud)

输出：

ImageID       object
Source        object
LabelName     object
Confidence     int64
dtype: object

Run Code Online (Sandbox Code Playgroud)

数据框2：

a.dtypes

Run Code Online (Sandbox Code Playgroud)

输出：

LabelName       object
ReadableName    object
dtype: object

Run Code Online (Sandbox Code Playgroud)

在这里，我正在尝试将这两个数据框组合如下

combined =  df.join(a,on='LabelName')

Run Code Online (Sandbox Code Playgroud)

但是，我收到以下错误

ValueError：您正在尝试合并object和int64列。如果要继续，则应使用pd.concat

但是，我将它们合并到只有字符串（对象数据类型）的LabelName上

我在这里想念什么吗？

python dataframe pandas

InA*_*ash

2018 10-20

1
推荐指数

1
解决办法

3031
查看次数

结合Word embedding来获得句子嵌入的更好方法

我在许多kaggle内核和教程中看到，平均词嵌入被认为是获得句子的嵌入。但是，我想知道这是否是正确的方法。因为它丢弃了句子中单词的位置信息。有没有更好的方法来结合嵌入？也许以特定的方式将它们分层组合？

text-processing nlp deep-learning word-embedding

InA*_*ash

lucky-day

1
推荐指数

1
解决办法

1694
查看次数

在 Makefile 先决条件中包含头文件的原因

我正在阅读这个制作教程。在这里，他们在先决条件中提到了头文件。这真的有必要吗？我在没有标题的情况下运行了相同的代码并且它有效。例如，我有以下代码

funcs.h

#ifndef FUNCS_H
#define FUNCS_H

int add(int a, int b);

#endif

Run Code Online (Sandbox Code Playgroud)

funcs.cpp

#include "funcs.h"

int add(int a, int b){
    return a+b;
}

Run Code Online (Sandbox Code Playgroud)

main.cpp

#include<iostream>
#include "funcs.h"


int main(){
    std::cout << add(1,2) << "\n";
}

Run Code Online (Sandbox Code Playgroud)

Makefile

add : main.o funcs.o
    g++ -o add main.o funcs.o

main.o : main.cpp funcs.h
    g++ -c main.cpp

funcs.o : funcs.cpp funcs.h
    g++ -c funcs.cpp

clean :
    rm add main.o funcs.o

Run Code Online (Sandbox Code Playgroud)

即使我从目标中删除头文件funcs.o，main.o它仍然有效。那么，还有其他原因需要放置头文件吗？

c++ makefile

InA*_*ash

lucky-day

0
推荐指数

1
解决办法

290
查看次数