小编Pin*_*ts0的帖子

将Python数据框中的一列转换为列表

我有一个仅由一列数据组成的熊猫数据框。我想将数据列转换为列表。该列具有浮点数据类型。

例如:

ColA
341321432
132184900
173840143
1432473928
Run Code Online (Sandbox Code Playgroud)

期望的:341321432、132184900、173840143、1432473928

下面是我的Python代码:

df_gearME = pd.read_excel('Gear M&Es.xlsx')
df_gearME['ColA'].to_list()
Run Code Online (Sandbox Code Playgroud)

但是我得到的错误如下:

AttributeError: 'Series' object has no attribute 'to_list'
Run Code Online (Sandbox Code Playgroud)

python list dataframe

2
推荐指数
1
解决办法
9224
查看次数

PySpark:在文本和子集数据框中搜索子字符串

我是全新的pyspark,想将我现有的pandas/python代码转换为PySpark.

我想对 my 进行子集化,dataframe以便只'original_problem'返回包含我在字段中查找的特定关键字的行。

下面是我在 PySpark 中尝试的 Python 代码:

def pilot_discrep(input_file):

    df = input_file 

    searchfor = ['cat', 'dog', 'frog', 'fleece']

    df = df[df['original_problem'].str.contains('|'.join(searchfor))]

    return df 
Run Code Online (Sandbox Code Playgroud)

当我尝试运行上述程序时,出现以下错误:

AnalysisException: u"无法从 original_problem#207 中提取值:需要结构类型但得到字符串;"

string search substring subset pyspark

2
推荐指数
1
解决办法
7876
查看次数

Pandas Dataframe:将整数和日期时间计数和 Bin 到范围内,产生两个输出数据帧

我有以下数据框:

ID  Minutes Datetime
1   30      6/4/2018  23:47:00 
2   420 
3   433     6/10/2018 2:50 
4   580     6/9/2018 3:10
5   1020    
Run Code Online (Sandbox Code Playgroud)

我想计算某个范围内 Minutes 出现的次数。我想对日期时间字段进行类似的计数(时间戳落在一定的时间范围内)。

下面是我想要的输出:

MIN_RANGE   COUNT   
6-8 hours   2
8-10 hours  1
10-12 hours 0
12-14 hours 0
14-16 hours 0
16+ hours   1



RANGE        COUNT  
8pm - 10pm   0
10pm - 12am  1
12am - 2am   0
2am-4am      2    
4am-6am      0
6am-8am      0
8am -10am    0
10am - 12pm  0
12pm - 2pm   0
2pm - 4pm    0
4pm …
Run Code Online (Sandbox Code Playgroud)

python count labels bin pandas

2
推荐指数
1
解决办法
1029
查看次数

JavaScript:使用 forEach 查看数组是否包含特定的数值

我有下面的代码。在这种情况下,我有意尝试使用 forEach。

function check(arr, el) {

  arr.forEach((element) => {

    console.log(element)

    if (element === el) {

       return true
    }
  })
}

check([1, 2, 3, 4, 5], 3)
Run Code Online (Sandbox Code Playgroud)

我期望代码返回 true,因为 el 值 3 在数组中。但它返回未定义。我究竟做错了什么?

javascript arrays element input function

2
推荐指数
1
解决办法
3333
查看次数

基于列中字符串值的条件连接

我目前拥有的 python 数据框包含两列:“EVENT”和“NAME”。

EVENT   NAME
A       DEN
B       HAU
C       TOT
D       ABC
E       DEN
Run Code Online (Sandbox Code Playgroud)

我想实现逻辑,以便我的 EVENT 列如下:

EVENT
A_DEN
B
C
D
E_DEN
Run Code Online (Sandbox Code Playgroud)

我想实现逻辑,如果“NAME”列包含 DEN 值,然后将它连接到“EVENT”列中的值。否则,保留“EVENT”列中的值。

我已经在互联网上搜索了如何执行此操作,但无法找到任何特定于我要完成的任务。

python string pandas

1
推荐指数
1
解决办法
2202
查看次数

PySpark:创建新列并根据其他两个列的条件进行填写

我有以下数据框:

+---+---+------+
| id| ts|days_r|
+---+---+------+
|123|  T|    32|
|342|  I|     3|
|349|  L|    10|
+---+---+------+
Run Code Online (Sandbox Code Playgroud)

我想创建一个新列,并根据在“ ts”列和“ days_r”列上是否满足某些条件来填充值。

这是我想要的数据框:

+---+---+------+----------+
| id| ts|days_r|0to2_count|
+---+---+------+----------+
|123|  T|    32|         1|
|342|  I|     3|         0|
|349|  L|    10|         0|
+---+---+------+----------+
Run Code Online (Sandbox Code Playgroud)

我在pyspark中尝试了以下代码:

df = df.withColumn('0to2_count', F.when((F.col("ts") == 'I') & (F.col('days_r') >=0) & (F.col('days_r') <= 2), 1) \
    .otherwise(F.when((F.col("ts") == 'T') & (F.col('days_r') >=0) & (F.col('days_r') <= 48), 1) \
    .otherwise(F.when((F.col("ts") == 'L') & (F.col('days_r') >=0 & F.col('days_r') <= 7), 1) \
    .otherwise(0))))
Run Code Online (Sandbox Code Playgroud)

我收到以下错误: …

conditional if-statement pyspark

1
推荐指数
1
解决办法
6002
查看次数

Python:将包含值列表的键值对的字典转换为元组列表

我正在尝试使用带有键值对的字典,其中的值是一个列表,并将它们转换为一个元组列表。

我有以下字典:

d={'a': [33, 21, 4, 32], 'b': [6, 100, 8, 14]}
Run Code Online (Sandbox Code Playgroud)

期望的输出:

[(33, 6), (21, 100), (4, 8), (32, 14)]
Run Code Online (Sandbox Code Playgroud)

下面是我试过的代码,但它没有让我到达那里。

d={'a': [33, 21, 4, 32], 'b': [6, 100, 8, 14]}
  
# Converting into list of tuple 
list = [(key, value) for key, value in d.items()] 
  
# Printing list of tuple 
print(list) 
Run Code Online (Sandbox Code Playgroud)

该代码输出一个列表值:

[('a', [33, 21, 4, 32]), ('b', [6, 100, 8, 14])]
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?

python dictionary tuples list

1
推荐指数
1
解决办法
31
查看次数

Python &amp; MSSQL:删除 MSSQL 表中所有数据行的 Python 代码

我在 Python 环境中编写脚本。我已成功将 Pandas 数据框写入 MSSQL 中的表。

我想使用 Python 代码删除 MSSQL 表中的所有行。我知道执行此操作的 SQL 语法(如下所示)。

DELETE FROM [LON].[dbo].[MREPORT]
Run Code Online (Sandbox Code Playgroud)

但是如何将 SQL 语法合并到我的 python 代码中,以便我可以在我的 python 环境中运行代码并让它删除 MSSQL 表中的所有行?

python sql-server dataframe pandas

0
推荐指数
1
解决办法
3078
查看次数

使用 pandas str.replace 执行全字子字符串替换

我有一个示例数据框文本列,其中包含包含单词 'eng' 和单词 'engine' 的字符串。

ID  Text
1   eng is here
2   engine needs washing
3   eng is overheating 
Run Code Online (Sandbox Code Playgroud)

我想用“引擎”这个词代替“eng”这个词。我使用下面的代码:

df['Text'] = df['Text'].str.replace('eng', 'engine')
Run Code Online (Sandbox Code Playgroud)

但这弄乱了我第二行的文字。第二行变成

ID  Text
2   engineine needs washing
Run Code Online (Sandbox Code Playgroud)

有没有办法做这个词替换,以便它只在整个词说“eng”时才替换?

python string replace pandas

0
推荐指数
2
解决办法
1798
查看次数

VSCode:似乎无法找到运行按钮来运行 Javascript 代码

我想在我的 VSCode 应用程序中运行以下代码行。我找不到运行按钮或选项。我认为它应该在右上角。

看起来 VSCode 也无法识别我的代码。

在此处输入图片说明

execute button visual-studio-code

0
推荐指数
1
解决办法
1万
查看次数