小编use*_*759的帖子

Pandas用空白/空字符串替换NaN

我有一个Pandas Dataframe,如下所示:

    1    2       3
 0  a  NaN    read
 1  b    l  unread
 2  c  NaN    read
Run Code Online (Sandbox Code Playgroud)

我想用空字符串删除NaN值,以便它看起来像这样:

    1    2       3
 0  a   ""    read
 1  b    l  unread
 2  c   ""    read
Run Code Online (Sandbox Code Playgroud)

python nan dataframe pandas

176
推荐指数
5
解决办法
20万
查看次数

120
推荐指数
3
解决办法
25万
查看次数

如何在shell脚本中的curl命令中传递变量

我有一个curl命令:

curl -u ${USER_ID}:${PASSWORD} -X GET 'http://blah.gso.woo.com:8080/rest/job-execution/job-details/${job_id}'
Run Code Online (Sandbox Code Playgroud)

该变量job_id在其中有一个值,比如1160.当我在shell中执行curl命令时,它给出了以下错误:

{"message":"Sorry. An unexpected error occured.", "stacktrace":"Bad Request. The request could not be understood by the server due to malformed syntax."}
Run Code Online (Sandbox Code Playgroud)

如果我直接在命令中传递数字'1160',如下所示,curl命令有效.

curl -u ${USER_ID}:${PASSWORD} -X GET 'http://blah.gso.woo.com:8080/rest/job-execution/job-details/1160'
Run Code Online (Sandbox Code Playgroud)

有人可以帮帮我吗?我想能够在curl命令中传递变量的值.

bash shell curl

27
推荐指数
2
解决办法
7万
查看次数

Pandas将String对象转换为小写并检查字符串

我有以下代码

import pandas as pd
private = pd.read_excel("file.xlsx","Pri")
public = pd.read_excel("file.xlsx","Pub")
private["ISH"] = private.HolidayName.str.lower().contains("holiday|recess")
public["ISH"] = public.HolidayName.str.lower().contains("holiday|recess")
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

AttributeError: 'Series' object has no attribute 'contains'
Run Code Online (Sandbox Code Playgroud)

反正到"HolidayName"列转换为小写,然后检查正则表达式("Holiday|Recess")使用.contains一步到位?

任何帮助,将不胜感激

python pandas

18
推荐指数
2
解决办法
2万
查看次数

Python将csv写入字典,标题为键,行为值

我有一个csv文件test.csv,如下所示:

1,2,3
a,b,c
d,e,f
Run Code Online (Sandbox Code Playgroud)

我希望上面看起来像一个字典,如下所示:

{"1":"a", "2":"b", "3":"c"}
{"1":"d", "2":"e", "3":"f"}
Run Code Online (Sandbox Code Playgroud)

标题1,2,3是键,行是值.

我不太明白如何使用csv.DictReader完成这项工作.以上样本只是一个样本.我正在使用的实际数据有很多列,因此,我无法通过使用其索引访问每一行并手动将它们放入字典中.

python csv dictionary

15
推荐指数
2
解决办法
2万
查看次数

如何检查RSS源是否已在Python中更新?

我正在使用Python中的feedparser库来从RSS提要中获取各种详细信息.假设我从新闻频道的RSS源中删除了25个标题.一小时后,我再次运行feedparser命令,以获取25个新标题的最新标题列表.第二次运行feedparser命令时,列表可能会更新,也可能不会更新.有些标题可能是相同的,有些可能是新的.我需要能够检查任何新闻标题中是否有更新,其标题是在一小时前提取出来的.只有新的标题必须推入数据库.这是为了避免重复转储到数据库中.

代码如下所示:

import feedparser
d = feedparser.parse('www.news.example.xml')
for item in d.entries:
    hndlr.write(item.title)  #data being dumped into a database
Run Code Online (Sandbox Code Playgroud)

我需要能够每小时运行上面的代码并检查标题中是否有任何更新(标题).如果前一小时提取的数据有任何变化,则只应将新数据转储到数据库中.

有人可以帮帮我吗?

python rss feedparser

13
推荐指数
1
解决办法
8248
查看次数

Pytest:模拟具有不同副作用的同一方法的多次调用

我有一个如下所示的单元测试:

# utilities.py  
def get_side_effects():
    def side_effect_func3(self):
        # Need the "self" to do some stuff at run time.
        return {"final":"some3"} 

    def side_effect_func2(self):
        # Need the "self" to do some stuff at run time.
        return {"status":"some2"}
      
    def side_effect_func1(self):
        # Need the "self" to do some stuff at run time.
        return {"name":"some1"} 

    return side_effect_func1, side_effect_func2, side_effect_func2

#################

# test_a.py
def test_endtoend():
   
    s1, s2, s3 = utilities.get_side_effects()
    
    m1 = mock.MagicMock()
    m1.side_effect = s1

    m2 = mock.MagicMock()
    m2.side_effect = s2

    m3 = mock.MagicMock()
    m3.side_effect …
Run Code Online (Sandbox Code Playgroud)

python side-effects mocking pytest

8
推荐指数
1
解决办法
1万
查看次数

在url中传递变量?

所以我是python的新手,我迫切需要帮助.

我有一个文件,其中有一堆id(整数值)写在'em.它是一个文本文件.

现在我需要将文件中的每个id传递给一个url.

例如"https://example.com/[id]"

它将以这种方式完成

A = json.load(urllib.urlopen("https://example.com/(the first id present in the text file)"))
print A
Run Code Online (Sandbox Code Playgroud)

这将基本上做的是它将读取有关上述URL中存在的id的某些信息并显示它.我希望它以循环格式工作,在其中它将读取文本文件中的所有ID并将其传递给'A'中提到的URL并持续显示值.有没有办法做到这一点?

如果有人能帮助我,我将非常感激!

python url json urllib urlopen

7
推荐指数
2
解决办法
4万
查看次数

用于将文件从一台服务器获取到另一台服务器并将它们存储在不同目录中的 Python 脚本?

我正在工作server 1。我需要编写一个 Python 脚本,我需要在其中连接到 aserver 2并从目录中获取某些文件(名称以字母“HM”开头的文件)并将它们放入另一个目录中,该目录需要在运行时创建(因为对于程序的每次运行,都必须创建一个新目录,并且必须将文件转储到那里),在server 1.

我需要在 Python 中执行此操作,而且我对这种语言比较陌生。我不知道从哪里开始代码。有没有不涉及“tarring”文件的解决方案?我已经浏览了 Paramiko,但据我所知,它一次只传输一个文件。我什至看过 glob 但我不知道如何使用它。

python ssh scp

6
推荐指数
1
解决办法
2万
查看次数

如何在shell脚本中每2分钟查找一个目录中是否有新文件?

我有一个名为的目录/home/user/local.每隔两分钟左右,新文件将被转储到此目录中.我需要每2分钟检查一次这个目录,看看是否有新的文件/文件落在那里.如果有新文件,我需要将它的列表放入变量中以便稍后使用.我该怎么做这个shell脚本?

unix bash shell

6
推荐指数
2
解决办法
2万
查看次数

标签 统计

python ×8

bash ×2

pandas ×2

shell ×2

csv ×1

curl ×1

dataframe ×1

dictionary ×1

feedparser ×1

join ×1

json ×1

list ×1

merge ×1

mocking ×1

nan ×1

pytest ×1

rss ×1

scp ×1

side-effects ×1

ssh ×1

unix ×1

url ×1

urllib ×1

urlopen ×1