小编CDs*_*ace的帖子

Dask读取CSV,将分区设置为CSV长度

我正在尝试编写代码,该代码将从一组命名my_file_*.csv为 Dask 数据帧的 CSV 中读取。

然后我想根据 CSV 的长度设置分区。我试图在每个分区上映射一个函数,为了做到这一点,每个分区必须是整个 CSV。

我尝试重置索引,然后根据每个 CSV 的长度设置分区,但看起来 Dask 数据帧的索引不是唯一的。

有没有更好的方法根据每个 CSV 的长度进行分区?

python csv distributed dask

5
推荐指数
1
解决办法
4159
查看次数

如何以编程方式创建keycloak客户端角色并分配给用户

我想以编程方式创建keycloak客户端角色并分配给动态创建的用户.以下是我创建用户的代码

UserRepresentation user = new UserRepresentation();
user.setEmail("xxxxx@xxx.com");
user.setUsername("xxxx");
user.setFirstName("xxx");
user.setLastName("m");
user.setEnabled(true);
Response response = kc.realm("YYYYY").users().create(user);
Run Code Online (Sandbox Code Playgroud)

java keycloak

5
推荐指数
1
解决办法
4290
查看次数

Selenium 给出“ KeyError: 'sessionId' ”

我正在尝试使用 selenium 启动 firefox,但我不断收到

File "/Library/Python/2.7/site-packages/selenium/webdriver/firefox/webdriver.py", line 150, in __init__
    keep_alive=True)
File "/Library/Python/2.7/site-packages/selenium/webdriver/remote/webdriver.py", line 92, in __init__
    self.start_session(desired_capabilities, browser_profile)
File "/Library/Python/2.7/site-packages/selenium/webdriver/remote/webdriver.py", line 180, in start_session
    self.session_id = response['sessionId']
KeyError: 'sessionId'
Run Code Online (Sandbox Code Playgroud)

我试图运行的代码相当简单

from selenium import webdriver
driver = webdriver.Firefox()
Run Code Online (Sandbox Code Playgroud)

我尝试过的解决方案:

  1. 尝试更新硒(我已经在使用最新的)
  2. 将 geckodriver 更新至 0.16.1 版
  3. 尝试更改代理设置

到目前为止没有任何效果。

我使用的配置:geckodriver 0.16.1、Mozilla Firefox 53、Python 2.7、Selenium 3.4.1,我在 Mac 系统上(如果有帮助)

python selenium python-2.7 geckodriver

5
推荐指数
1
解决办法
4398
查看次数

OSError:[WinError 123]文件名,目录名称或卷标签语法不正确

我正在编写python程序,以使用当前时间和日期来重命名文件,但出现以下错误。

OSError: [WinError 123] The filename, directory name, or volume label syntax is incorrect
Run Code Online (Sandbox Code Playgroud)

我的代码

import os
import sys
import datetime 

file=open("C:\\Users\\sun\\Desktop\\ping",'w')
z=file.name
dt = str(datetime.datetime.now())
file.close()
print(z)
new ='C:\\Users\\sun\\Desktop\\ping_'+dt+'.txt'
os.rename(z,new)
print("i am done")
Run Code Online (Sandbox Code Playgroud)

输出

OSError: [WinError 123] The filename, directory name, or volume label syntax is incorrect
Run Code Online (Sandbox Code Playgroud)

请让我知道os.rename在传递z和目标新字符串时我在函数中犯什么错误。

python datetime python-3.x

5
推荐指数
1
解决办法
1万
查看次数

ggplot2传递变量来绘制函数

我使用 ggplot 来使用多个绘图,因此我构建了自己的函数。

plothist <- function(a) {
  ggplot(aes(x = a), data = data) + geom_histogram()
}

p1 <- plothist(data$fixed.acidity)
p2 <- plothist(data$volatile.acidity)
p3 <- plothist(data$citric.acid)
p4 <- plothist(data$residual.sugar)
p5 <- plothist(data$chlorides)
p6 <- plothist(data$free.sulfur.dioxide)
p7 <- plothist(data$total.sulfur.dioxide)
p8 <- plothist(data$density)
p9 <- plothist(data$pH)
p10 <- plothist(data$sulphates)
p11 <- plothist(data$alcohol)

x <- grid.arrange(p1, p2, p3, p4, p5, p6, p7, p8, p9, p10, p11,
                  top = "Histogram of independent variables")
x
Run Code Online (Sandbox Code Playgroud)

x 轴没有变量的名称,我只能在每个图上看到“a”,这使得图毫无用处。你能帮我如何在那里显示实际变量吗?

plot r ggplot2

5
推荐指数
1
解决办法
1859
查看次数

npm 包存储库的 url 是什么?

我已经在 Windows 上安装了 node js 和 npm 但是当我尝试使用安装 npm 模块(包)时

command>>npm install -g xxxx(package name)
Run Code Online (Sandbox Code Playgroud)

它没有安装,它要求我检查代理设置。由于我在专用网络上工作,因此可能不允许我访问从中下载 npm 包的 url。

请告诉我从哪里下载此类 npm 包的 url 是什么,以便我可以要求我的网络提供商授予对该站点的访问权限。

npm-install

5
推荐指数
2
解决办法
5280
查看次数

是否可以从 Scala(spark) 调用 python 函数

我正在创建一个 Spark 作业,需要使用用 python 编写的函数将列添加到数据帧中。其余的处理是使用 Scala 完成的。

我找到了如何从 pyspark 调用 Java/Scala 函数的示例:

我发现以其他方式发送数据的唯一示例是使用pipe

我是否可以将整个数据帧发送到 python 函数,让该函数操作数据并添加其他列,然后将生成的数据帧发送回调用 Scala 函数?

如果这是不可能的,我当前的解决方案是运行 pyspark 进程并调用多个 Scala 函数来操作数据帧,这并不理想。

python scala apache-spark apache-spark-sql pyspark

5
推荐指数
1
解决办法
7875
查看次数

如何在 python 中粘贴从键盘复制的文本

如果我执行这段代码,它工作得很好。但是,如果我使用键盘(Ctrl+ C)复制某些内容,那么如何将剪贴板上的文本粘贴到Python中的任何输入框或文本框中?

import pyperclip
pyperclip.copy('The text to be copied to the clipboard.')
spam = pyperclip.paste()
Run Code Online (Sandbox Code Playgroud)

python tkinter python-3.x pyperclip tkinter-entry

5
推荐指数
1
解决办法
2万
查看次数

确定是否有两个相同的字符彼此相邻

我被要求创建一个程序来识别密码是否有效。我正在努力解决的一个部分是确定是否有两个相同的字符彼此相邻。帮助将不胜感激,这是迄今为止的程序:

import re

pswrd = input("Enter Desired Password:")

if len(pswrd) < 6:
    print("Password must have more than 6 characters.")
if len(pswrd) > 15:
    print("Password must have no more than 15 characters.")
if re.search("[$#@]",pswrd):
    print("Password must have no special characters.")
if not re.search("[0-9]",pswrd):
    print("Password must contain a number.")
if not re.search("[a-z]",pswrd):
    print("Password must contain a lower case letter.")
if not re.search("[A-Z]",pswrd):
    print("Password must contain an upper case letter.")
Run Code Online (Sandbox Code Playgroud)

python regex python-3.x

5
推荐指数
1
解决办法
2808
查看次数

无法找到Spark jars目录.您需要在运行此程序之前构建Spark

我正在尝试在Windows 10上安装spark,但是当我尝试运行pyspark时出错.

无法找到Spark jars目录.您需要在运行此程序之前构建Spark.

我按照这里指出的步骤直到第4步.

我去了Anaconda的Scripts和网站包.在Scripts中有pyspark spark-shell等等,但是site-packages中的pyspark文件夹既没有jars文件夹,也没有自己的bin文件夹.

罐子在哪里?

python windows anaconda apache-spark pyspark

5
推荐指数
1
解决办法
3310
查看次数