小编Tec*_*335的帖子

如何删除整数类型列中的最后两位数?

如何删除int64类型的DataFrame列的最后两位数?

例如df['DATE']包括:

DATE
20110708
20110709
20110710
20110711
20110712
20110713
20110714
20110815
20110816
20110817
Run Code Online (Sandbox Code Playgroud)

我想要的是:

DATE
201107
201107
201107
201107
201107
201107
201107
201108
201108
201108
Run Code Online (Sandbox Code Playgroud)

实现这一目标的最简单方法是什么?

python integer dataframe pandas

10
推荐指数
2
解决办法
2万
查看次数

Python - 如何将JSON文件转换为Dataframe

如何将JSON文件转换为数据帧以进行一些转换.

例如,如果JSON文件读取:

{"FirstName":"John",

"LastName":"Mark",

"MiddleName":"Lewis",

"username":"johnlewis2",

"password":"2910"}
Run Code Online (Sandbox Code Playgroud)

我怎样才能将它转换成这样的表格

Column -> FirstName | LastName | MiddleName | username | password



Row ----->    John | Mark |Lewis | johnlewis2 |2910
Run Code Online (Sandbox Code Playgroud)

python json dataframe pandas

10
推荐指数
2
解决办法
7万
查看次数

无法在Docker映像中安装R软件包

似乎是由于法律原因,Java无法在docker映像中单独安装,而是必须使用Java映像。

我正在使用Java映像,并在需要时安装了R,但是在安装R包时出现错误

这是下面的我的Dockerfile:

FROM buildpack-deps:jessie-scm

# A few problems with compiling Java from source:
#  1. Oracle.  Licensing prevents us from redistributing the official JDK.
#  2. Compiling OpenJDK also requires the JDK to be installed, and it gets
#       really hairy.

RUN apt-get update && apt-get install -y --no-install-recommends \
        bzip2 \
        unzip \
        xz-utils \
    && rm -rf /var/lib/apt/lists/*

# Default to UTF-8 file.encoding
ENV LANG C.UTF-8

# add a simple script that can auto-detect the appropriate JAVA_HOME …
Run Code Online (Sandbox Code Playgroud)

java r docker

4
推荐指数
2
解决办法
1926
查看次数

如何记录docker构建安装包错误

当我通过 dockerfile 使用以下命令构建 docker 映像时:docker build -t test/app1 .

然而,docker 构建成功,我注意到在通过构建安装软件包时出现了一些错误。我如何在 Linux 上跟踪/记录这些软件包安装错误?

谢谢。

logging docker docker-build

3
推荐指数
1
解决办法
8518
查看次数

如何在python中将简单列表转换为数据框

您将如何将列表转换为python数据框架。

例如:

listA = [1,20,12,4]
Run Code Online (Sandbox Code Playgroud)

转换为

   listA
0  1
1  20
2  12
3  4
Run Code Online (Sandbox Code Playgroud)

实现此目的最简单的方法是什么?

python pandas

2
推荐指数
1
解决办法
2387
查看次数

pyodbc:查询结果为CSV?

我正在使用pyodbc访问数据库并打印查询结果.

如何使用pyodbc将整个查询结果(包括列)打印到csv文件?

码:

import pyodbc

cnxn = pyodbc.connect(
    #DATA BASE NAME IS HERE, HID FOR PRIVACY  )


cursor  = cnxn.cursor()

cursor.execute(""" #COMMAND GOES HERE """)


row = cursor.fetchall() #FETCHES ALL ROWS

cnxn.commit() 
cnxn.close()
Run Code Online (Sandbox Code Playgroud)

python pyodbc

2
推荐指数
1
解决办法
8409
查看次数

PySpark:如何检查数据框中是否存在字符串值列表并将值打印到列表中

我有一个 df NAMES,如果我通过display(NAMES)以下方式输出:

NAMES

John

Sarah

Michael

Sean
Run Code Online (Sandbox Code Playgroud)

我也有一个学生名单 ,print(students)

{约翰、艾伦、安迪}

问题

基于此列表(学生),我如何使用“NAMES”列遍历 df 并将列表中和 DF 中的学生姓名输出到另一个列表。

列表的预期输出:“约翰”

我试过了

list2 = []
for i in NAMES:
     for g in students:
        if i == g:
          list2.append(i)
Run Code Online (Sandbox Code Playgroud)

但我最终出现错误,我如何通过 pyspark 实现它?

谢谢。

python apache-spark apache-spark-sql pyspark

2
推荐指数
1
解决办法
1万
查看次数