小编gal*_*yan的帖子

如何更改html输出的数字数据格式

我有代码来生成pandas数据帧并以html格式发送电子邮件.
我遇到的问题很难将数字的科学格式改为一般的风格

我已经尝试设置浮动格式,但它不起作用.

pd.options.display.float_format = '{:20,.2f}'.format
Run Code Online (Sandbox Code Playgroud)

输出:

Col A        Col B
1.00E+06    2.28E+06
3.00E+07    -2.54E+07
Run Code Online (Sandbox Code Playgroud)

预计出:

Col A        Col B
1000420      2281190
30030200    -25383100
Run Code Online (Sandbox Code Playgroud)

python pandas

7
推荐指数
1
解决办法
881
查看次数

如果有警告,如何停止程序

我尝试使用nltk进行一些单词处理,但是有一个警告.我发现如果有像" Nations " 这样的词,程序就会发出警告.我想知道在警告引起之后是否有任何方法可以阻止程序.谢谢

警告:

*UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
  if word[0].lower() not in stopwords.words():*
Run Code Online (Sandbox Code Playgroud)

python

6
推荐指数
1
解决办法
3540
查看次数

Python多重处理-检查每个进程的状态

我想知道是否有可能检查每个过程花费多长时间。
例如,有四个工作人员,该工作不应超过10秒,但一个工作人员需要超过10秒。是否可以在10秒后且过程完成工作之前发出警报。
我最初的想法是使用管理器,但似乎我要等到过程完成。
非常感谢。

python process multiprocessing

5
推荐指数
2
解决办法
9216
查看次数

大熊猫价值的可能性

我试图在数据帧中找到给定单词的概率,但是AttributeError: 'Series' object has no attribute 'columns'我的当前设置出错了.希望你能帮我找到错误的位置.

我开始使用类似于下面的数据框,并使用以下函数对其进行转换以查找每个单词的总计数.

query          count
foo bar        10
super          8 
foo            4
super foo bar  2
Run Code Online (Sandbox Code Playgroud)

功能如下:

def _words(df):
    return df['query'].str.get_dummies(sep=' ').T.dot(df['count'])
Run Code Online (Sandbox Code Playgroud)

导致下面的df(注意'foo'是16,因为它在整个df中出现16次):

bar      12
foo      16
super    10
Run Code Online (Sandbox Code Playgroud)

当尝试在df中找到给定关键字的概率时会出现问题,该关键字当前不附加列名.下面是我目前正在使用的内容,但是抛出"AttributeError:'Series'对象没有属性'columns'"错误.

def _probability(df, query):
  return df[query] / df.groupby['count'].sum()
Run Code Online (Sandbox Code Playgroud)

我希望调用_probability(df,'foo')将返回0.421052632(16 /(12 + 16 + 10)).提前致谢!

python pandas

5
推荐指数
1
解决办法
699
查看次数

将数据帧结果值保存到字符串变量?

当找到我想将其保存到变量的最大日期时,我在 spark 中创建了一个数据框。只是想弄清楚如何获得结果,这是一个字符串,并将其保存到一个变量中。

到目前为止的代码:

sqlDF = spark.sql("SELECT MAX(date) FROM account")
sqlDF.show()
Run Code Online (Sandbox Code Playgroud)

结果是什么样的:

+--------------------+
| max(date)|
+--------------------+
|2018-04-19T14:11:...|
+--------------------+
Run Code Online (Sandbox Code Playgroud)

谢谢

python dataframe spark-dataframe pyspark-sql databricks

5
推荐指数
2
解决办法
1万
查看次数

将正则表达式拆分为2个捕获组

好的,我以前的问题得到了解答......我还有一个问题,这个对我来说更难...

^([A-Za-z]+\.[A-Za-z0-9_-]+\.domain\.com)$
Run Code Online (Sandbox Code Playgroud)

此时此表达式仅生成1个捕获组,如^()所示; 如何为此URL执行2个捕获组?(用于IIS正则表达式重写)

regex iis-7 url-rewriting

3
推荐指数
1
解决办法
1万
查看次数

去fmt.Println显示错误包含

我通过使用"go go go"来学习GO
.代码正在做非常简单的事情,将第一个和最后一个组合在一起并在屏幕上输出.
运行代码后,输出是十六进制地址而不是"aaabbb".任何人都可以帮助我吗?谢谢

package main

import "fmt"

type Name struct{
    first,last string
}

func (name Name) fullName() string{
    return (name.first + name.last)
}

func main(){
    v := Name{"aaa","bbb"}
    fmt.Println(v.fullName)
}
Run Code Online (Sandbox Code Playgroud)

go

2
推荐指数
2
解决办法
78
查看次数

ValueError:样本不够大,无法包含至少一行数据。请增加“sample”中的字节数

我正在尝试读取 csv 文件(2GB)。由于大小很大,我使用了 dask,但它显示 ValueError:样本不够大,无法包含至少一行数据。sample请增加调用中的字节数read_csv/read_table 任何人都可以建议我如何解决它吗?谢谢

代码:

import dask.dataframe as dd
df= dd.read_csv('file1.csv')
Run Code Online (Sandbox Code Playgroud)

错误:

ValueError: Sample is not large enough to include at least one row of data. Please increase the number of bytes in `sample` in the call to `read_csv`/`read_table`
Run Code Online (Sandbox Code Playgroud)

python dask

2
推荐指数
1
解决办法
3910
查看次数