小编sha*_*nuo的帖子

使用正则表达式提取字符串

我需要从以下字符串中提取IP地址.

>>> mydns='ec2-54-196-170-182.compute-1.amazonaws.com'

Run Code Online (Sandbox Code Playgroud)

需要返回点左侧的文本.以下按预期工作.

>>> mydns[:18]
'ec2-54-196-170-182'

Run Code Online (Sandbox Code Playgroud)

但它并不适用于所有情况.例如

mydns='ec2-666-777-888-999.compute-1.amazonaws.com'

>>> mydns[:18]
'ec2-666-777-888-99'

Run Code Online (Sandbox Code Playgroud)

如何在python中使用正则表达式？

python regex

sha*_*nuo

lucky-day

3
推荐指数

1
解决办法

95
查看次数

匹配列名时的值错误

以下代码显示错误.但是如果我删除usercols参数它会起作用.

from StringIO import StringIO
import pandas as pd

u_cols = ['page_id','web_id']
audit_trail = StringIO('''
page_id | web_id
3|0
7|3
11|4
15|5
19|6
''')

df = pd.read_csv(audit_trail, sep="|", usecols = u_cols  )

Run Code Online (Sandbox Code Playgroud)

ValueError:传递的标题名称与usecols不匹配

我需要使用u_cols列表,因为列标题是动态生成的.

pandas

sha*_*nuo

2014 08-06

3
推荐指数

1
解决办法

1万
查看次数

在列表模型中查找深度

我的生产数据看起来类似于此处解释的邻接列表模型...

http://mysql.stu.edu.tw/tech-resources/articles/hierarchical-data.html

我的问题是如何知道嵌套有多深？在这种情况下,从最后一个叶子"Flash"到第一个节点"Electronics"是4.是否有返回此最大深度数的查询？

mysql sql

sha*_*nuo

2015 07-07

3
推荐指数

1
解决办法

974
查看次数

Dask就地替换熊猫？

我想知道我是否可以使用 dask 代替 Pandas。我可能面临哪些问题？

1）我猜对于较小的数据集，dask 会比 Pandas 慢。我对此没有意见，因为有时我不知道数据的大小，也不知道服务器配置。

2）我将不得不学习稍微不同的语法（例如计算）

我会遇到 dask 数据框不能做熊猫数据框可以做的事情的情况吗？

dask

sha*_*nuo

lucky-day

3
推荐指数

1
解决办法

911
查看次数

在python中更改字符串的顺序

如何更改字符串的顺序？例如

mys='4002-10-21'

Run Code Online (Sandbox Code Playgroud)

预期结果:

'4002-21-10'

Run Code Online (Sandbox Code Playgroud)

我尝试过的:

我可以枚举分割的字符串,然后像1-3-2那样重新排列序列

newlist=list()
for i, v in enumerate(mys.split('-')):
    newlist.append(v)

Run Code Online (Sandbox Code Playgroud)

python

sha*_*nuo

lucky-day

3
推荐指数

2
解决办法

2311
查看次数

将数据从 S3 加载到 dask 数据帧

只有在将文件公开后将“anon”参数更改为 True 时，我才能加载数据。

df = dd.read_csv('s3://mybucket/some-big.csv',  storage_options = {'anon':False})

Run Code Online (Sandbox Code Playgroud)

出于明显的原因，不建议这样做。如何安全地从 S3 加载数据？

python dask dask-distributed

sha*_*nuo

2019 01-15

3
推荐指数

1
解决办法

4226
查看次数

将熊猫数据框显示到另一个选项卡中

我正在尝试在另一个“输出视图”选项卡中显示我的熊猫数据框，如图所示...

https://github.com/quantopian/qgrid/blob/master/docs/images/events_api.gif

我可以使用以下命令安装并尝试 qgrid 的基本功能。但无法获得如上所示的确切视图。

!pip install qgrid
!jupyter nbextension enable --py --sys-prefix qgrid
!jupyter nbextension enable --py --sys-prefix  widgetsnbextension

import qgrid
import pandas as pd
df = pd.read_csv('some.csv')

qgrid_widget = qgrid.show_grid(df, show_toolbar=True)
qgrid_widget

qgrid_widget.get_changed_df()

Run Code Online (Sandbox Code Playgroud)

python pandas jupyter-notebook jupyter-contrib-nbextensions

sha*_*nuo

2019 04-09

3
推荐指数

1
解决办法

4032
查看次数

每天安排一次 lambda 函数

我有一个按预期工作的云信息模板。它安装 python lambda 函数。

https://github.com/shantanuo/easyboto/blob/master/install_lambda.txt

但如何每天运行该函数一次呢？我知道 yaml 代码看起来像这样......

  NotifierLambdaScheduledRule:
    Type: AWS::Events::Rule
    Properties:
      Name: 'notifier-scheduled-rule'
      Description: 'Triggers notifier lambda once per day'
      ScheduleExpression: cron(0 7 ? * * *)
      State: ENABLED

Run Code Online (Sandbox Code Playgroud)

换句话说，如何将 cron 设置集成到我的 cloudformation 模板中？

aws-cloudformation

sha*_*nuo

lucky-day

3
推荐指数

1
解决办法

2110
查看次数

使用 one_hot 类对文本进行 keras 预处理

我在在线学习 keras 时遇到了这段代码。

from keras.preprocessing.text import one_hot
from keras.preprocessing.text import text_to_word_sequence

text = 'One hot encoding in Keras'
tokens = text_to_word_sequence(text)
length = len(tokens)
one_hot(text, length)

Run Code Online (Sandbox Code Playgroud)

这会返回这样的整数......