小编sha*_*nuo的帖子

使用正则表达式提取字符串

我需要从以下字符串中提取IP地址.

>>> mydns='ec2-54-196-170-182.compute-1.amazonaws.com'
Run Code Online (Sandbox Code Playgroud)

需要返回点左侧的文本.以下按预期工作.

>>> mydns[:18]
'ec2-54-196-170-182'
Run Code Online (Sandbox Code Playgroud)

但它并不适用于所有情况.例如

mydns='ec2-666-777-888-999.compute-1.amazonaws.com'

>>> mydns[:18]
'ec2-666-777-888-99'
Run Code Online (Sandbox Code Playgroud)

如何在python中使用正则表达式?

python regex

3
推荐指数
1
解决办法
95
查看次数

匹配列名时的值错误

以下代码显示错误.但是如果我删除usercols参数它会起作用.

from StringIO import StringIO
import pandas as pd

u_cols = ['page_id','web_id']
audit_trail = StringIO('''
page_id | web_id
3|0
7|3
11|4
15|5
19|6
''')

df = pd.read_csv(audit_trail, sep="|", usecols = u_cols  )
Run Code Online (Sandbox Code Playgroud)

ValueError:传递的标题名称与usecols不匹配

我需要使用u_cols列表,因为列标题是动态生成的.

pandas

3
推荐指数
1
解决办法
1万
查看次数

在列表模型中查找深度

我的生产数据看起来类似于此处解释的邻接列表模型...

http://mysql.stu.edu.tw/tech-resources/articles/hierarchical-data.html

我的问题是如何知道嵌套有多深?在这种情况下,从最后一个叶子"Flash"到第一个节点"Electronics"是4.是否有返回此最大深度数的查询?

mysql sql

3
推荐指数
1
解决办法
974
查看次数

Dask就地替换熊猫?

我想知道我是否可以使用 dask 代替 Pandas。我可能面临哪些问题?

1)我猜对于较小的数据集,dask 会比 Pandas 慢。我对此没有意见,因为有时我不知道数据的大小,也不知道服务器配置。

2)我将不得不学习稍微不同的语法(例如计算)

我会遇到 dask 数据框不能做熊猫数据框可以做的事情的情况吗?

dask

3
推荐指数
1
解决办法
911
查看次数

在python中更改字符串的顺序

如何更改字符串的顺序?例如

mys='4002-10-21'
Run Code Online (Sandbox Code Playgroud)

预期结果:

'4002-21-10'
Run Code Online (Sandbox Code Playgroud)

我尝试过的:

我可以枚举分割的字符串,然后像1-3-2那样重新排列序列

newlist=list()
for i, v in enumerate(mys.split('-')):
    newlist.append(v)
Run Code Online (Sandbox Code Playgroud)

python

3
推荐指数
2
解决办法
2311
查看次数

将数据从 S3 加载到 dask 数据帧

只有在将文件公开后将“anon”参数更改为 True 时,我才能加载数据。

df = dd.read_csv('s3://mybucket/some-big.csv',  storage_options = {'anon':False})
Run Code Online (Sandbox Code Playgroud)

出于明显的原因,不建议这样做。如何安全地从 S3 加载数据?

python dask dask-distributed

3
推荐指数
1
解决办法
4226
查看次数

将熊猫数据框显示到另一个选项卡中

我正在尝试在另一个“输出视图”选项卡中显示我的熊猫数据框,如图所示...

https://github.com/quantopian/qgrid/blob/master/docs/images/events_api.gif

我可以使用以下命令安装并尝试 qgrid 的基本功能。但无法获得如上所示的确切视图。

!pip install qgrid
!jupyter nbextension enable --py --sys-prefix qgrid
!jupyter nbextension enable --py --sys-prefix  widgetsnbextension

import qgrid
import pandas as pd
df = pd.read_csv('some.csv')

qgrid_widget = qgrid.show_grid(df, show_toolbar=True)
qgrid_widget

qgrid_widget.get_changed_df()
Run Code Online (Sandbox Code Playgroud)

python pandas jupyter-notebook jupyter-contrib-nbextensions

3
推荐指数
1
解决办法
4032
查看次数

每天安排一次 lambda 函数

我有一个按预期工作的云信息模板。它安装 python lambda 函数。

https://github.com/shantanuo/easyboto/blob/master/install_lambda.txt

但如何每天运行该函数一次呢?我知道 yaml 代码看起来像这样......

  NotifierLambdaScheduledRule:
    Type: AWS::Events::Rule
    Properties:
      Name: 'notifier-scheduled-rule'
      Description: 'Triggers notifier lambda once per day'
      ScheduleExpression: cron(0 7 ? * * *)
      State: ENABLED
Run Code Online (Sandbox Code Playgroud)

换句话说,如何将 cron 设置集成到我的 cloudformation 模板中?

aws-cloudformation

3
推荐指数
1
解决办法
2110
查看次数

使用 one_hot 类对文本进行 keras 预处理

我在在线学习 keras 时遇到了这段代码。

from keras.preprocessing.text import one_hot
from keras.preprocessing.text import text_to_word_sequence

text = 'One hot encoding in Keras'
tokens = text_to_word_sequence(text)
length = len(tokens)
one_hot(text, length)
Run Code Online (Sandbox Code Playgroud)

这会返回这样的整数......

[3,1,1,2,3]

我不明白为什么以及如何唯一的单词返回重复的数字。例如,即使文本中的单词是唯一的,3 和 1 也会重复。

keras

3
推荐指数
1
解决办法
2437
查看次数

使用MySQL Workbench

我正在尝试使用"Mysql workbench"创建表关系的图形表示.

我双击"MySQL Model"选项卡并添加了Diagram.

但我无法弄清楚如何从当前数据库中显示表格.有帮助吗?

mysql mysql-workbench

2
推荐指数
1
解决办法
3430
查看次数