小编use*_*148的帖子

从大型文档中提取电子邮件子字符串

我有一个非常大的.txt文件,其中包含数十万个电子邮件地址.他们都采用以下格式:

...<name@domain.com>...
Run Code Online (Sandbox Code Playgroud)

让Python在整个.txt文件中循环查找某个@domain字符串的所有实例,然后在<...>中获取整个地址,并将其添加到的最佳方法是什么?一个列表?我遇到的麻烦是不同地址的可变长度.

python string

31
推荐指数
3
解决办法
6万
查看次数

pandas数据帧将INT64列转换为布尔值

数据帧df,df.column中的某些列存储为数据类型int64.

值均为1或0.

有没有办法用布尔值替换这些值?

python boolean numpy pandas

13
推荐指数
1
解决办法
2万
查看次数

Conda和Python模块

可悲的是,我不明白如何在我的Anaconda发行版中安装随机python模块以便在iPython笔记本中使用.事实上,我需要能够在不使用实时互联网连接的情况下完成这些事情.

最常见的是我遇到了gcc编译的问题,我可以用我的基本Python2.7安装模块,但不能用Conda或Anaconda/Python.exe安装.

  • Conda是否只能安装某些模块,而不是所有有效的python模块?

  • 什么是binstar?

  • 我需要做什么,如果有的话,到普通的python模块,以使其成为"Conda-ready",可以这么说?

  • 一旦我从SourceForge或GitHub或任何地方下载了python模块,我如何要求Conda从我的计算机上的源文件/二进制文件安装该模块(无需连接到互联网)?

非常感谢帮助.

python ipython anaconda conda

7
推荐指数
1
解决办法
3699
查看次数

使用Python将整个JSON整合到一个SQLite字段中

我有一个简单的问题.我正在尝试从在线源中提取JSON,并将其存储在SQLite表中.除了将数据存储在富表中,对应于JSON中的许多字段之外,我还想在每次拉取时将整个JSON转储到表中.

该表看起来像:

CREATE TABLE Raw_JSONs (ID INTEGER PRIMARY KEY ASC, T DATE DEFAULT (datetime('now','localtime')), JSON text);
Run Code Online (Sandbox Code Playgroud)

我使用以下python代码从某个URL中提取了一个JSON:

from pyquery import PyQuery
from lxml import etree
import urllib

x = PyQuery(url='json')
y = x('p').text()
Run Code Online (Sandbox Code Playgroud)

现在,我想执行以下INSERT命令:

import sqlite3

db = sqlite3.connect('a.db')
c = db.cursor()

c.execute("insert into Raw_JSONs values(NULL,DATETIME('now'),?)", y)
Run Code Online (Sandbox Code Playgroud)

但我告诉我,我提供了错误的数字绑定(即数千,而不是1).我收集它正在读取y变量作为JSON的所有不同元素.

有人可以帮我存储JSON,完整吗?

此外,由于我显然是这个JSON游戏的新手,所以推荐的任何在线资源都会令人惊叹.

谢谢!

python sqlite json pyquery

4
推荐指数
1
解决办法
4724
查看次数

安装Anaconda后无法安装Python模块

[新注意:我不能通过binstar或anaconda安装.为什么我不能在蟒蛇外安装蟒蛇?有没有办法让我的电脑停止使用anaconda安装的python,因为我没有专门通过连续发射器来安装它?

我在Windows机器上安装了Python 2.7.我刚刚安装了Anaconda.

我只是尝试为我的Python安装安装一个新模块.我在解压缩的文件夹中为python模块打开了一个命令提示符并运行:

python setup.py安装

但是,我在构建行遇到错误:

建立'pyodbc'扩展

最终的错误行如下:

错误:命令'gcc'失败,退出状态为1

它似乎已经找到并找不到几个文件或目录.例如,我收到了几(7)行错误,如:

gcc.exe:错误:/ Wall:没有这样的文件或目录

我有一种疯狂的预感,安装Anaconda会扰乱我的PATH变量(或其他东西),但这只是一种预感.

谢天谢地.

python windows pyodbc python-2.7 anaconda

3
推荐指数
1
解决办法
9986
查看次数

将变量 geom_hline 添加到条形图的所有方面

我有一个使用 ggplot2 库的条形图:

plot <- qplot(Date, data=cns, 
              geom="bar", binwidth = 1, 
              fill=Type, facets = Name ~ .)
Run Code Online (Sandbox Code Playgroud)

这给了我一个多面条形图,按名称。

cns 的前 11 行如下所示:

            Name       Date      Type     Days
1           Name 1 2013-03-12 Requested    0
2           Name 1 2013-03-14 Requested    0
3           Name 1 2013-03-19 Requested    0
4           Name 2 2013-03-01 Completed    1
5           Name 2 2013-03-01 Requested    0
6           Name 2 2013-03-07 Completed    3
7           Name 2 2013-03-08 Requested    0
8           Name 2 2013-03-08 Requested    0
9           Name 3 2013-03-08 Completed    0 …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

2
推荐指数
1
解决办法
2829
查看次数

查询Oracle Db中的所有表和字段

我正在使用我不熟悉的Oracle DB.

我想导出类似所有表和字段的矩阵.这可能吗?谢谢.

sql oracle

0
推荐指数
1
解决办法
1931
查看次数

R临时目录设置为外部驱动器

在大型数据集上的R中运行RecordLinkage程序包时,GUI失败并关闭。

我现在意识到,由于R的活动,120GB的数据已存储在我的Windows Temporary文件夹(文件格式.ff)中,已经达到HD的现有限制。

我想插入具有更多空间的外部驱动器,并设置临时目录以供R使用。

运行分析之前,我可以在R中执行此操作吗?命令是什么?

我没有在考虑解决此问题的另一种方法吗?谢谢。

r

0
推荐指数
1
解决办法
1544
查看次数

SQL:“ NOT IN(SUBQUERY)”无法正常工作

我在sqlite中面临以下难题,并且想知道sqlite方言是否缺少某些内容。

基本上,当我在一张表中要求总唯一值时,我得到一个数字。当我要求第二个表中存在的那些值的子集时,我得到的数字会减少。但是,当我要求对该子集的称赞时,我得到0。

考虑两个表A和B,它们具有不同但重叠的窗口小部件填充,这些窗口小部件由唯一的ID表示,我们可以将其称为Widget_ID。

我得到以下行为:

SELECT COUNT(DISTINCT WIDGET_ID)
FROM A
Run Code Online (Sandbox Code Playgroud)

输出:100

SELECT COUNT(DISTINCT WIDGET_ID)
FROM A
WHERE WIDGET_ID IN (SELECT WIDGET_ID FROM B)
Run Code Online (Sandbox Code Playgroud)

输出:75

SELECT COUNT(DISTINCT WIDGET_ID)
FROM A
WHERE WIDGET_ID NOT IN (SELECT WIDGET_ID FROM B)
Run Code Online (Sandbox Code Playgroud)

输出:0

这不是不可能吗?

sql sqlite

0
推荐指数
1
解决办法
1769
查看次数

标签 统计

python ×5

anaconda ×2

r ×2

sql ×2

sqlite ×2

boolean ×1

conda ×1

ggplot2 ×1

ipython ×1

json ×1

numpy ×1

oracle ×1

pandas ×1

pyodbc ×1

pyquery ×1

python-2.7 ×1

string ×1

windows ×1