小编Mon*_*eck的帖子

如何使用Wget从URL下载所有图像到单个文件夹?

我使用wget从网站下载所有图像,它工作正常但它存储了所有子文件夹的网站的原始层次结构,因此图像点缀.有没有办法让它将所有图像下载到一个文件夹中?我目前使用的语法是:

wget -r -A jpeg,jpg,bmp,gif,png http://www.somedomain.com
Run Code Online (Sandbox Code Playgroud)

wget

129
推荐指数
5
解决办法
24万
查看次数

读取csv时删除pandas中的索引列

我有以下代码导入CSV文件.有3列,我想将前两个设置为变量.当我将第二列设置为变量"效率"时,索引列也会被添加.我怎样才能摆脱索引列?

df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False)
energy = df.index
efficiency = df.Efficiency
print efficiency
Run Code Online (Sandbox Code Playgroud)

我试过用

del df['index']
Run Code Online (Sandbox Code Playgroud)

在我设定之后

energy = df.index
Run Code Online (Sandbox Code Playgroud)

我在另一篇文章中找到但导致"KeyError:'index'"

python pandas

95
推荐指数
5
解决办法
32万
查看次数

连接pandas中两个数据帧的行

我需要连接两个数据帧df_a并且一个接一个地df_b使用相同数量的行(nRow)而不考虑任何键.这个功能类似于cbindR programming language.每个数据帧中的列数可能不同.

结果数据帧将具有相同的行nRow数和列数,等于两个数据帧中的列数之和.换句话说,这是两个数据帧的盲列式连接.

import pandas as pd
dict_data = {'Treatment': ['C', 'C', 'C'], 'Biorep': ['A', 'A', 'A'], 'Techrep': [1, 1, 1], 'AAseq': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'mz':[500.0, 500.5, 501.0]}
df_a = pd.DataFrame(dict_data)
dict_data = {'Treatment1': ['C', 'C', 'C'], 'Biorep1': ['A', 'A', 'A'], 'Techrep1': [1, 1, 1], 'AAseq1': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'inte1':[1100.0, 1050.0, 1010.0]}
df_b = pd.DataFrame(dict_data)
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

53
推荐指数
2
解决办法
13万
查看次数

在Pandas数据框中查找唯一值,无论行或列位置如何

我有一个Pandas数据帧,我想找到该数据帧中的所有唯一值...无论行/列如何.如果我有一个10 x 10的数据帧,并假设它们有84个唯一值,我需要找到它们 - 而不是计数.

我可以通过迭代数据帧的行来创建一个集合并添加每行的值.但是,我觉得它可能效率低下(不能证明这一点).有找到它的有效方法吗?有预定义的功能吗?

python dataframe pandas

50
推荐指数
2
解决办法
9万
查看次数

Python:Pandas中的NaN值仅适用于单个值

我只想检查Pandas系列中的单个单元格是否为空.

即,我想检查一个值是否是NaN.所有其他答案适用于系列和数组,但不适用于单值.

我已经试过pandas.notnull,pandas.isnull,numpy.isnan.是否只有单一价值的解决方案?

python nan pandas

29
推荐指数
3
解决办法
4万
查看次数

在Pandas中将元组中的字符串拆分为列

我有以下DataFrame,Track ID行索引在哪里.如何将stats列中的字符串拆分为5列数字?

Track ID    stats
14.0    (-0.00924175824176, 0.41, -0.742016492568, 0.0036830094242, 0.00251748449963)
28.0    (0.0411538461538, 0.318230769231, 0.758717081514, 0.00264000622468, 0.0106535783677)
42.0    (-0.0144351648352, 0.168438461538, -0.80870348637, 0.000816872566404, 0.00316572586742)
56.0    (0.0343461538462, 0.288730769231, 0.950844962874, 6.1608706775e-07, 0.00337262030771)
70.0    (0.00905164835165, 0.151030769231, 0.670257006716, 0.0121790506745, 0.00302182567957)
84.0    (-0.0047967032967, 0.171615384615, -0.552879463981, 0.0500316517755, 0.00217970256969)
Run Code Online (Sandbox Code Playgroud)

python split pandas

28
推荐指数
1
解决办法
4万
查看次数

在R中的数据框中查找重复的行(基于2列)

我在R中有一个数据框,看起来像:

| RIC    | Date                | Open   |
|--------|---------------------|--------|
| S1A.PA | 2011-06-30 20:00:00 | 23.7   |
| ABC.PA | 2011-07-03 20:00:00 | 24.31  |
| EFG.PA | 2011-07-04 20:00:00 | 24.495 |
| S1A.PA | 2011-07-05 20:00:00 | 24.23  |
Run Code Online (Sandbox Code Playgroud)

我想知道是否有关于RIC和Date组合的重复.R中是否有功能?

r duplicates dataframe

22
推荐指数
4
解决办法
5万
查看次数

conda坚持继续([y]/n)?在ipython控制台中更新包时

我刚刚为Mac OS X下载了Anaconda 4.2.0(使用python 3.5.2).每当我尝试更新任何软件包等时,我的ipython控制台都会显示软件包依赖关系,并显示"继续([y]/n)?" 但不接受任何投入.例如,我按回车键,或按y键等,没有任何反应.这是一个例子:

!conda create -n graphlab-env python=2.7 anaconda
Fetching package metadata .......
Solving package specifications: ..........

Package plan for installation in environment /Users/Abhijit/anaconda/envs/graphlab-env:

The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    python-2.7.12              |                1         9.5 MB
    _license-1.1               |           py27_1          80 KB
    alabaster-0.7.9            |           py27_0          11 KB
    anaconda-clean-1.0.0       |           py27_0           3 KB
.
.
.
    nbpresent-3.0.2            |           py27_0         463 KB
    anaconda-4.2.0             |      np111py27_0           6 KB
    ------------------------------------------------------------
                                           Total:       143.9 MB

The following NEW packages will be …
Run Code Online (Sandbox Code Playgroud)

python ipython spyder anaconda graphlab

21
推荐指数
4
解决办法
2万
查看次数

R一年到十年

我想将最近十年的一组日期列为最近,例如:

1922 --> 1920,  
2099 --> 2090,  
Run Code Online (Sandbox Code Playgroud)

等等

我希望我能在Lubridate做到这一点,如:

floor_date(1922, 'decade')
Run Code Online (Sandbox Code Playgroud)

但我得到:

Error in match.arg(unit) : 
  'arg' should be one of “second”, “minute”, “hour”, “day”, “week”, “month”, “year”
Run Code Online (Sandbox Code Playgroud)

有没有办法优雅地做到这一点,也许避免一堆if-else语句进行分箱,并希望避免一堆cuts进行分组?

r date lubridate

18
推荐指数
3
解决办法
5646
查看次数

如何计算Neo4j中的关系数量

我正在使用Neo4j 2.0并使用以下查询来查找特定节点中特定关系的数量计数.

我必须检查来自特定节点PERSON的名为"LIVES"的关系数量.

我的查询是:

match (p:PERSON)-[r:LIVES]->(u:CITY) where count(r)>1  
return count(p);
Run Code Online (Sandbox Code Playgroud)

显示的错误是:

SyntaxException: Invalid use of aggregating function count(...)
Run Code Online (Sandbox Code Playgroud)

我该如何纠正?

neo4j cypher

16
推荐指数
1
解决办法
2万
查看次数

标签 统计

python ×6

pandas ×5

dataframe ×3

r ×2

anaconda ×1

cypher ×1

date ×1

duplicates ×1

graphlab ×1

ipython ×1

lubridate ×1

nan ×1

neo4j ×1

split ×1

spyder ×1

wget ×1