小编Mon*_*eck的帖子

如何使用Wget从URL下载所有图像到单个文件夹？

我使用wget从网站下载所有图像,它工作正常但它存储了所有子文件夹的网站的原始层次结构,因此图像点缀.有没有办法让它将所有图像下载到一个文件夹中？我目前使用的语法是:

wget -r -A jpeg,jpg,bmp,gif,png http://www.somedomain.com

Run Code Online (Sandbox Code Playgroud)

wget

geo*_*310

2018 03-04

129
推荐指数

5
解决办法

24万
查看次数

读取csv时删除pandas中的索引列

我有以下代码导入CSV文件.有3列,我想将前两个设置为变量.当我将第二列设置为变量"效率"时,索引列也会被添加.我怎样才能摆脱索引列？

df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False)
energy = df.index
efficiency = df.Efficiency
print efficiency

Run Code Online (Sandbox Code Playgroud)

我试过用

del df['index']

Run Code Online (Sandbox Code Playgroud)

在我设定之后

energy = df.index

Run Code Online (Sandbox Code Playgroud)

我在另一篇文章中找到但导致"KeyError:'index'"

python pandas

Bog*_*ski

2018 12-29

95
推荐指数

5
解决办法

32万
查看次数

连接pandas中两个数据帧的行

我需要连接两个数据帧df_a并且一个接一个地df_b使用相同数量的行(nRow)而不考虑任何键.这个功能类似于cbind在R programming language.每个数据帧中的列数可能不同.

结果数据帧将具有相同的行nRow数和列数,等于两个数据帧中的列数之和.换句话说,这是两个数据帧的盲列式连接.

import pandas as pd
dict_data = {'Treatment': ['C', 'C', 'C'], 'Biorep': ['A', 'A', 'A'], 'Techrep': [1, 1, 1], 'AAseq': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'mz':[500.0, 500.5, 501.0]}
df_a = pd.DataFrame(dict_data)
dict_data = {'Treatment1': ['C', 'C', 'C'], 'Biorep1': ['A', 'A', 'A'], 'Techrep1': [1, 1, 1], 'AAseq1': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'inte1':[1100.0, 1050.0, 1010.0]}
df_b = pd.DataFrame(dict_data)

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

use*_*126

2017 07-16

53
推荐指数

2
解决办法

13万
查看次数

在Pandas数据框中查找唯一值,无论行或列位置如何

我有一个Pandas数据帧,我想找到该数据帧中的所有唯一值...无论行/列如何.如果我有一个10 x 10的数据帧,并假设它们有84个唯一值,我需要找到它们 - 而不是计数.

我可以通过迭代数据帧的行来创建一个集合并添加每行的值.但是,我觉得它可能效率低下(不能证明这一点).有找到它的有效方法吗？有预定义的功能吗？

python dataframe pandas

use*_*931

2016 08-19

50
推荐指数

2
解决办法

9万
查看次数

Python:Pandas中的NaN值仅适用于单个值

我只想检查Pandas系列中的单个单元格是否为空.

即,我想检查一个值是否是NaN.所有其他答案适用于系列和数组,但不适用于单值.

我已经试过pandas.notnull,pandas.isnull,numpy.isnan.是否只有单一价值的解决方案？

python nan pandas

vid*_*dit

2016 08-06

29
推荐指数

3
解决办法

4万
查看次数

在Pandas中将元组中的字符串拆分为列

我有以下DataFrame,Track ID行索引在哪里.如何将stats列中的字符串拆分为5列数字？

Track ID    stats
14.0    (-0.00924175824176, 0.41, -0.742016492568, 0.0036830094242, 0.00251748449963)
28.0    (0.0411538461538, 0.318230769231, 0.758717081514, 0.00264000622468, 0.0106535783677)
42.0    (-0.0144351648352, 0.168438461538, -0.80870348637, 0.000816872566404, 0.00316572586742)
56.0    (0.0343461538462, 0.288730769231, 0.950844962874, 6.1608706775e-07, 0.00337262030771)
70.0    (0.00905164835165, 0.151030769231, 0.670257006716, 0.0121790506745, 0.00302182567957)
84.0    (-0.0047967032967, 0.171615384615, -0.552879463981, 0.0500316517755, 0.00217970256969)

Run Code Online (Sandbox Code Playgroud)

python split pandas

t_n*_*t_n

2017 10-05

28
推荐指数

1
解决办法

4万
查看次数

在R中的数据框中查找重复的行(基于2列)

我在R中有一个数据框,看起来像:

| RIC    | Date                | Open   |
|--------|---------------------|--------|
| S1A.PA | 2011-06-30 20:00:00 | 23.7   |
| ABC.PA | 2011-07-03 20:00:00 | 24.31  |
| EFG.PA | 2011-07-04 20:00:00 | 24.495 |
| S1A.PA | 2011-07-05 20:00:00 | 24.23  |

Run Code Online (Sandbox Code Playgroud)

我想知道是否有关于RIC和Date组合的重复.R中是否有功能？

r duplicates dataframe

use*_*231

2017 01-06

22
推荐指数

4
解决办法

5万
查看次数

conda坚持继续([y]/n)？在ipython控制台中更新包时

我刚刚为Mac OS X下载了Anaconda 4.2.0(使用python 3.5.2).每当我尝试更新任何软件包等时,我的ipython控制台都会显示软件包依赖关系,并显示"继续([y]/n)？" 但不接受任何投入.例如,我按回车键,或按y键等,没有任何反应.这是一个例子:

!conda create -n graphlab-env python=2.7 anaconda
Fetching package metadata .......
Solving package specifications: ..........

Package plan for installation in environment /Users/Abhijit/anaconda/envs/graphlab-env:

The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    python-2.7.12              |                1         9.5 MB
    _license-1.1               |           py27_1          80 KB
    alabaster-0.7.9            |           py27_0          11 KB
    anaconda-clean-1.0.0       |           py27_0           3 KB
.
.
.
    nbpresent-3.0.2            |           py27_0         463 KB
    anaconda-4.2.0             |      np111py27_0           6 KB
    ------------------------------------------------------------
                                           Total:       143.9 MB

The following NEW packages will be …

Run Code Online (Sandbox Code Playgroud)

python ipython spyder anaconda graphlab

Aby*_*Aby

2018 05-18

21
推荐指数

4
解决办法

2万
查看次数

R一年到十年

我想将最近十年的一组日期列为最近,例如:

1922 --> 1920,  
2099 --> 2090,

Run Code Online (Sandbox Code Playgroud)

等等

我希望我能在Lubridate做到这一点,如:

floor_date(1922, 'decade')

Run Code Online (Sandbox Code Playgroud)

但我得到:

Error in match.arg(unit) : 
  'arg' should be one of “second”, “minute”, “hour”, “day”, “week”, “month”, “year”

Run Code Online (Sandbox Code Playgroud)

有没有办法优雅地做到这一点,也许避免一堆if-else语句进行分箱,并希望避免一堆cuts进行分组？

r date lubridate

Mon*_*eck

2018 02-25

18
推荐指数

3
解决办法

5646
查看次数

如何计算Neo4j中的关系数量

我正在使用Neo4j 2.0并使用以下查询来查找特定节点中特定关系的数量计数.

我必须检查来自特定节点PERSON的名为"LIVES"的关系数量.

我的查询是:

match (p:PERSON)-[r:LIVES]->(u:CITY) where count(r)>1  
return count(p);

Run Code Online (Sandbox Code Playgroud)

显示的错误是:

SyntaxException: Invalid use of aggregating function count(...)

Run Code Online (Sandbox Code Playgroud)

我该如何纠正？

neo4j cypher

poo*_*ank

2016 04-21

16
推荐指数

1
解决办法

2万
查看次数

标签统计

python ×6

pandas ×5

dataframe ×3

r ×2

anaconda ×1

cypher ×1

date ×1

duplicates ×1

graphlab ×1

ipython ×1

lubridate ×1

nan ×1

neo4j ×1

split ×1

spyder ×1

wget ×1

标签 统计

小编Mon_eck的帖子

标签统计