小编can*_*his的帖子

在Markdown中更改图像大小

我刚刚开始使用Markdown.我喜欢它,但有一件事困扰着我:如何使用Markdown改变图像的大小？

该文档仅为图像提供以下建议:

![drawing](drawing.jpg)

Run Code Online (Sandbox Code Playgroud)

如果可能的话,我希望图片也能居中.我要求一般降价,而不仅仅是github如何做到这一点.

markdown image

can*_*his

2019 05-14

805
推荐指数

30
解决办法

55万
查看次数

python中的功能管道,如R's dplyr中的%>%

在R(感谢magritrr)中,您现在可以通过更多功能管道语法执行操作%>%.这意味着不是编码:

> as.Date("2014-01-01")
> as.character((sqrt(12)^2)

Run Code Online (Sandbox Code Playgroud)

你也可以这样做:

> "2014-01-01" %>% as.Date 
> 12 %>% sqrt %>% .^2 %>% as.character

Run Code Online (Sandbox Code Playgroud)

对我来说,这更具可读性,这扩展到数据框之外的用例.python语言是否支持类似的东西？

python functional-programming pipeline

can*_*his

2019 06-11

63
推荐指数

12
解决办法

2万
查看次数

重命名pyspark数据帧聚合的列

我正在使用pyspark数据帧分析一些数据,假设我有一个df我正在聚合的数据帧:

df.groupBy("group")\
  .agg({"money":"sum"})\
  .show(100)

Run Code Online (Sandbox Code Playgroud)

这会给我:

group                SUM(money#2L)
A                    137461285853
B                    172185566943
C                    271179590646

Run Code Online (Sandbox Code Playgroud)

聚合工作正常,但我不喜欢新的列名"SUM(钱#2L)".有没有一种巧妙的方法可以将此列重命名为人类可读的.agg方法？也许更类似于人们会做的事情dplyr:

df %>% group_by(group) %>% summarise(sum_money = sum(money))

Run Code Online (Sandbox Code Playgroud)

dataframe pyspark

can*_*his

lucky-day

56
推荐指数

5
解决办法

5万
查看次数

只需从hive表中获取列名

我知道你可以通过hive中的以下技巧从表中获取列名:

hive> set hive.cli.print.header=true;
hive> select * from tablename;

Run Code Online (Sandbox Code Playgroud)

是不是也有可能只是得到从表中的列名？

我不喜欢改变一个我只需要一次的设置.

我目前的解决方案如下:

hive> set hive.cli.print.header=true;
hive> select * from tablename;
hive> set hive.cli.print.header=false;

Run Code Online (Sandbox Code Playgroud)

这看起来过于冗长,反对DRY原则.

sql hadoop hive

can*_*his

2017 04-04

38
推荐指数

2
解决办法

8万
查看次数

julia创建一个空数据框并向其追加行

我正在尝试Julia DataFrames模块.我对它很感兴趣所以我可以用它在Gadfly中绘制简单的模拟.我希望能够迭代地向数据帧添加行,我想将其初始化为空.

有关如何执行此操作的教程/文档很少(大多数文档描述了如何分析导入的数据).

附加到非空数据帧很简单:

df = DataFrame(A = [1, 2], B = [4, 5])
push!(df, [3 6])

Run Code Online (Sandbox Code Playgroud)

这回来了.

3x2 DataFrame
| Row | A | B |
|-----|---|---|
| 1   | 1 | 4 |
| 2   | 2 | 5 |
| 3   | 3 | 6 |

Run Code Online (Sandbox Code Playgroud)

但是对于一个空的init我会得到错误.

df = DataFrame(A = [], B = [])
push!(df, [3, 6])

Run Code Online (Sandbox Code Playgroud)

错误信息:

ArgumentError("Error adding 3 to column :A. Possible type mis-match.")
while loading In[220], in expression starting on line 2 …

Run Code Online (Sandbox Code Playgroud)

dataframe julia

can*_*his

2015 02-26

28
推荐指数

2
解决办法

1万
查看次数

ipython熊猫情节没有显示

我正在使用anaconda分发的ipython/Qt控制台.我想内联绘制内容,所以我从ipython控制台输入以下内容:

%pylab inline

Run Code Online (Sandbox Code Playgroud)

接下来,我将(http://pandas.pydata.org/pandas-docs/dev/visualization.html)的教程输入到ipython中...

import matplotlib.pyplot as plt
import pandas as pd 
ts = pd.Series(randn(1000), index = pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.plot()

Run Code Online (Sandbox Code Playgroud)

......这就是我回来的全部内容:

<matplotlib.axes.AxesSubplot at 0x109253410>

Run Code Online (Sandbox Code Playgroud)

但没有情节.可能有什么不对？我需要提供另一个命令吗？该教程表明,这就是我需要输入的所有内容.

python matplotlib ipython pandas anaconda

can*_*his

2013 08-23

22
推荐指数

2
解决办法

2万
查看次数

dplyr中每组的r cumsum

我开始享受,dplyr但我被困在一个用例.我希望能够cumsum在包中的数据框中应用每个组,但我似乎无法做到正确.

对于演示数据帧,我生成了以下数据:

set.seed(123)

len = 10 
dates = as.Date('2014-01-01') + 1:len
grp_a = data.frame(dates=dates, group='A', sales=rnorm(len))
grp_b = data.frame(dates=dates, group='B', sales=rnorm(len))
grp_c = data.frame(dates=dates, group='C', sales=rnorm(len))
df = rbind(grp_a, grp_b, grp_c)

Run Code Online (Sandbox Code Playgroud)

这会创建一个如下所示的数据框:

        dates group       sales
1  2014-01-02     A -0.56047565
2  2014-01-03     A -0.23017749
3  2014-01-04     A  1.55870831
4  2014-01-05     A  0.07050839
5  2014-01-06     A  0.12928774
6  2014-01-02     B  1.71506499
7  2014-01-03     B  0.46091621
8  2014-01-04     B -1.26506123
9  2014-01-05     B -0.68685285
10 2014-01-06     B -0.44566197
11 …

Run Code Online (Sandbox Code Playgroud)

r ggplot2 dplyr

can*_*his

2014 12-03

18
推荐指数

2
解决办法

2万
查看次数

ipython安装新模块

我习惯了安装包的R功能,我正在尝试用ipython做同样的事情.有时候下面的方法有效,但有时它却没有,我想终于找出为什么它只能工作一半的时间.

通常安装模块(例如ipython模块)我打开一个新终端后会输入以下内容:

$ sudo pip install requests
Password: *******

Run Code Online (Sandbox Code Playgroud)

然后会出现一条消息,指示安装已成功完成或已安装.

Requirement already satisfied (use --upgrade to upgrade): 
requests in /Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages
Cleaning up...

Run Code Online (Sandbox Code Playgroud)

这表明可以访问代码.事实上,如果我现在从终端运行python,它会显示出良好的响应,而不会出现任何错误.

$ python
ActivePython 2.7.2.5 (ActiveState Software Inc.) based on
Python 2.7.2 (default, Jun 24 2011, 12:20:15) 
[GCC 4.2.1 (Apple Inc. build 5664)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import requests
>>>

Run Code Online (Sandbox Code Playgroud)

我现在通过Alfred打开PyLab,它给了我一个错误.

Welcome to pylab, a matplotlib-based Python environment [backend: WXAgg].
For more information, type 'help(pylab)'.

In [1]: import …

Run Code Online (Sandbox Code Playgroud)

python install module pip ipython

can*_*his

2019 05-19

14
推荐指数

2
解决办法

3万
查看次数

geojson圈子,支持与否？

当我查看GeoJson的规格时,我看到支持圆圈:

http://geopriv.dreamhosters.com/geojson/geojson-spec.html#circleExample

当我尝试使用geojsonlint(http://geojsonlint.com/)中的代码时,它会给我一个错误.

输入:

{ 
"type": "Circle",
"coordinates": [4.884, 52.353],
"radius": 200
}

Run Code Online (Sandbox Code Playgroud)

得到:

"Circle" is not a valid GeoJSON type.

Run Code Online (Sandbox Code Playgroud)

我想通过使用d3来显示不同的兴趣点,并对地图产生一系列影响.它需要GeoJson作为输入,但是GeoJson不支持圆圈吗？

maps geojson d3.js leaflet

can*_*his

lucky-day

13
推荐指数

3
解决办法

2万
查看次数

地图,在朱莉娅用`|>`减少

在R中,dyplr您拥有%>%允许您将函数输出传递给新函数的运算符,从而无需存储中间值.在julia中,您可以通过使用|>运算符实现非常相似的功能.

用法示例

2 |> log |> sqrt

Run Code Online (Sandbox Code Playgroud)

对我而言,这比阅读更好sqrt(log(2)).特别是当链条变得很长时.我想用这个语法,但也对map,reduce型功能朱莉娅.

建立

from = "abcdefghijklmnopqrstuvwxyz"
to   = "cdefghijklmnopqrstuvwxyzab"
trans = "g fmnc wms bgblr rpylqjyrc gr zw fylb <>"
d = {from[i] => to[i] for i = 1:26}
d[' '] = ' '

Run Code Online (Sandbox Code Playgroud)

什么有效

map(x -> d[x], filter(x -> isalpha(x) || isspace(x), trans))

Run Code Online (Sandbox Code Playgroud)

这样可行,但它读起来并不像我希望的那样好.另一种方法是将中间结果存储到变量中,但这似乎也很冗长:

res1 = filter(x -> isalpha(x) || isspace(x), trans)
map(x -> d[x], res1)

Run Code Online (Sandbox Code Playgroud)

我更喜欢什么

R语法与此类似:

trans |> 
  filter(x …

Run Code Online (Sandbox Code Playgroud)

julia

can*_*his

2017 07-12

12
推荐指数

2
解决办法

2565
查看次数

标签统计

python ×3

dataframe ×2

ipython ×2

julia ×2

anaconda ×1

d3.js ×1

dplyr ×1

functional-programming ×1

geojson ×1

ggplot2 ×1

hadoop ×1

hive ×1

image ×1

install ×1

leaflet ×1

maps ×1

markdown ×1

matplotlib ×1

module ×1

pandas ×1

pip ×1

pipeline ×1

pyspark ×1

r ×1

sql ×1

用法示例

建立

什么有效

我更喜欢什么

标签 统计

小编can_his的帖子

标签统计