我刚刚开始使用Markdown.我喜欢它,但有一件事困扰着我:如何使用Markdown改变图像的大小?
该文档仅为图像提供以下建议:

Run Code Online (Sandbox Code Playgroud)
如果可能的话,我希望图片也能居中.我要求一般降价,而不仅仅是github如何做到这一点.
在R(感谢magritrr)中,您现在可以通过更多功能管道语法执行操作%>%.这意味着不是编码:
> as.Date("2014-01-01")
> as.character((sqrt(12)^2)
Run Code Online (Sandbox Code Playgroud)
你也可以这样做:
> "2014-01-01" %>% as.Date
> 12 %>% sqrt %>% .^2 %>% as.character
Run Code Online (Sandbox Code Playgroud)
对我来说,这更具可读性,这扩展到数据框之外的用例.python语言是否支持类似的东西?
我正在使用pyspark数据帧分析一些数据,假设我有一个df我正在聚合的数据帧:
df.groupBy("group")\
.agg({"money":"sum"})\
.show(100)
Run Code Online (Sandbox Code Playgroud)
这会给我:
group SUM(money#2L)
A 137461285853
B 172185566943
C 271179590646
Run Code Online (Sandbox Code Playgroud)
聚合工作正常,但我不喜欢新的列名"SUM(钱#2L)".有没有一种巧妙的方法可以将此列重命名为人类可读的.agg方法?也许更类似于人们会做的事情dplyr:
df %>% group_by(group) %>% summarise(sum_money = sum(money))
Run Code Online (Sandbox Code Playgroud) 我知道你可以通过hive中的以下技巧从表中获取列名:
hive> set hive.cli.print.header=true;
hive> select * from tablename;
Run Code Online (Sandbox Code Playgroud)
是不是也有可能只是得到从表中的列名?
我不喜欢改变一个我只需要一次的设置.
我目前的解决方案如下:
hive> set hive.cli.print.header=true;
hive> select * from tablename;
hive> set hive.cli.print.header=false;
Run Code Online (Sandbox Code Playgroud)
这看起来过于冗长,反对DRY原则.
我正在尝试Julia DataFrames模块.我对它很感兴趣所以我可以用它在Gadfly中绘制简单的模拟.我希望能够迭代地向数据帧添加行,我想将其初始化为空.
有关如何执行此操作的教程/文档很少(大多数文档描述了如何分析导入的数据).
附加到非空数据帧很简单:
df = DataFrame(A = [1, 2], B = [4, 5])
push!(df, [3 6])
Run Code Online (Sandbox Code Playgroud)
这回来了.
3x2 DataFrame
| Row | A | B |
|-----|---|---|
| 1 | 1 | 4 |
| 2 | 2 | 5 |
| 3 | 3 | 6 |
Run Code Online (Sandbox Code Playgroud)
但是对于一个空的init我会得到错误.
df = DataFrame(A = [], B = [])
push!(df, [3, 6])
Run Code Online (Sandbox Code Playgroud)
错误信息:
ArgumentError("Error adding 3 to column :A. Possible type mis-match.")
while loading In[220], in expression starting on line 2 …Run Code Online (Sandbox Code Playgroud) 我正在使用anaconda分发的ipython/Qt控制台.我想内联绘制内容,所以我从ipython控制台输入以下内容:
%pylab inline
Run Code Online (Sandbox Code Playgroud)
接下来,我将(http://pandas.pydata.org/pandas-docs/dev/visualization.html)的教程输入到ipython中...
import matplotlib.pyplot as plt
import pandas as pd
ts = pd.Series(randn(1000), index = pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.plot()
Run Code Online (Sandbox Code Playgroud)
......这就是我回来的全部内容:
<matplotlib.axes.AxesSubplot at 0x109253410>
Run Code Online (Sandbox Code Playgroud)
但没有情节.可能有什么不对?我需要提供另一个命令吗?该教程表明,这就是我需要输入的所有内容.
我开始享受,dplyr但我被困在一个用例.我希望能够cumsum在包中的数据框中应用每个组,但我似乎无法做到正确.
对于演示数据帧,我生成了以下数据:
set.seed(123)
len = 10
dates = as.Date('2014-01-01') + 1:len
grp_a = data.frame(dates=dates, group='A', sales=rnorm(len))
grp_b = data.frame(dates=dates, group='B', sales=rnorm(len))
grp_c = data.frame(dates=dates, group='C', sales=rnorm(len))
df = rbind(grp_a, grp_b, grp_c)
Run Code Online (Sandbox Code Playgroud)
这会创建一个如下所示的数据框:
dates group sales
1 2014-01-02 A -0.56047565
2 2014-01-03 A -0.23017749
3 2014-01-04 A 1.55870831
4 2014-01-05 A 0.07050839
5 2014-01-06 A 0.12928774
6 2014-01-02 B 1.71506499
7 2014-01-03 B 0.46091621
8 2014-01-04 B -1.26506123
9 2014-01-05 B -0.68685285
10 2014-01-06 B -0.44566197
11 …Run Code Online (Sandbox Code Playgroud) 我习惯了安装包的R功能,我正在尝试用ipython做同样的事情.有时候下面的方法有效,但有时它却没有,我想终于找出为什么它只能工作一半的时间.
通常安装模块(例如ipython模块)我打开一个新终端后会输入以下内容:
$ sudo pip install requests
Password: *******
Run Code Online (Sandbox Code Playgroud)
然后会出现一条消息,指示安装已成功完成或已安装.
Requirement already satisfied (use --upgrade to upgrade):
requests in /Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages
Cleaning up...
Run Code Online (Sandbox Code Playgroud)
这表明可以访问代码.事实上,如果我现在从终端运行python,它会显示出良好的响应,而不会出现任何错误.
$ python
ActivePython 2.7.2.5 (ActiveState Software Inc.) based on
Python 2.7.2 (default, Jun 24 2011, 12:20:15)
[GCC 4.2.1 (Apple Inc. build 5664)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import requests
>>>
Run Code Online (Sandbox Code Playgroud)
我现在通过Alfred打开PyLab,它给了我一个错误.
Welcome to pylab, a matplotlib-based Python environment [backend: WXAgg].
For more information, type 'help(pylab)'.
In [1]: import …Run Code Online (Sandbox Code Playgroud) 当我查看GeoJson的规格时,我看到支持圆圈:
http://geopriv.dreamhosters.com/geojson/geojson-spec.html#circleExample
当我尝试使用geojsonlint(http://geojsonlint.com/)中的代码时,它会给我一个错误.
输入:
{
"type": "Circle",
"coordinates": [4.884, 52.353],
"radius": 200
}
Run Code Online (Sandbox Code Playgroud)
得到:
"Circle" is not a valid GeoJSON type.
Run Code Online (Sandbox Code Playgroud)
我想通过使用d3来显示不同的兴趣点,并对地图产生一系列影响.它需要GeoJson作为输入,但是GeoJson不支持圆圈吗?
在R中,dyplr您拥有%>%允许您将函数输出传递给新函数的运算符,从而无需存储中间值.在julia中,您可以通过使用|>运算符实现非常相似的功能.
2 |> log |> sqrt
Run Code Online (Sandbox Code Playgroud)
对我而言,这比阅读更好sqrt(log(2)).特别是当链条变得很长时.我想用这个语法,但也对map,reduce型功能朱莉娅.
from = "abcdefghijklmnopqrstuvwxyz"
to = "cdefghijklmnopqrstuvwxyzab"
trans = "g fmnc wms bgblr rpylqjyrc gr zw fylb <>"
d = {from[i] => to[i] for i = 1:26}
d[' '] = ' '
Run Code Online (Sandbox Code Playgroud)
map(x -> d[x], filter(x -> isalpha(x) || isspace(x), trans))
Run Code Online (Sandbox Code Playgroud)
这样可行,但它读起来并不像我希望的那样好.另一种方法是将中间结果存储到变量中,但这似乎也很冗长:
res1 = filter(x -> isalpha(x) || isspace(x), trans)
map(x -> d[x], res1)
Run Code Online (Sandbox Code Playgroud)
R语法与此类似:
trans |>
filter(x …Run Code Online (Sandbox Code Playgroud)