小编Eya*_* S.的帖子

鹈鹕 - 添加图像到摘要

我正在用鹈鹕创建一个网站.我正在尝试将图像添加到摘要中,以便摘要始终以图像开头.

我尝试将图像添加到元数据中的摘要(使用markdown),但它只显示在索引页面上而不显示在其他页面上(在下面的示例中,图像未显示在"帖子"页面中).我还必须将图像添加到与文本相同的行中,这些文本有时以奇怪的方式呈现(根据图像大小,某些文本位于图像的一侧).

以下是元数据的示例:

Title: this is my title
Slug: slug
Date: 2017-05-04 23:00
Category: Posts
Tags: pelican
Author: Eyal
Summary: ![figure 1](images/fig1.png) and this is my post summary

Run Code Online (Sandbox Code Playgroud)

我也尝试使用摘要插件,但这根本不起作用.

将图像添加到摘要的最简单方法是什么？我希望尽可能避免修改HTML代码.

pelican

Eya*_* S.

2017 05-16

5
推荐指数

1
解决办法

838
查看次数

加入数据帧 - 一个是多索引列,另一个是没有

我正在尝试连接两个数据帧 - 一个使用multiindex列,另一个使用单个列名称.他们有类似的指数.

我收到以下警告:"UserWarning:在不同级别之间合并会产生意想不到的结果(左边3个级别,右边1个)"

例如:

arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
          ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index)
df2 = pd.DataFrame(np.random.randn(3), index=['A', 'B', 'C'],columns=['w'])
df3 = df.join(df2)

Run Code Online (Sandbox Code Playgroud)

加入这两个数据帧的最佳方法是什么？

python join multi-index pandas

Eya*_* S.

2017 04-05

3
推荐指数

1
解决办法

4524
查看次数

Pyspark 根据另一列中的模式替换列中的字符串

我有一个带有文本列和名称列的数据框。我想检查该名称是否存在于文本列中，以及是否存在将其替换为某个值。我希望以下内容能够发挥作用：

df = df.withColumn("new_text",regex_replace(col("text),col("name"),"NAME"))

Run Code Online (Sandbox Code Playgroud)

但 Column 不可迭代，因此它不起作用。我必须写一个 udf 才能做到这一点吗？那会是什么样子？

pyspark

Eya*_* S.

2019 05-30

3
推荐指数

1
解决办法

3890
查看次数

Pandas：使用 apply 将列拆分为 2

我有一个带有列（“位置”）的数据框，其中包含有关以逗号分隔的城市和州的信息。有些值为 None。

我写了一个函数将数据拆分成城市和州并稍微清理一下：

def split_data(x):
    if x:
        s = x.split(',')
        city = s[0].lstrip().rstrip()
        state = s[1].lstrip().rstrip()
    else:
        city = None
        state = None
    return city, state

Run Code Online (Sandbox Code Playgroud)

我很难弄清楚如何从此函数创建 2 个单独的列。如果我使用以下内容：

df['location_info'] = df['location'].apply(split_data)

Run Code Online (Sandbox Code Playgroud)

它在“location_info”列中创建一个元组。

在数据框中创建 2 个新列的最佳方法是什么 - 一个称为“城市”，另一个称为“州”？

python dataframe pandas

Eya*_* S.

lucky-day

2
推荐指数

1
解决办法

4818
查看次数

查找两个日期之间的相对周数

我有一个 Spark 数据框，其中有 2 列代表日期（date1 和 date2）。我想找到两个日期之间的相对周数（+ 1 周）。为了做到这一点，我找到每个日期的星期并将两者相减。date2 始终是较早的日期。日期之间的最大差异最多为 1 年，因此如果 date2 来自前一年，我需要在解决方案中添加 52。

我想出了如何做到这一点，但我的解决方案似乎很麻烦。这是我的解决方案：

from pyspark.sql.functions import date_format, udf
from pyspark.sql.types import IntegerType

def fixWeeks(w):
  if w < 0:
    w = w + 52
  return w

week_filter = udf(fixWeeks,IntegerType())
df_week = df.withColumn("TmpWeek", date_format("date1",'w').cast('int')-date_format("date2",'w').cast('int')+1)
df_week = df_week.withColumn('week',week_filter(df_week.TmpWeek)).drop('TmpWeek')

Run Code Online (Sandbox Code Playgroud)

有没有更好的方法来实现相同的解决方案？我怎样才能在一个函数中做同样的事情？

pyspark

Eya*_* S.

lucky-day

2
推荐指数

1
解决办法

6177
查看次数