我正在用鹈鹕创建一个网站.我正在尝试将图像添加到摘要中,以便摘要始终以图像开头.
我尝试将图像添加到元数据中的摘要(使用markdown),但它只显示在索引页面上而不显示在其他页面上(在下面的示例中,图像未显示在"帖子"页面中).我还必须将图像添加到与文本相同的行中,这些文本有时以奇怪的方式呈现(根据图像大小,某些文本位于图像的一侧).
以下是元数据的示例:
Title: this is my title
Slug: slug
Date: 2017-05-04 23:00
Category: Posts
Tags: pelican
Author: Eyal
Summary:  and this is my post summary
Run Code Online (Sandbox Code Playgroud)
我也尝试使用摘要插件,但这根本不起作用.
将图像添加到摘要的最简单方法是什么?我希望尽可能避免修改HTML代码.
我正在尝试连接两个数据帧 - 一个使用multiindex列,另一个使用单个列名称.他们有类似的指数.
我收到以下警告:"UserWarning:在不同级别之间合并会产生意想不到的结果(左边3个级别,右边1个)"
例如:
arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index)
df2 = pd.DataFrame(np.random.randn(3), index=['A', 'B', 'C'],columns=['w'])
df3 = df.join(df2)
Run Code Online (Sandbox Code Playgroud)
加入这两个数据帧的最佳方法是什么?
我有一个带有文本列和名称列的数据框。我想检查该名称是否存在于文本列中,以及是否存在将其替换为某个值。我希望以下内容能够发挥作用:
df = df.withColumn("new_text",regex_replace(col("text),col("name"),"NAME"))
Run Code Online (Sandbox Code Playgroud)
但 Column 不可迭代,因此它不起作用。我必须写一个 udf 才能做到这一点吗?那会是什么样子?
我有一个带有列(“位置”)的数据框,其中包含有关以逗号分隔的城市和州的信息。有些值为 None。
我写了一个函数将数据拆分成城市和州并稍微清理一下:
def split_data(x):
if x:
s = x.split(',')
city = s[0].lstrip().rstrip()
state = s[1].lstrip().rstrip()
else:
city = None
state = None
return city, state
Run Code Online (Sandbox Code Playgroud)
我很难弄清楚如何从此函数创建 2 个单独的列。如果我使用以下内容:
df['location_info'] = df['location'].apply(split_data)
Run Code Online (Sandbox Code Playgroud)
它在“location_info”列中创建一个元组。
在数据框中创建 2 个新列的最佳方法是什么 - 一个称为“城市”,另一个称为“州”?
我有一个 Spark 数据框,其中有 2 列代表日期(date1 和 date2)。我想找到两个日期之间的相对周数(+ 1 周)。为了做到这一点,我找到每个日期的星期并将两者相减。date2 始终是较早的日期。日期之间的最大差异最多为 1 年,因此如果 date2 来自前一年,我需要在解决方案中添加 52。
我想出了如何做到这一点,但我的解决方案似乎很麻烦。这是我的解决方案:
from pyspark.sql.functions import date_format, udf
from pyspark.sql.types import IntegerType
def fixWeeks(w):
if w < 0:
w = w + 52
return w
week_filter = udf(fixWeeks,IntegerType())
df_week = df.withColumn("TmpWeek", date_format("date1",'w').cast('int')-date_format("date2",'w').cast('int')+1)
df_week = df_week.withColumn('week',week_filter(df_week.TmpWeek)).drop('TmpWeek')
Run Code Online (Sandbox Code Playgroud)
有没有更好的方法来实现相同的解决方案?我怎样才能在一个函数中做同样的事情?