小编Byr*_*Fox的帖子

PySpark：PicklingError：无法序列化对象：TypeError：无法pickle CompiledFFI 对象

我是 PySpark 环境的新手，在尝试使用加密模块加密 RDD 中的数据时遇到错误。这是代码：

from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('encrypt').getOrCreate()

df = spark.read.csv('test.csv', inferSchema = True, header = True)
df.show()
df.printSchema()

from cryptography.fernet import Fernet
key = Fernet.generate_key()
f = Fernet(key)

dfRDD = df.rdd
print(dfRDD)
mappedRDD = dfRDD.map(lambda value: (value[0], str(f.encrypt(str.encode(value[1]))), value[2] * 100))
data = mappedRDD.toDF()
data.show()

Run Code Online (Sandbox Code Playgroud)

一切工作，当然很好，直到我试图映射value[1]用str(f.encrypt(str.encode(value[1])))。我收到以下错误：