小智 2
spark.read.format("binaryFile").option("pathGlobFilter", "*.png").load("/path/to/data")
Run Code Online (Sandbox Code Playgroud)
然而,这需要处理二进制数据。因此,建议导出gensim :
# Save gensim model
filename = "stored_model.csv"
trained_model.save(filename)
Run Code Online (Sandbox Code Playgroud)
然后在pyspark中加载模型:
df = spark.read.load("stored_model.csv",
format="csv",
sep=";",
inferSchema="true",
header="true")
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
565 次 |
| 最近记录: |