我是Spark SQL DataFrames和ML的新手(PySpark).如何创建服装标记器,例如删除停用词并使用nltk中的某些库?我可以延长默认值吗?
谢谢.
python nltk apache-spark pyspark apache-spark-ml
apache-spark ×1
apache-spark-ml ×1
nltk ×1
pyspark ×1
python ×1