在pyspark中运行一个简单的应用程序.
f = sc.textFile("README.md")
wc = f.flatMap(lambda x: x.split(' ')).map(lambda x: (x, 1)).reduceByKey(add)
Run Code Online (Sandbox Code Playgroud)
我想使用foreach操作查看RDD内容:
wc.foreach(print)
Run Code Online (Sandbox Code Playgroud)
这会引发语法错误:
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)
我错过了什么?