我阅读了之前相关或问过的所有问题和答案,但仍然没有找到适合我问题的答案.
我正在使用python 3.6.5和pip(和setuptools)是最新的.我从这里安装了Microsoft Visual C++ Redistributable for Visual Studio 2017:https: //www.visualstudio.com/downloads/#build-tools-for-visual-studio-2017
使用pip install时,我仍然收到错误:
Microsoft Visual C++是必需的
PS:我想安装气流
我使用的是 Linux 18.04,我想在 EC2 上运行一个 Spark 集群。
我使用export命令设置环境变量
export AWS_ACCESS_KEY_ID=MyAccesskey
export AWS_SECRET_ACCESS_KEY=Mysecretkey
Run Code Online (Sandbox Code Playgroud)
但是当我运行命令来午餐 Spark 集群时,我得到
错误:必须设置环境变量 AWS_ACCESS_KEY_ID
我把我用过的所有命令都放在了以防万一我犯了错误:
sudo mv ~/Downloads/keypair.pem /usr/local/spark/keypair.pem
sudo mv ~/Downloads/credentials.csv /usr/local/spark/credentials.csv
# Make sure the .pem file is readable by the current user.
chmod 400 "keypair.pem"
# Go into the spark directory and set the environment variables with the credentials information
cd spark
export AWS_ACCESS_KEY_ID=ACCESS_KEY_ID
export AWS_SECRET_ACCESS_KEY=SECRET_KEY
# To install Spark 2.0 on the cluster:
sudo spark-ec2/spark-ec2 -k keypair --identity-file=keypair.pem --region=us-west-2 --zone=us-west-2a --copy-aws-credentials --instance-type t2.micro …
Run Code Online (Sandbox Code Playgroud) 我有一个字典列表,像这样:
my_list = [{'key1':'1', 'date':'2015-01-09'}, {'key1':'3', 'date':'2015-01-09'}, {'key1':'1', 'date':'2014-03-19'}, \
{'key1':'4', 'date':'2015-05-09'} ,...]
Run Code Online (Sandbox Code Playgroud)
在一些字典中,key1的值重复,我想根据日期(字典的另一个键)从列表中删除它们,并只保留具有最早日期的字典.结果:
my_list = [{'key1':'3', 'date':'2015-01-09'}, {'key1':'1', 'date':'2014-03-19'}, {'key1':'4', 'date':'2015-05-09'} ,...]
Run Code Online (Sandbox Code Playgroud)
表现很重要.