小编Wes*_*sam的帖子

如何在Spark应用程序中显示语句序列的逐步执行？

我有一个 Apache Spark 数据加载和转换应用程序，它在抛出一个或其他运行时异常pyspark.sql之前运行了半个小时。AttributeError

我想用一个小数据样本（例如 Apache Pig 的ILLUSTRATE. 对数据进行抽样并没有多大帮助。有没有一种简单的方法可以做到这一点？

apache-spark apache-spark-sql pyspark

Wes*_*sam

2016 10-15

5
推荐指数

1
解决办法

1790
查看次数

如何将 Google Data Studio 连接到 AWS Athena？

我需要将Google Data Studio连接到AWS Athena。一种方法是使用JDBC URL 连接选项。我在数据库身份验证表单中使用了以下参数，但出现如下所示的错误：

参数：

网址

jdbc:awsathena://athena.us-east-2.amazonaws.com:443;UID=[MY_AWS_ACCESS_KEY];PWD=[MY_AWS_SECRET_KEY];S3OutputLocation=s3://[S3_OUTPUT_BUCKET];

Run Code Online (Sandbox Code Playgroud)

用户名

[MY_AWS_ACCESS_KEY]

Run Code Online (Sandbox Code Playgroud)

密码

[MY_AWS_SECRET_KEY]

Run Code Online (Sandbox Code Playgroud)

错误：

服务器遇到内部错误，无法完成您的请求。

任何将 Google Data Studio 连接到 AWS Athena 甚至连接到 AWS S3 的解决方案都应该解决这个问题。我尝试使用此 Google Apps 脚本连接到 S3，但由于身份验证错误而无法连接，如此未解决的问题所示。

jdbc google-data-studio amazon-athena

Wes*_*sam

lucky-day

5
推荐指数

2
解决办法

4255
查看次数

TensorRT python 包与 python 3.6 不兼容

如果您使用运行文件安装 CUDA，则从其 tar 文件安装TensorRT 4是唯一可用的选项。但是，tar 文件仅包含 python 2.7 和 3.5 的 python TensorRT 轮文件。未提供 python 3.6 轮文件。

我无法在 python 3.6 系统上强制安装 python 3.5 轮文件：

$ pip install tensorrt-4.0.0.3-cp35-cp35m-linux_x86_64.whl 
tensorrt-4.0.0.3-cp35-cp35m-linux_x86_64.whl is not a supported wheel on this platform.

Run Code Online (Sandbox Code Playgroud)

另外，我无法创建一个新的 python 3.5 virtualenv 只是为了使用 TensorRT。

有没有办法通过手动复制文件来在我的 python 3.6 平台上手动安装这个包？

tensorflow python-3.6 tensorrt

Wes*_*sam

lucky-day

4
推荐指数

1
解决办法

3348
查看次数

如何使用 AWS CLI 将与名称模式匹配的多个文件复制到 AWS S3 存储桶？

我想使用AWS CLI将与文件名模式匹配的文件从我的计算机复制到 AWS S3 存储桶。使用标准unix 文件名通配符不起作用：

$ aws s3 cp *.csv s3://wesam-data/

Unknown options: file1.csv,file2.csv,file3.csv,s3://wesam-data/

Run Code Online (Sandbox Code Playgroud)

我按照这个 SO 答案解决了一个类似的问题，建议使用--exclude和--include过滤器，如下所示，但没有成功。

$ aws s3 cp . s3://wesam-data/ --exclude "*" --include "*.csv"

Run Code Online (Sandbox Code Playgroud)

amazon-s3 amazon-web-services aws-cli

Wes*_*sam

lucky-day

4
推荐指数

1
解决办法

4735
查看次数

绑定到已启动的服务后,从未调用ServiceConnection.onServiceConnected()

在游戏应用程序中,我有以下场景:

从主游戏Activity开始,玩家开始在后台运行的几个游戏任务,持续时间不同.
玩家应该能够单独查看正在运行的游戏任务的进度View.

为此,我创建了两个Activitys和a Service,定义如下:

Service ProgressService处理ProgressBar并行线程上同时运行的几个s.
Activity WorkScreen2创建一个游戏任务,启动Servicewith中startService()传递的任务参数Bundle.
Activity ProgressScreen绑定到Service获取并显示ProgressBar正在运行的任务的s.
这两项活动在独立运行的TabHost一个第TabActivity.

我遇到的问题ServiceConnection.onServiceConnected()是永远不会调用该方法.我得到一个Java.lang.NullPointerException因为我试图调用Service应该在此方法中分配的对象的方法.见下面的代码.

我getApplicationContext().bindService()用来绑定Activity到Service因为TabSpec无法绑定Services.此方法返回true.因此,绑定是成功的.

这是Service:

public class ProgressService extends Service implements GameConstants {
    public static final String BROADCAST_PROGRESS = "com.mycompany.android.mygame.progressbroadcast";
    private static final long …

Run Code Online (Sandbox Code Playgroud)

multithreading android android-service android-progressbar android-tabhost

Wes*_*sam

2012 02-12

3
推荐指数

2
解决办法

1万
查看次数

Apache Superset [Errno 13] 权限被拒绝：'/usr/local/lib/python3.5/site-packages/superset/app'

我使用Apache Superset进行数据探索。我按照安装说明操作，使用该应用程序没有任何问题。

但是，在我安装了社区维护的 docker 映像后，我尝试上传一个 CSV 文件进行可视化，但出现以下错误：

([Errno 13] Permission denied: '/usr/local/lib/python3.5/site-packages/superset/app')

Run Code Online (Sandbox Code Playgroud)

我使用sqlite作为数据库后端，并按照建议安装了数据库卷。

其他用户在不同的设置和配置中遇到了同样的问题。他们打开的问题（#4576、#4287）尚未解决。

从用户使用的不同数据库后端和配置可以看出，该问题似乎与数据库访问权限无关。

superset apache-superset

Wes*_*sam

lucky-day

3
推荐指数

1
解决办法

3266
查看次数

ValueError：系列的真值不明确

>>> df.head()\n                         \xe2\x84\x96 Summer  Gold  Silver  Bronze  Total  \xe2\x84\x96 Winter  \\\nAfghanistan (AFG)              13     0       0       2      2         0\nAlgeria (ALG)                  12     5       2       8     15         3\nArgentina (ARG)                23    18      24      28     70        18\nArmenia (ARM)                   5     1       2       9     12         6\nAustralasia (ANZ) [ANZ]         2     3       4       5     12         0\n\n                         Gold.1  Silver.1  Bronze.1  Total.1  \xe2\x84\x96 Games  Gold.2  \\\nAfghanistan (AFG)             0         0         0        0       13       0\nAlgeria (ALG)                 0         0         0        0       15       5\nArgentina (ARG)               0         0         0        0       41      18\nArmenia (ARM)                 0         0         0 …

Run Code Online (Sandbox Code Playgroud)

dataframe python-2.7 pandas

Ank*_*wal

2018 06-13

2
推荐指数

1
解决办法

3004
查看次数

如何设置AWS ECS + dockerfile-maven-plugin？

我正在尝试设置我的项目pom.xml和 Maven，以自动生成 Docker 映像并将其推送到我的AWS ECSsettings.xml私有 Docker 存储库的过程。

在我的中pom.xml，我添加了dockerfile-maven-plugin并配置如下：

<plugin>
    <groupId>com.spotify</groupId>
    <artifactId>dockerfile-maven-plugin</artifactId>
    <version>1.3.6</version>
    <executions>
        <execution>
            <id>default</id>
            <goals>
                <goal>build</goal>
                <goal>push</goal>
            </goals>
        </execution>
    </executions>
    <configuration>
        <finalName>myproject/server</finalName>
        <repository>137037344249.dkr.ecr.us-east-2.amazonaws.com/myproject/server</repository>
        <tag>${docker.image.tag}</tag>
        <serverId>ecs-docker</serverId>
        <useMavenSettingsForAuth>true</useMavenSettingsForAuth>
        <buildArgs>
            <VERSION>${project.version}</VERSION>
            <BUILD_NUMBER>${buildNumber}</BUILD_NUMBER>
            <WAR_FILE>${project.build.finalName}.war</WAR_FILE>
        </buildArgs>
    </configuration>
</plugin>

Run Code Online (Sandbox Code Playgroud)

根据dockerfile-maven-plugin 给出的说明，我需要为 ECS 服务器身份验证添加配置，但我不知道需要提供什么用户名/密码。我怀疑这是我的 AWS 登录用户/密码。

<servers>
    <server>
        <id>ecs-docker</id>
        <username>where_to_get_this</username>
        <password>where_to_get_this</password>
    </server>
</servers>

Run Code Online (Sandbox Code Playgroud)

另外，欢迎任何以更好的方式自动生成 Docker 映像/推送到我的存储库的建议。

amazon-web-services amazon-ecs maven docker maven-docker-plugin

Wes*_*sam

lucky-day

2
推荐指数

1
解决办法

5466
查看次数

Google Cloud Datastore Emulator不使用默认凭据

根据Google的Cloud Datastore Emulator安装说明,我能够在bash终端窗口中安装和运行模拟器而不会出现问题gcloud beta emulators datastore start --project gramm-id.

我还根据说明在另一个终端设置了环境变量,$(gcloud beta emulators datastore env-init)并验证了它们的定义.

但是,当我运行我的python脚本以使用以下代码将实体添加到本地数据存储区时:

from google.cloud import datastore

print(os.environ['DATASTORE_HOST'])          # output: http://localhost:8081
print(os.environ['DATASTORE_EMULATOR_HOST']) # output: localhost:8081


client = datastore.Client('gramm-id')
kind = 'Task'
name = 'simpleTask'

task_key = client.key(kind, name)
task = client.Enity(key=task_key)
task['description'] = 'Buy milk'
client.put(task)

Run Code Online (Sandbox Code Playgroud)

我收到错误:

Traceback (most recent call last):
  File "tools.py", line 237, in <module>
    client = datastore.Client('gramm-id')
  File "/home/.../lib/python3.6/site-packages/google/cloud/datastore/client.py", line 205, in __init__
    project=project, …

Run Code Online (Sandbox Code Playgroud)

python google-cloud-datastore google-cloud-platform

Wes*_*sam

lucky-day

2
推荐指数

1
解决办法

783
查看次数