小编Nip*_*pun的帖子

"线程中的异常"main"org.apache.spark.SparkException:作业因阶段失败而中止:阶段0.0中的任务0失败4次,最近失败:阶段0.0中丢失任务0.3(TID 7,172.28.0.162): java.io.IOException:无法在{172.28.0.164}打开与Cassandra的本机连接:9042 at com.datastax.spark.connector.cql.CassandraConnector $ .com $ datastax $ spark $ connector $ cql $ CassandraConnector $$ createSession( CassandraConnector.scala:155)"

它有时也会给我这个例外以及上面的例外:

引起:com.datastax.driver.core.exceptions.NoHostAvailableException:所有尝试查询的主机都失败了(尝试:/172.28.0.164:9042(com.datastax.driver.core.TransportException:[/ 172.28.0.164: 9042]连接已关闭))

cassandra apache-spark

Nip*_*pun

2015 07-20

8
推荐指数

1
解决办法

1223
查看次数

spark-redshift需要花费大量时间才能写入redshift

我正在设置带有kinesis和redshift的火花流光.我每隔10秒就从kinesis读取数据,处理它并使用spark-redshift lib将其写入redshift.

问题是它只花了很多时间才能写出300行.

这就是它在控制台中显示的内容

[Stage 56:====================================================> (193 + 1) / 200]

Run Code Online (Sandbox Code Playgroud)

看着我的日志df.write.format正在这样做.

我在带有4 gb ram和2核心amazon EC2的机器上安装了火花,并使用--master local [*]模式运行.

这是我创建流的方式

kinesisStream = KinesisUtils.createStream(ssc, APPLICATION_NAME, STREAM_NAME, ENDPOINT, REGION_NAME, INITIAL_POS, CHECKPOINT_INTERVAL, awsAccessKeyId =AWSACCESSID, awsSecretKey=AWSSECRETKEY, storageLevel=STORAGE_LEVEL)    
CHECKPOINT_INTERVAL = 60
storageLevel = memory

kinesisStream.foreachRDD(writeTotable)
def WriteToTable(df, type):
    if type in REDSHIFT_PAGEVIEW_TBL:
        df = df.groupby([COL_STARTTIME, COL_ENDTIME, COL_CUSTOMERID, COL_PROJECTID, COL_FONTTYPE, COL_DOMAINNAME, COL_USERAGENT]).count()
        df = df.withColumnRenamed('count', COL_PAGEVIEWCOUNT)

        # Write back to a table

        url = ("jdbc:redshift://" + REDSHIFT_HOSTNAME + ":" + REDSHIFT_PORT + "/" +   REDSHIFT_DATABASE + "?user=" …

Run Code Online (Sandbox Code Playgroud)

amazon-redshift apache-spark spark-streaming

Nip*_*pun

lucky-day

8
推荐指数

1
解决办法

1918
查看次数

如何存档和清除Cassandra数据

我有一个带有多个数据中心的cassandra集群.我想每月归档数据并清除该数据.有许多备份和恢复的文章,但没有提到它在cassandra集群中存档数据.

有人可以告诉我如何每月在cassandra集群中存档我的数据并清除数据.

cassandra cassandra-2.0

Nip*_*pun

2015 09-22

7
推荐指数

1
解决办法

2232
查看次数

使用zeppelin在csv中导出数据

我需要从zeppelin中的%sql解释器导出csv格式的数据.我怎么能这样做？我需要添加一个按钮并点击它,它应该导出csv中的数据,如客户端的sql解释器中的zeppelin中的图形所示.

apache-zeppelin

Nip*_*pun

lucky-day

7
推荐指数

1
解决办法

7603
查看次数

facebook登录按钮sdk在c#崩溃的应用程序中

我需要一个小帮助,我已经为Windows Phone 8创建了一个小的physioit应用程序.

我在我的xaml文件中添加了facebookclient loginbutton.现在,当我的手机中没有数据连接,当我运行代码时,它会让我TargetInvocationException和我的应用程序崩溃.

这是我得到的例外 -

innerException 
{Facebook.WebExceptionWrapper: The remote server returned an error: NotFound. --->
      System.Net.WebException: The remote server returned an error: NotFound.
 at System.Net.Browser.ClientHttpWebRequest.InternalEndGetResponse(IAsyncResult asyncResult)
 at System.Net.Browser.ClientHttpWebRequest.<>c__DisplayClasse.<EndGetResponse>b__d(Object sendState)
 at System.Net.Browser.AsyncHelper.<>c__DisplayClass1.<BeginOnUI>b__0(Object sendState)
--- End of inner exception stack trace ---}           

System.Exception     {Facebook.WebExceptionWrapper}

Run Code Online (Sandbox Code Playgroud)

我怎么能抓住这个例外？

我正在使用facebook sdk创建loginbutton

这是代码片段

<facebookControls:LoginButton
    x:Name="loginButton"
    Grid.Row="2"
    Margin="5"
    HorizontalAlignment="Right"
    FetchUserInfo="True"      
    ApplicationId="xxxxxx" 
    SessionStateChanged="OnFacebookSessionStateChanged"
    UserInfoChanged="OnFacebookUserInfoChanged"
    AuthenticationError="LoginButtonAuthenticationError" />

Run Code Online (Sandbox Code Playgroud)

你能帮帮我吗？

windows-phone-8 facebook-sdk-3.0

Nip*_*pun

2013 10-25

5
推荐指数

1
解决办法

450
查看次数

在cassandra中的地图中插入多个类型

是否可以在cassandra map中输入不同的数据类型,就像我有一个像这样的表

(id int, value map<text,text>)

Run Code Online (Sandbox Code Playgroud)

现在我想在这个表中插入值

(1,{'test':'test1'})
(2,{'a':1})
(3,{'c':2})

Run Code Online (Sandbox Code Playgroud)

cassandra cql3

Nip*_*pun

2015 08-04

5
推荐指数

1
解决办法

3372
查看次数

bigQuery 不支持毫秒时间戳

我的 csv 文件中有一个时间戳值为“1522865628160”。当我在 bigQuery 中加载此字段类型为时间戳的数据时，它将时间戳保存为“1522865628160000”。所以当我查询时

select * from <tablename> limit 1

Run Code Online (Sandbox Code Playgroud)

它给了我错误

无法返回相对于 Unix 纪元 1522865628160000000 微秒的无效时间戳值。有效时间戳值范围为 [0001-01-1 00:00:00, 9999-12-31 23:59:59.999999]；写入字段时间戳时出错”

请帮忙

google-bigquery

Nip*_*pun

2018 05-11

4
推荐指数

1
解决办法

4260
查看次数

使用卷积网络运行时会产生 nan 损失的张量流

我试图在 tensorflow http://ufldl.stanford.edu/housenumbers/中为门牌号图像创建一个卷积神经网络

当我运行我的代码时，我在第一步中的成本是 nan 。这是我在其中放入代码的 github 的链接 https://github.com/ibnipun10/TensorFlow/blob/master/convhouseNumbers.ipynb

请让我知道我哪里出错了

tensorflow

Nip*_*pun

lucky-day

3
推荐指数

1
解决办法

1090
查看次数

标签统计

apache-spark ×3

cassandra ×3

amazon-redshift ×1

apache-spark-sql ×1

apache-zeppelin ×1

c ×1

c++ ×1

cassandra-2.0 ×1

circular-dependency ×1

cql3 ×1

dataframe ×1

facebook-sdk-3.0 ×1

google-bigquery ×1

spark-streaming ×1

sql ×1

tensorflow ×1

windows-phone-8 ×1

标签 统计

小编Nip_pun的帖子

标签统计