小编gml*_*vsv的帖子

如何在Scala和Apache Spark中连接两个DataFrame?

有两个DataFrame(Scala,Apache Spark 1.6.1)

1)比赛

         MatchID | Player1    |  Player2 
         --------------------------------
               1 | John Wayne | John Doe
               2 | Ive Fish   | San Simon
Run Code Online (Sandbox Code Playgroud)

2)个人资料

              Player     |  BirthYear 
              --------------------------------
              John Wayne | 1986
              Ive Fish   | 1990
              San Simon  | 1974
              john Doe   | 1995
Run Code Online (Sandbox Code Playgroud)

如何为两个玩家创建一个带有'BirthYear'的新DataFrame

         MatchID | Player1    |  Player2  | BYear_P1 |BYear_P2 | Diff
         -------------------------------------------------------------
               1 | John Wayne | John Doe  |   1986   | 1995    |  9  
               2 | Ive Fish   | San Simon |   1990   | …
Run Code Online (Sandbox Code Playgroud)

scala apache-spark apache-spark-sql spark-dataframe

15
推荐指数
2
解决办法
5万
查看次数

Sesame SPARQL端点只读

如何通过SPARQL端点阻止我的OpenRDF Sesame 2.6.5 RDF存储从修改(INSERT/DELETE)?

"选择"查询将通过POST请求完成.

禁止(通过Apache Tomcat配置文件,用于Sesame的WAR)以下SPARQL HTTP端点URL:

http:/ localhost:8080/openrdf-sesame/repositories/test/update ...

http:/ localhost:8080/openrdf-workbench/repositories/test/update ...?

sesame sparql endpoint

5
推荐指数
1
解决办法
1579
查看次数

如何在 CSV 文件中查找为主键候选设置的列?

我有一个 CSV 文件(未标准化,例如,最多 100 列的真实文件):

   ID, CUST_NAME, CLIENT_NAME, PAYMENT_NUM, START_DATE, END_DATE
    1,     CUST1,     CLIENT1,          10, 2018-04-01, 2018-04-02
    2,     CUST1,     CLIENT1,          10, 2018-04-01, 2018-05-30
    3,     CUST1,     CLIENT1,         101, 2018-04-02, 2018-04-03
    4,     CUST2,     CLIENT1,         102, 2018-04-02, 2018-04-03
Run Code Online (Sandbox Code Playgroud)

如何找到可以用作主键的所有可能的列集。

期望的输出:

  1) ID
  2) PAYMENT_NUM,START_DATE,END_DATE
  3) CUST_NAME, CLIENT_NAME, PAYMENT_NUM,START_DATE,END_DATE
Run Code Online (Sandbox Code Playgroud)

我可以用 Java 来做,但可能 Python/Pandas 已经提供了一个快速解决方案

python sql algorithm pandas

5
推荐指数
1
解决办法
4738
查看次数

获取WordNet的指定单词的域名

我知道WordNet有域名层次结构:例如sport-> football.

1)是否可以列出所有相关的单词,例如,"sport-> football"子域?

  Response: goalkeeper, forward, penalty, ball, field, stadium, referee and so on.
Run Code Online (Sandbox Code Playgroud)

2)获取给定单词的域名,例如"守门员"?

 Need something like [sport->football; sport->hockey] or [football;hockey] or just 'football'.
Run Code Online (Sandbox Code Playgroud)

它用于文档分类任务.

nlp semantic-web cluster-analysis wordnet document-classification

2
推荐指数
1
解决办法
2172
查看次数

如何从IBM Bluemix下载日志文件?

如何从IBM Bluemix中部署的应用程序将日志文件下载到本地计算机(Windows)?

   cf download APPNAME
Run Code Online (Sandbox Code Playgroud)

不再起作用了.

我知道我可以通过它查看

   cf ssh
Run Code Online (Sandbox Code Playgroud)

但它很大.

ssh cloud-foundry ibm-cloud

1
推荐指数
1
解决办法
1545
查看次数