小编use*_*791的帖子

如何使用GSON解析JSON文件

我有一个非常简单的JSON,包含产品评论,例如:

{
  "reviewerID": "A2XVJBSRI3SWDI", 
  "asin": "0000031887", 
  "reviewerName": "abigail", 
  "helpful": [0, 0], 
  "unixReviewTime": 1383523200, 
  "reviewText": "Perfect red tutu for the price. ", 
  "overall": 5.0, 
  "reviewTime": "11 4, 2013", "summary": "Nice tutu"
}
{ 
  "reviewerID": "A2G0LNLN79Q6HR", 
  "asin": "0000031887", 
  "reviewerName": "aj_18 \"Aj_18\"", 
  "helpful": [1, 1], 
  "unixReviewTime": 1337990400, 
  "reviewText": "This was a really cute", 
 "overall": 4.0, 
 "reviewTime": "05 26, 2012", 
 "summary": "Really Cute but rather short."
}
Run Code Online (Sandbox Code Playgroud)

我想用GSON将它读入我的Java应用程序.我已经建立了一个类来保存每个评论的结果:

public class Review {
    private String reviewerID;
    private String asin;
    private String reviewerName;
    private ArrayList<Integer> helpful; …
Run Code Online (Sandbox Code Playgroud)

java json gson

40
推荐指数
3
解决办法
9万
查看次数

如何将JSON数据放入CoffeeScript?

具体来说,如果我有一些json:

var myData = [ 'some info', 'some more info' ]
var myOtherData = { someInfo: 'some more info' }
Run Code Online (Sandbox Code Playgroud)

这是什么正确的CoffeeScript语法?

json coffeescript

15
推荐指数
1
解决办法
3万
查看次数

如何选择以通用标签开头的所有列

我在Spark 1.6中有一个数据框,并希望从中选择一些列.列名称如下:

colA, colB, colC, colD, colE, colF-0, colF-1, colF-2
Run Code Online (Sandbox Code Playgroud)

我知道我可以这样做来选择特定的列:

df.select("colA", "colB", "colE")
Run Code Online (Sandbox Code Playgroud)

但如何选择,一次说"colA","colB"和所有colF-*列?有没有像熊猫一样的方式?

scala apache-spark spark-dataframe

12
推荐指数
2
解决办法
1万
查看次数

如何从swingworker更新GUI,返回两个不同的值

我有一个Java应用程序,使用SwingWorker更新GUI中的标签和进度条,它很好用.但是,我想在此设置中添加一项功能.

我的摇摆工作者执行具有长度的任务n,并且它重复该任务m时间.现在我的GUI只是告诉我这个任务被重复了多少次,但是我想告诉我我们所处的任务的长度.说,n=300并且m=50,我想要像:

Task 49 is at 248 ()
Task has been repeated 48 times
Run Code Online (Sandbox Code Playgroud)

我应该在SwingWorker中修改什么?

/**
 *
 * @author digitaldust
 */
public class Model extends SwingWorker<Integer, Integer> {

    private HashMap<String, Number> GUIparams;
    private int session;
    private int ticks;

    Model(HashMap<String, Number> KSMParams) {
        GUIparams = KSMParams;
        session = (Integer)GUIparams.get("experimentsInSession");
        ticks = (Integer)GUIparams.get("howManyTicks");
    }

    /**
     * Actual simulation
     */
    @Override
    protected Integer doInBackground() throws Exception {

        int i=0;
        while(!isCancelled() && i<session){
            i++;
            int ii=0; …
Run Code Online (Sandbox Code Playgroud)

java user-interface swing swingworker

6
推荐指数
1
解决办法
4997
查看次数

计算Spark DataFrame中的非空值的数量

我有一个带有一些列的数据框,在进行分析之前,我想了解这样的数据框是多么完整,所以我想过滤数据帧并为每列计算非空值的数量,可能返回数据帧回来了.

基本上,我试图获得与此问题中表达的相同的结果,但使用Scala而不是Python ...

说你有:

val row = Row("x", "y", "z")
val df = sc.parallelize(Seq(row(0, 4, 3), row(None, 3, 4), row(None, None, 5))).toDF()
Run Code Online (Sandbox Code Playgroud)

如何汇总每列的非空数并返回具有相同列数的数据帧,只返回一行的答案?

scala apache-spark-sql

5
推荐指数
2
解决办法
9187
查看次数

创建不对称的颜色图

我创建一个颜色表,以地图的颜色在大青叶地区分布图,使用代码来自这里

from branca.colormap import linear

colormap = linear.RdBu.scale(
    df.MyValue.min(),
    df.MyValue.max())

colormap
Run Code Online (Sandbox Code Playgroud)

我的色彩图

如您所见,与0相比,最小值和最大值有偏斜,我希望将其反映在颜色图中,即,仅将<0的值映射为红色,而将所有正值的映射为蓝色。 。

有没有办法在颜色图中具有这种不对称性?我在网上没有看到很多例子。

我做的像:

colormap = colormap.to_step(index=[-200, 0, 1200])
Run Code Online (Sandbox Code Playgroud)

但这并不顺利:

在此处输入图片说明

python folium

5
推荐指数
1
解决办法
1457
查看次数

带有 svg 元素的 Scrapy LinkExtractor 作为下一步按钮

我正在使用一个 CrawlSpider,它使用链接提取递归地跟踪调用下一页的链接,例如:

rules = (Rule(LinkExtractor(
               allow=(),\
               restrict_xpaths=('//a[contains(.,"anextpage")]')),\
               callback='parse_method',\
               follow=True),
        )
Run Code Online (Sandbox Code Playgroud)

我已经应用这个策略来递归抓取不同的网站,只要 html 标签中有文本,比如<a href="somelink">sometext</a>,一切正常。

我现在正在尝试抓取一个具有

<div class="bui-pagination__item bui-pagination__next-arrow"> <a class="pagenext" href="/url.html" aria-label="Pagina successiva"> <svg class="bk-icon -iconset-navarrow_right bui-pagination__icon" height="18" role="presentation" width="18" viewBox="0 0 128 128"> <path d="M54.3 96a4 4 0 0 1-2.8-6.8L76.7 64 51.5 38.8a4 4 0 0 1 5.7-5.6L88 64 57.2 94.8a4 4 0 0 1-2.9 1.2z"></path> </svg> </a> </div>

作为“下一步”按钮而不是简单的文本,我的 LinkExtractor 规则似乎不再适用,并且蜘蛛在第一页后停止。

我试图寻找 svg 元素,但这似乎并没有触发提取:

restrict_xpaths=('//a[contains(.,name()=svg) and contains(@class,"nextpageclass")]'))
Run Code Online (Sandbox Code Playgroud)

有什么我想念的吗?

scrapy

5
推荐指数
1
解决办法
192
查看次数

什么是开发和调试NetLogo扩展的正确工作流程

我正在使用Netbeans开发NetLogo扩展,并且我希望收到关于正确流程的建议以优化我的代码......我通常在NetBeans中编写代码,然后使用此添加到我的构建中在NetBeans中编译扩展. xml(我在这里复制它,因为它可能对某人有用):

<target name="-pre-init">
    <property name="project.name" value="myextension" />
    <property name="class.manager" value="org.nlogo.extensions.myextension.MyClassManager" />
    <manifest file="manifest.mf">
        <attribute name="Manifest-Version" value="1.0" />           
        <attribute name="Extension-Name" value="${project.name}" />
        <attribute name="Class-Manager" value="${class.manager}" />
        <attribute name="NetLogo-Extension-API-Version" value="5.0" />
    </manifest>
</target>
<target name="-post-jar">
    <delete file="manifest.mf"/>
</target>
Run Code Online (Sandbox Code Playgroud)

此时,我将.jar拖到右侧文件夹中,并从终端打开NetLogo模型,以查看我的扩展是否写了一些东西/错误/无论如何......因为我不是计算机科学家,我想知道是否这是继续进行的正确方法......我知道它有效,但如果我必须看到我的代码在哪里慢或消耗内存怎么办?也许我可以使用调试器对其进行优化,但在NetBeans之外我不知道如何做到这一点......

我很欣赏专家开发人员最常用的工作流程的建议......

最好的问候,西蒙娜

java api netbeans netlogo

4
推荐指数
1
解决办法
268
查看次数

dataframe过滤器给出NullPointerException

在Spark 1.6.0中,我有一个数据框,其中包含一个包含作业描述的列,如:

Description
bartender
bartender
employee
taxi-driver
...
Run Code Online (Sandbox Code Playgroud)

我从该列检索一个唯一值列表:

val jobs = people.select("Description").distinct().rdd.map(r => r(0).asInstanceOf[String]).repartition(4)
Run Code Online (Sandbox Code Playgroud)

然后,我尝试为每个工作描述检索具有该工作的人并做一些事情,但我得到一个NullPointerException:

jobs.foreach { 
  ajob => 
   var peoplewithjob = people.filter($"Description" === ajob)
   // ... do stuff
}
Run Code Online (Sandbox Code Playgroud)

我不明白为什么会发生这种情况,因为每个工作都是从人员数据框中提取出来的,所以至少应该有一个工作...任何提示更多的欢迎!这是堆栈跟踪:

Exception in thread "main" org.apache.spark.SparkException: Job aborted due to stage failure: Task 3 in stage 4.0 failed 1 times, most recent failure: Lost task 3.0 in stage 4.0 (TID 206, localhost): java.lang.NullPointerException
at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:131)
at org.apache.spark.sql.DataFrame.org$apache$spark$sql$DataFrame$$withPlan(DataFrame.scala:2165)
at org.apache.spark.sql.DataFrame.filter(DataFrame.scala:799)
at jago.Run$$anonfun$main$1.apply(Run.scala:89)
at jago.Run$$anonfun$main$1.apply(Run.scala:82)
at scala.collection.Iterator$class.foreach(Iterator.scala:742)
at scala.collection.AbstractIterator.foreach(Iterator.scala:1194)
at org.apache.spark.rdd.RDD$$anonfun$foreach$1$$anonfun$apply$32.apply(RDD.scala:912) …
Run Code Online (Sandbox Code Playgroud)

scala nullpointerexception dataframe apache-spark apache-spark-sql

4
推荐指数
1
解决办法
3265
查看次数

如何将向量分解为R中的子向量

我有一个像这样的矢量:

A B C A B A B D D E
Run Code Online (Sandbox Code Playgroud)

我想把它分成像我所拥有的"A"的数量一样多的向量,如:

A B C
A B
A B D D E
Run Code Online (Sandbox Code Playgroud)

有没有办法完成这项任务?

r

2
推荐指数
1
解决办法
159
查看次数

如何在 NetLogo 中创建条形图,其中条形并排

我有两个列表,我想将它们绘制为侧栏:

[44.44 28.57 50 22.72 37.52]
[64.10 75 76.19 55.55 72.22]
Run Code Online (Sandbox Code Playgroud)

我希望得到如下图所示的结果,但考虑到可用的绘图原语,我不明白如何在 netlogo 中实现此目的:“直方图”在这里绝对没有用,而“绘图”需要数据来是单个值而不是列表。

在此输入图像描述

netlogo

2
推荐指数
1
解决办法
1019
查看次数

更有效的方法将值插入到mysql表中

我有一个Collection,我想将Nodes的值写入mysql表.现在我连接到数据库,创建一个语句,然后为我运行的集合中的每个节点

// open the connection then
Statement statement = connect.createStatement();
for (Node n : vertices) {
   statement.execute("INSERT INTO " + table + " (name, department) values ('" + n.getName() + "', '" + n.getOrgId() + "')");
}
// then I close the connection
Run Code Online (Sandbox Code Playgroud)

我想知道是否有更有效的方法来处理这样的任务.

java mysql

0
推荐指数
1
解决办法
51
查看次数