小编Int*_*tor的帖子

Spark:减去两个DataFrame

在Spark版本1.2.0中,可以使用subtract2 SchemRDD秒来结束与第一个不同的内容

val onlyNewData = todaySchemaRDD.subtract(yesterdaySchemaRDD)
Run Code Online (Sandbox Code Playgroud)

onlyNewData包含todaySchemRDD不存在的行yesterdaySchemaRDD.

如何DataFrames在Spark 1.3.0版本中实现这一目标?

dataframe apache-spark rdd

42
推荐指数
4
解决办法
7万
查看次数

如何从多个线程改变共享变量,而不考虑数据竞争?

如何改变i闭包内的变量?竞争条件被认为是可以接受的。

use rayon::prelude::*;

fn main() {

    let mut i = 0;
    let mut closure = |_| {
        i = i + 1;
    };

    (0..100).into_par_iter().for_each(closure);
}
Run Code Online (Sandbox Code Playgroud)

此代码失败并显示:

error[E0525]: expected a closure that implements the `Fn` trait, but this closure only implements `FnMut`
  --> src\main.rs:6:23
   |
6  |     let mut closure = |_| {
   |                       ^^^ this closure implements `FnMut`, not `Fn`
7  |         i = i + 1;
   |         - closure is `FnMut` because it mutates the variable `i` …
Run Code Online (Sandbox Code Playgroud)

rust

11
推荐指数
2
解决办法
1206
查看次数

从Spark保存时的镶木地板错误

Spark 1.3.0中重新分区DataFrame后,在保存到Amazon S3时会出现.parquet异常.

logsForDate
    .repartition(10)
    .saveAsParquetFile(destination) // <-- Exception here
Run Code Online (Sandbox Code Playgroud)

我收到的例外是:

java.io.IOException: The file being written is in an invalid state. Probably caused by an error thrown previously. Current state: COLUMN
at parquet.hadoop.ParquetFileWriter$STATE.error(ParquetFileWriter.java:137)
at parquet.hadoop.ParquetFileWriter$STATE.startBlock(ParquetFileWriter.java:129)
at parquet.hadoop.ParquetFileWriter.startBlock(ParquetFileWriter.java:173)
at parquet.hadoop.InternalParquetRecordWriter.flushRowGroupToStore(InternalParquetRecordWriter.java:152)
at parquet.hadoop.InternalParquetRecordWriter.close(InternalParquetRecordWriter.java:112)
at parquet.hadoop.ParquetRecordWriter.close(ParquetRecordWriter.java:73)
at org.apache.spark.sql.parquet.ParquetRelation2.org$apache$spark$sql$parquet$ParquetRelation2$$writeShard$1(newParquet.scala:635)
at org.apache.spark.sql.parquet.ParquetRelation2$$anonfun$insert$2.apply(newParquet.scala:649)
at org.apache.spark.sql.parquet.ParquetRelation2$$anonfun$insert$2.apply(newParquet.scala:649)
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:61)
at org.apache.spark.scheduler.Task.run(Task.scala:64)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:203)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at java.lang.Thread.run(Thread.java:745)
Run Code Online (Sandbox Code Playgroud)

我想知道问题是什么以及如何解决.

apache-spark parquet

10
推荐指数
1
解决办法
4135
查看次数

从Eclipse切换到Netbeans

我正在尝试从Eclipse切换到Netbeans以用于我的PHP项目.一切都很好,但有一些我缺少的功能,即:

  • Open方法/函数的快捷方式,并从项目中的任何文件转到声明
  • 我目前所在类的Display类方法的快捷方式

如果上面有关键绑定,我很乐意找到它们.

谢谢

netbeans keyboard-shortcuts

7
推荐指数
1
解决办法
4615
查看次数

跨多个数据库的Sqlite视图

是否可以在附加了其他数据库的Sqlite数据库中创建VIEW(而不是临时视图)?该视图应该能够通过连接表访问所有数据库中的数据.

sqlite view

6
推荐指数
1
解决办法
3964
查看次数

Chrome 扩展程序警报未触发

我正在开发一个需要使用 chrome.alarms 的 Chrome 扩展。问题在于警报没有被触发,或者正在以非常不一致的行为触发。

该扩展是基于事件页面内的对象构建的,如Manifest v2中所建议的那样。另外,我在扩展程序中有选项卡事件,有时会唤醒事件页面

请帮助我创建一个chrome.alarm ,它实际上大约每n分钟触发一次,或者向我解释我做错了什么,或者提出替代方案。

您可以在下面找到相关的代码片段。

清单.json

{
  "manifest_version": 2,
  "browser_action": {
    "default_popup": "index.html"
  },
  "permissions": [
    "<all_urls>",
    "storage",
    "tabs",
    "alarms"
  ],
  "background": {
    "scripts": [
      "js/backend/monitor.js",
      "js/backend/bootstrap.js"
    ],
    "persistent": false
  }
}
Run Code Online (Sandbox Code Playgroud)

bootstrap.js

// Exaggerating with the validation on purpose
chrome.alarms.get('timeToSendToApi', function(alarm) {
  if (typeof alarm === 'undefined' || alarm.name !== 'timeToSendToApi') {
    chrome.alarms.create('timeToSendToApi', {periodInMinutes: 2});
  }
});
Main.monitor.start();
Run Code Online (Sandbox Code Playgroud)

监视器.js

Main.monitor = …
Run Code Online (Sandbox Code Playgroud)

javascript google-chrome google-chrome-extension javascript-objects

6
推荐指数
1
解决办法
2344
查看次数

ASP.NET中的灵活ACL

我正在构建一个应用程序,我想使用适用于各个页面的角色管理.也就是说,限制用户根据其角色访问页面.这些角色作为用户存储在数据库中.这是PHP的做事方式,我正在尝试将其移植到ASP.NET

我需要的是有人可以指出我正确的资源来完成上述任务.直到现在我还没能找到我想要的东西.

谢谢.

c# asp.net acl forms-authentication

5
推荐指数
1
解决办法
4113
查看次数

escapeshellcmd警告

在php文档页面中escapeshellcmd有一个警告:

应该在整个命令字符串上使用escapeshellcmd(),它仍然允许攻击者传递任意数量的参数.对于转义单个参数,应该使用escapeshellarg().

我从中可以理解的是:

  1. 我是否应该总是使用escapeshellcmd转义整个命令字符串,包括已经使用escpaeshellarg转义的参数?
  2. 我应该只转义不是参数的命令项(如果你问我,唯一合乎逻辑的做法)?
  3. 我是否应该忽略这一可疑警告,这些警告会对这两个功能如何相互补充产生更多混淆?

谢谢你,Cosmin

php security

5
推荐指数
1
解决办法
5079
查看次数

在Spark ML中,为什么在具有百万个不同值的列上拟合StringIndexer会产生OOM错误?

我正在尝试在具有约15.000.000唯一字符串值的列上使用Spark的StringIndexer功能转换器。无论我投入多少资源,Spark都会因内存不足异常而死在我身上。

from pyspark.ml.feature import StringIndexer

data = spark.read.parquet("s3://example/data-raw").select("user", "count")

user_indexer = StringIndexer(inputCol="user", outputCol="user_idx")

indexer_model = user_indexer.fit(data) # This never finishes

indexer_model \
    .transform(data) \
    .write.parquet("s3://example/data-indexed")
Run Code Online (Sandbox Code Playgroud)

驱动程序上会生成一个错误文件,其开头如下所示:

#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 268435456 bytes for committing reserved memory.
# Possible reasons:
#   The system is out of physical RAM or swap space
#   In 32 bit mode, the process size limit was hit …
Run Code Online (Sandbox Code Playgroud)

apache-spark pyspark apache-spark-ml

5
推荐指数
1
解决办法
345
查看次数

无法创建简单的类

我想在我的项目中创建一个非常简单的CUser类,但显然我做错了.这是代码:

using System;
using System.Collections;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using MySql.Data.MySqlClient;

namespace admin.NET.lib {
    public class CUser {
        protected MySqlConnection conn;

        public void CUser() {
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

这段简单的代码让我:

'CUser': member names cannot be the same as their enclosing type
Run Code Online (Sandbox Code Playgroud)

任何人都可以给我一个提示,我必须修改它来工作.我之前看到这个问题出现了问题,但我无法使解决方案适应我的代码.

谢谢

c# constructor

1
推荐指数
1
解决办法
112
查看次数

检查网址有效性

有人可以确认该-checkResourceIsReachableAndReturnError:方法NSURL是否按预期工作.我已经尝试将它用于已知的URL并且它总是返回NO.我正在使用XCode的iPhone模拟器4.1.谢谢.

iphone nsurl

1
推荐指数
1
解决办法
5858
查看次数

尝试读取或写入受保护的内存

我有一个示例ASP.NET MVC 3 Web应用程序,遵循Jonathan McCracken的Test-Drive Asp.NET MVC(顺便说一句好书),我偶然发现了一个问题.请注意,我使用的是MVCContrib,Rhino和NUnit.

    [Test]
    public void ShouldSetLoggedInUserToViewBag() {
        var todoController = new TodoController();
        var builder = new TestControllerBuilder();
        builder.InitializeController(todoController);

        builder.HttpContext.User = new GenericPrincipal(new GenericIdentity("John Doe"), null);

        Assert.That(todoController.Index().AssertViewRendered().ViewData["UserName"], Is.EqualTo("John Doe"));
    }
Run Code Online (Sandbox Code Playgroud)

上面的代码总是抛出这个错误:

System.AccessViolationException:尝试读取或写入受保护的内存.这通常表明其他内存已损坏.

控制器操作代码如下:

[HttpGet]
    public ActionResult Index() {
        ViewData.Model = Todo.ThingsToBeDone;
        ViewBag.UserName = HttpContext.User.Identity.Name;

        return View();
    }
Run Code Online (Sandbox Code Playgroud)

根据我的想法,应用程序似乎崩溃,因为控制器操作中的两个分配.但是,我看不出有多么错误!?

任何人都可以帮我找出解决这个问题的方法.

谢谢.

编辑1

我做了一些实验来看看问题是什么.删除ViewData,Model分配时,问题会超越Expected result to be of type ViewResult. It is actually of type ViewResult..该ViewData分配是如此基本,我不认为是这样,我认为这个问题有什么问题或者犀牛或MVCcontrib结合MVC 3.

我之前为同一控制器操作编写了以下测试:

        [Test]
    public void ShouldDisplayAListOfTodoItems() …
Run Code Online (Sandbox Code Playgroud)

nunit rhino mvccontrib-testhelper c#-4.0 asp.net-mvc-3

1
推荐指数
1
解决办法
3119
查看次数

绘制几个极坐标图的散点图

我有一个包含五个变量和一个因变量的数据集。一个例子是:

v1  v2  v3  v4  s     a
1.0 0.6 0.8 0.2 56890 98.67
0.8 0.3 1.0 0.5 94948 98.00
1.0 0.8 0.1 0.3 78483 97.13
Run Code Online (Sandbox Code Playgroud)

我想直观地表示所有五个变量和因变量之间的关系。为此,我正在考虑结合两种类型的图:

  • s和之间的散点图a
  • v1v2v3的极坐标图v4

所以本质上我想为数据集中的每个数据点显示一个小极坐标图。像这样的东西:

在此输入图像描述

极坐标图示例如下:

import numpy as np
import matplotlib.pyplot as plt

theta = np.linspace(0.0, 2 * np.pi, 4, endpoint=False)
radii = [90, 90, 90, 90]
width = np.pi / 4 * np.array([1.0, 0.7, 0.6, 0.2])

ax = plt.subplot(111, projection='polar')
bars = ax.bar(theta, radii, width=width, bottom=0.0) …
Run Code Online (Sandbox Code Playgroud)

python matplotlib

1
推荐指数
1
解决办法
917
查看次数