小编bla*_*hop的帖子

MongoJS限制和跳过

我需要使用limit和skip来从mongo获取一些记录.

我正在使用带有NodeJS的MongoJS但是下面给出的不起作用.

以下是一个例子:

db.users.find(function(err,doc{
  console.log(doc);
})).skip(2).limit(2);

Run Code Online (Sandbox Code Playgroud)

我也试过类似的东西:

db.users.find({ skip:0, limit: 5 }, function(err, results) { 
  console.log(results);
});

Run Code Online (Sandbox Code Playgroud)

我是JS/NodeJS/MongoJS的新手,请让我知道如何正确使用上面的代码.

node.js mongojs

Viv*_*day

2015 04-24

2
推荐指数

1
解决办法

1287
查看次数

zend框架2 - 在两个不同的模块中使用相同的路由名称的问题

我试图为2个不同的模块使用相同的路由名称,是否可能？

模块用户:

 /*Module.config.php*/

 'dashboard' => array(
                'type'    => 'segment',
                'options' => array(
                    'route'    => '/dashboard',
                    'constraints' => array(
                        'action' => '[a-zA-Z][a-zA-Z0-9_-]*',
                    ),
                    'defaults' => array(
                        'controller' => 'Users\Controller\Users',
                        'action'     => 'dashboard',
                    ),
                ),
 ),

Run Code Online (Sandbox Code Playgroud)

模块管理员:

/*Module.config.php*/ 

'dashboard' => array(
                'type'    => 'segment',
                'options' => array(
                    'route'    => '/dashboard',
                    'constraints' => array(
                        'action' => '[a-zA-Z][a-zA-Z0-9_-]*',
                    ),
                    'defaults' => array(
                        'controller' => 'Admin\Controller\Admin',
                        'action'     => 'dashboard',
                    ),
                ),
  ),

Run Code Online (Sandbox Code Playgroud)

虽然我正在为仪表板创建2个不同的模块,但我只加载任何一个动作.

我怎样才能做到这一点？

php zend-route zend-router zend-framework2

mar*_*kle

2015 04-08

1
推荐指数

1
解决办法

561
查看次数

如何在TableViewerColumn中使用CheckBoxTableCell

我无法找到任何用于CheckBoxTableCella的示例,TableViewerColumn如果有人可以提供示例实现,我将非常感激.

我已经有一个显示一些字符串值的工作模型,但我无法将一个布尔值表示为复选框.

甚至可以在TableViewerColumn中显示除String之外的任何其他内容吗？

java jface tableviewer

Mar*_*kus

2015 04-20

1
推荐指数

1
解决办法

1062
查看次数

Zf2设置新的配置值

我正在寻找在运行时期间用新的配置值覆盖现有配置值的可能性.

所以...... 这样会很好:

$this->serviceLocator->set('Config', $this->config);

Run Code Online (Sandbox Code Playgroud)

有没有办法做到这一点？

php zend-config zend-framework2

use*_*010

2015 05-05

1
推荐指数

1
解决办法

884
查看次数

AWS 粘合作业将字符串映射到日期和时间格式，同时从 csv 转换为镶木地板

在从 csv 转换为 parquet 时，使用 AWS 胶水 ETL 作业将 csv 中的映射字段作为字符串读取为日期和时间类型。这是实际的 csv 文件

映射和转换后，日期字段为空，时间与今天的日期连接

如何使用正确的日期和时间格式进行转换？

parquet pyspark amazon-athena aws-glue

Kav*_*ree

2021 03-29

1
推荐指数

1
解决办法

1万
查看次数

PySpark 如何迭代 Dataframe 列并更改数据类型？

迭代 Spark Dataframe（使用 Pyspark）并找到数据类型Decimal(38,10)-> 将其更改为 Bigint（并将所有内容重新保存到同一数据帧）的最佳方法是什么？

我有一个用于更改数据类型的部分 - 例如：

df = df.withColumn("COLUMN_X", df["COLUMN_X"].cast(IntegerType()))

Run Code Online (Sandbox Code Playgroud)

但试图找到并与迭代集成..

谢谢。

python dataframe apache-spark apache-spark-sql pyspark

Joe*_*Joe

2021 02-20

1
推荐指数

1
解决办法

8912
查看次数

错误未找到 MarkupSafe==1.0 的匹配发行版

使用命令后尝试在新创建的环境中安装库

pip install -r requirements.txt

Run Code Online (Sandbox Code Playgroud)

并得到一个错误：

ERROR: Command errored out with exit status 1:
     command: 'C:\Users\user\anaconda3\envs\mynewflaskenv\python.exe' -c 'import io, os, sys, setuptools, tokenize; sys.argv[0] = '"'"'C:\\Users\\user\\AppData\\Local\\Temp\\pip-install-bhlep5x0\\markupsafe_32ada0e4f7c949d6829afd169418e437\\setup.py'"'"'; __file__='"'"'C:\\Users\\user\\AppData\\Local\\Temp\\pip-install-bhlep5x0\\markupsafe_32ada0e4f7c949d6829afd169418e437\\setup.py'"'"';f = getattr(tokenize, '"'"'open'"'"', open)(__file__) if os.path.exists(__file__) else io.StringIO('"'"'from setuptools import setup; setup()'"'"');code = f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base 'C:\Users\user\AppData\Local\Temp\pip-pip-egg-info-ud9uf7zf'
         cwd: C:\Users\user\AppData\Local\Temp\pip-install-bhlep5x0\markupsafe_32ada0e4f7c949d6829afd169418e437\
    Complete output (5 lines):
    Traceback (most recent call last):
      File "<string>", line 1, in <module>
      File "C:\Users\user\AppData\Local\Temp\pip-install-bhlep5x0\markupsafe_32ada0e4f7c949d6829afd169418e437\setup.py", line 6, in <module>
        from setuptools import setup, Extension, Feature
    ImportError: cannot import name …

Run Code Online (Sandbox Code Playgroud)

python pip

Dod*_*hys

2021 12-28

1
推荐指数

1
解决办法

6837
查看次数

Pyspark：滚动窗口中的聚合模式（最常见）值

我有一个如下所示的数据框。我想在每个组内进行分组device和排序start_time。然后，对于组中的每一行，从其前面 3 行（包括其自身）的窗口中获取最常出现的站点。

columns = ['device', 'start_time', 'station']
data = [("Python", 1, "station_1"), ("Python", 2, "station_2"), ("Python", 3, "station_1"), ("Python", 4, "station_2"), ("Python", 5, "station_2"), ("Python", 6, None)]


test_df = spark.createDataFrame(data).toDF(*columns)
rolling_w = Window.partitionBy('device').orderBy('start_time').rowsBetween(-2, 0)

Run Code Online (Sandbox Code Playgroud)

期望的输出：

columns = ['device', 'start_time', 'station']
data = [("Python", 1, "station_1"), ("Python", 2, "station_2"), ("Python", 3, "station_1"), ("Python", 4, "station_2"), ("Python", 5, "station_2"), ("Python", 6, None)]


test_df = spark.createDataFrame(data).toDF(*columns)
rolling_w = Window.partitionBy('device').orderBy('start_time').rowsBetween(-2, 0)

Run Code Online (Sandbox Code Playgroud)

由于 Pyspark 没有mode()函数，我知道如何获取静态中最常见的值，groupby如下所示， …

group-by apache-spark apache-spark-sql rolling-computation pyspark

Car*_*hen

2022 01-14

1
推荐指数

1
解决办法

2657
查看次数

pyspark加入多个条件并删除两个重复列

我是 pandas 的 pyspark 新手。

当我这样做时，在一个条件下加入并删除重复项似乎效果很好：

df1.join(df2, df1.col1 == df2.col1, how="left").drop(df2.col1)

Run Code Online (Sandbox Code Playgroud)

但是，如果我想加入两列条件并删除加入的 df bc 的两列，它是重复的，该怎么办。

我试过了：

df1.join(df2, [df1.col1 == df2.col1, df1.col2 == df2.col2, how="left").drop(df2.col1, df2.col2)

Run Code Online (Sandbox Code Playgroud)

python apache-spark apache-spark-sql pyspark

lmb*_*loo

2022 01-14

1
推荐指数

1
解决办法

1461
查看次数

AWS Glue (Spark) 非常慢

我继承了一些在 AWS Glue 上运行速度极其缓慢的代码。

在作业中，它创建了许多动态框架，然后使用spark.sql. 从 MySQL 和 Postgres 数据库读取表，然后使用 Glue 将它们连接在一起，最终将另一个表写回 Postgres。

示例（注意 dbs 等已被重命名和简化，因为我无法直接粘贴实际代码）

jobName = args['JOB_NAME']
sc = SparkContext()
glueContext = GlueContext(sc)
spark = glueContext.spark_session
job = Job(glueContext)
job.init(jobName, args)
    
# MySQL
glueContext.create_dynamic_frame.from_catalog(database = "db1", table_name = "trans").toDF().createOrReplaceTempView("trans")
glueContext.create_dynamic_frame.from_catalog(database = "db1", table_name = "types").toDF().createOrReplaceTempView("types")
glueContext.create_dynamic_frame.from_catalog(database = "db1", table_name = "currency").toDF().createOrReplaceTempView("currency")

# DB2 (Postgres)
glueContext.create_dynamic_frame.from_catalog(database = "db2", table_name = "watermark").toDF().createOrReplaceTempView("watermark")

# transactions
new_transactions_df = spark.sql("[SQL CODE HERE]")

# Write to DB
conf_g = glueContext.extract_jdbc_conf("My DB")
url …

Run Code Online (Sandbox Code Playgroud)

apache-spark apache-spark-sql pyspark aws-glue

Mat*_*son

2022 01-24

1
推荐指数

1
解决办法

7303
查看次数