小编use*_*988的帖子

使用LINQ占据前100名和后100名？

我想做这样的事情(如下),但不确定是否有正式/优化语法这样做？

.Orderby(i => i.Value1)
.Take("Bottom 100 & Top 100")
.Orderby(i => i.Value2);

Run Code Online (Sandbox Code Playgroud)

基本上,我想按一个变量排序,然后取前100和下100,然后用另一个变量对这些结果进行排序.

有什么建议？

c# linq

use*_*988

2014 08-03

21
推荐指数

3
解决办法

2万
查看次数

在apply函数pandas python中包含组名

是否需要指定groupby调用以在apply lambda函数中使用组名.

例如,如果我遍历组,我可以通过以下元组分解获取组密钥:

for group_name, subdf in temp_dataframe.groupby(level=0, axis=0):
    print group_name

Run Code Online (Sandbox Code Playgroud)

是否需要在apply函数中获取组名,例如:

temp_dataframe.groupby(level=0,axis=0).apply(lambda group_name, subdf: foo(group_name, subdf)

Run Code Online (Sandbox Code Playgroud)

如何将组名作为apply lambda函数的参数？

谢谢!

python group-by pandas

use*_*988

lucky-day

14
推荐指数

2
解决办法

4131
查看次数

并行化pandas pyodbc SQL数据库调用

我目前正在通过pandas.io.sql.read_sql()命令将数据查询到数据帧中.我希望并行调用类似于这些人所倡导的调用:(使用Python进行令人尴尬的并行数据库调用(PyData Paris 2015))

像(很一般)的东西:

pools = [ThreadedConnectionPool(1,20,dsn=d) for d in dsns]
connections = [pool.getconn() for pool in pools]
parallel_connection = ParallelConnection(connections)
pandas_cursor = parallel_connection.cursor()
pandas_cursor.execute(my_query)

Run Code Online (Sandbox Code Playgroud)

有可能吗？

python sql multithreading pyodbc pandas

use*_*988

2015 09-04

12
推荐指数

1
解决办法

2114
查看次数

在bokeh python 2.7中绘制图形on_click数据表行选择

我想从以下代码中,当用户点击数据表中的一行然后在回调事件时,我想绘制有关日期的其他数据.

 from datetime import date
 from random import randint 
 from bokeh.models import ColumnDataSource
 from bokeh.models.widgets
 import DataTable, DateFormatter, TableColumn
 from bokeh.io import output_file, show, vform

 output_file("data_table.html")

 data = dict(
         dates=[date(2014, 3, i+1) for i in range(10)],
         downloads=[randint(0, 100) for i in range(10)],
     )
 source = ColumnDataSource(data)

 columns = [
         TableColumn(field="dates", title="Date", formatter=DateFormatter()),
         TableColumn(field="downloads", title="Downloads"),
     ] 

 data_table = DataTable(source=source, columns=columns, width=400, height=280)

 show(vform(data_table))

Run Code Online (Sandbox Code Playgroud)

基本上,当我点击data_table中的一行时,我想显示对应于第一列名称的图(在这种情况下为日期)

我对bokeh很新,所以我不太明白事件监听器在数据表上的on_click上的位置.

任何帮助将不胜感激..

plot python-2.7 bokeh

use*_*988

2016 09-19

9
推荐指数

1
解决办法

1297
查看次数

Matlab:Kmeans每次给出不同的结果

我在matlab上使用400x1000矩阵运行kmeans,出于某种原因,每当我运行算法时,我得到的结果都不同.下面是一个代码示例:

[idx, ~, ~, ~] = kmeans(factor_matrix, 10, 'dist','sqeuclidean','replicates',20);

Run Code Online (Sandbox Code Playgroud)

出于某种原因,每次运行此代码我都会得到不同的结果？有任何想法吗？

我用它来识别多重共线性问题.

谢谢您的帮助!

matlab k-means feature-selection

use*_*988

lucky-day

8
推荐指数

2
解决办法

7960
查看次数

FSharp.Data.TypeProviders SQLDataConnection

我曾多次使用FSharp.Data.TypeProvider,但这是我第一次遇到这个bug.我能够连接到SQL数据库没有任何问题,也运行查询,但当我尝试使用任何Seq.函数(如|> Seq.toArray),我得到一个超时过期错误.

type dbSchema = SqlDataConnection<DBString, Views = false, Functions = false, StoredProcedures = false>
let db = dbSchema.GetDataContext()

Run Code Online (Sandbox Code Playgroud)

type dbSchema =
  class
    static member GetDataContext : unit -> edbSchema.ServiceTypes.SimpleDataContextTypes.dbTableOutput
     + 1 overload
    nested type ServiceTypes
  end

Run Code Online (Sandbox Code Playgroud)

然后我运行一个简单的查询:

let query1 = 
  let q = query { for a in db.Products do
                  select (a.Date,a.PId, a.Tax)} 
  q |> Seq.map (fun (a,b,c) -> (a,b,c))

Run Code Online (Sandbox Code Playgroud)

val query1: seq<DateTime * Nullable<int> * float>

Run Code Online (Sandbox Code Playgroud)

现在如果我尝试运行一些简单的东西,例如:

query1 |> Seq.head

Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

System.Data.SqlClient.SqlException (0x80131904): Timeout expired.  The …

Run Code Online (Sandbox Code Playgroud)

f# f#-interactive type-providers f#-3.0

use*_*988

2014 12-03

8
推荐指数

1
解决办法

619
查看次数

pandas.concat:无法处理非唯一的多索引!熊猫Python

我试图使用以下代码连接100个具有2个日期时间索引的数据帧:

concat_df = pd.concat([df_dict[c] for c in df_dict], axis = 1)

Run Code Online (Sandbox Code Playgroud)

但是其中一个数据帧(我假设它是一个但可能更多)导致发生以下异常:

Exception: cannot handle a non-unique multi-index!

Run Code Online (Sandbox Code Playgroud)

有什么想法吗？

它是指第一个索引还是第二个索引？

python datetime time-series pandas

use*_*988

2015 08-13

7
推荐指数

1
解决办法

7986
查看次数

只有SQL Server 2014中的分组后的不同值

以下是数据示例:

 ID     Value   NumPeriod 
 ------------------------     
 1681642    596.8   2 
 1681642    596.8   3 
 1681663    445.4   2
 1681663    445.4   3 
 1681688    461.9   3 
 1681707    282.2   3 
 1681724    407.1   3
 1681743    467     2 
 1681743    467     3 
 1681767    502     3

Run Code Online (Sandbox Code Playgroud)

我想按[ID]进行分组,只取每组中[Value]的不同值,并根据[NumPeriod]取"first"不同的[Value].所以结果看起来像这样:

 ID     Value   NumPeriod 
 -------------------------     
 1681642    596.8   2 
 1681663    445.4   2
 1681688    461.9   3 
 1681707    282.2   3 
 1681724    407.1   3
 1681743    467     2 
 1681767    502     3

Run Code Online (Sandbox Code Playgroud)

所以我虽然这样的东西会起作用,但没有运气:

select 
    ID, distinct(Value), NumPeriod
from 
    MyTable
group by 
    ID, Value, NumPeriod
order by 
    ID, NumPeriod

Run Code Online (Sandbox Code Playgroud)

任何帮助,将不胜感激.谢谢!

sql sql-server group-by distinct sql-server-2014

use*_*988

2015 06-15

2
推荐指数

1
解决办法

473
查看次数

适用于 Linux/Ubuntu 的类似记事本的 GUI 文本编辑器（通过 SSH 连接到 Ubuntu Server 14.04 LTS AWS 实例）

我对 Linux/Ubuntu bash 命令行不太熟悉。我目前正在（使用 ConEmu）连接到 AWS 实例（Ubuntu Server 14.04 LTS）以设置 Jupyter 笔记本服务器。但是，在文档的一部分中需要使用 vim 编辑器编辑文件。Vim 似乎现在学习起来很混乱，我只需要编辑几行。

linux中是否有类似于windows命令行的东西：