小编use*_*890的帖子

如何按一列分组并对另一列的值进行排序？

这是我的数据帧

import pandas as pd
df = pd.DataFrame({'A': ['one', 'one', 'two', 'two', 'one'] ,
                   'B': ['Ar', 'Br', 'Cr', 'Ar','Ar'] ,
                   'C': ['12/15/2011', '11/11/2001', '08/30/2015', '07/3/1999','03/03/2000' ],
                      'D':[1,7,3,4,5]})

Run Code Online (Sandbox Code Playgroud)

我的目标是按列A进行分组,并按列对分组结果进行排序B.

这是我想出的:

sort_group = df.sort_values('B').groupby('A')

Run Code Online (Sandbox Code Playgroud)

我希望分组操作不会扭曲顺序,但它不起作用,也不返回数据帧,而是返回groupby对象

<pandas.core.groupby.DataFrameGroupBy object at 0x0000000008B190B8>

Run Code Online (Sandbox Code Playgroud)

有什么建议？

python sorting group-by pandas

use*_*890

2016 11-18

3
推荐指数

1
解决办法

6869
查看次数

删除/删除每组 R 中的最后/第一行

这是我的数据框：

categ <- c('a','a','a','b','b')
value <- c(1,2,5,4,5)
df <- data.frame(categ, value)

Run Code Online (Sandbox Code Playgroud)

我想按categ列分组并删除每组中的第一个/最后一个元素。理想情况下，我想创建一个列，指示每个组中的第一个/最后一个元素。这是我尝试过的，但没有奏效：

library('plyr')
ddply(df, .(categ), function(x) x[-nrow(x)])

Run Code Online (Sandbox Code Playgroud)

PS 这可能是重复的问题，但我是 R 的新手，R 非常神秘，所以我无法立即移植解决方案。

group-by r

use*_*890

2019 06-27

3
推荐指数

2
解决办法

3384
查看次数

R 中的 3 个字母月份和 2 位数字年份格式

我正在尝试将以下格式转换为日期：

as.Date('Mar.17', format = '%b.%y')

Run Code Online (Sandbox Code Playgroud)

但它返回 NA。

我缺少什么？

更新，我期待 2017 年 3 月，而不是 2018 年

format r date

use*_*890

2018 04-21

3
推荐指数

1
解决办法

4989
查看次数

如何在numpy中创建反对角恒等矩阵（对角线从左向右翻转）

如何在numpy中创建反对角矩阵？我当然可以手动完成，但是很好奇是否有功能。

我正在寻找一个矩阵，矩阵从左下角到右上角，其他地方为零。

python numpy matrix diagonal

use*_*890

2018 05-23

3
推荐指数

1
解决办法

1337
查看次数

Google Colaboratory 上带有 GPU 的 XGBoost

我正在尝试在 Google Colaboratory 上使用带有 GPU 的 XGBoost。这是我的笔记本：

import numpy as np
import os
import xgboost as xgb

train_X = np.random.rand(100,5)
train_Y = np.random.choice(2, 100)

test_X = np.random.rand(10,5)
test_Y = np.random.choice(2, 10)

xg_train = xgb.DMatrix(train_X, label=train_Y)
xg_test = xgb.DMatrix(test_X, label=test_Y)

param = {}
# use softmax multi-class classification
param['objective'] = 'multi:softmax'
# scale weight of positive examples
param['eta'] = 0.1
param['max_depth'] = 6
param['silent'] = 1
param['nthread'] = 4
param['num_class'] = 2

param['gpu_id'] = 0
param['max_bin'] = 16
param['tree_method'] = 'gpu_hist' …

Run Code Online (Sandbox Code Playgroud)

python gpu xgboost google-colaboratory

use*_*890

lucky-day

3
推荐指数

1
解决办法

5982
查看次数

sklearn 中的 Tfidfvectorizer - 如何获取矩阵

我想从 sklearn 的 Tfidfvectorizer 对象中获取矩阵。这是我的代码：

from sklearn.feature_extraction.text import TfidfVectorizer
text = ["The quick brown fox jumped over the lazy dog.",
        "The dog.",
        "The fox"]

vectorizer = TfidfVectorizer()
vectorizer.fit_transform(text)

Run Code Online (Sandbox Code Playgroud)

这是我尝试并返回错误的方法：

vectorizer.toarray()

Run Code Online (Sandbox Code Playgroud)

--------------------------------------------------------------------------- 
AttributeError                            Traceback (most recent call last) <ipython-input-117-76146e626284> in <module>()   
----> 1 vectorizer.toarray()

AttributeError: 'TfidfVectorizer' object has no attribute 'toarray'

Run Code Online (Sandbox Code Playgroud)

另一种尝试

vectorizer.todense()

Run Code Online (Sandbox Code Playgroud)

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-118-6386ee121184> in <module>()
----> 1 vectorizer.todense()

AttributeError: 'TfidfVectorizer' object has no attribute 'todense'

Run Code Online (Sandbox Code Playgroud)

python tf-idf scikit-learn tfidfvectorizer

use*_*890

2019 01-09

3
推荐指数

1
解决办法

7449
查看次数

如何在C#中使用List <string []>

以下代码不想编译.我收到一条错误消息:

'System.Collections.Generic.List.Add(string [])的最佳重载方法匹配有一些无效的参数

但我看不出有什么问题.有什么建议？

public static List<string[]> ReadFromDelimitedFile (string Path)
    {
        int i=0;
        List<string[]> AllContracts = new List<string[]>();
        using (TextFieldParser parser = new TextFieldParser(Path))
        {
            parser.Delimiters = new string[] { "\t" };
            while (true)
            {
                AllContracts.Add(i)= parser.ReadFields();
                if (AllContracts.Add(i) == null)
                {
                    break;
                }
                i++;

            }
        }

        return AllContracts;
    }

Run Code Online (Sandbox Code Playgroud)

c# list

use*_*890

2012 09-27

2
推荐指数

2
解决办法

1740
查看次数

了解 dask 中的 map_partitions 的作用

我试图理解map_partitionsin 的dask作用。这是我的例子：

import dask.dataframe as dd
import pandas as pd
from dask.multiprocessing import get
import random

df = pd.DataFrame({'col_1':random.sample(range(10000), 100), 'col_2': random.sample(range(10000), 100) })

def test_f(df):
    print(df.col_1)
    print("------------")

ddf = dd.from_pandas(df, npartitions=8)

ddf['result'] = ddf.map_partitions(test_f ).compute(get=get)

Run Code Online (Sandbox Code Playgroud)

这是输出：

0    1.0
1    1.0
Name: col_1, dtype: float64
------------

Run Code Online (Sandbox Code Playgroud)

为什么我无法完整打印我的数据框？输出是什么意思？

python parallel-processing dataframe dask

use*_*890

lucky-day

2
推荐指数

1
解决办法

2574
查看次数

循环通过R中的日期向量

这是我的例子.

my_df <- data.frame(col_1 = c(1,2), 
col_2 = c(as.Date('2018-11-11'), as.Date('2016-01-01')))
dates_list <- my_df$col_2
for(el in dates_list){
  print(el)
}

Run Code Online (Sandbox Code Playgroud)

它产生:

17846
16801

Run Code Online (Sandbox Code Playgroud)

如何输出日期呢？我可以使用显式索引来完成它,但希望有更简单的解决方案

loops r date vector

use*_*890

2019 08-30

2
推荐指数

1
解决办法

484
查看次数

renv::status() 在 seq_len(length(splat) - 1) 中返回错误：

我跑了

renv::status()

Run Code Online (Sandbox Code Playgroud)

回来了：

Error in seq_len(length(splat) - 1) : 
  argument must be coercible to non-negative integer

Run Code Online (Sandbox Code Playgroud)

我尝试traceback()并回来了：

f(n[[i]], x[[i]], ...)
7: FUN(X[[i]], ...)
6: lapply(idx, callback)
5: enumerate(fields, function(section, entries) {
       splat <- strsplit(section, "/", fixed = TRUE)[[1]]
       for (i in seq_len(length(splat) - 1)) {
           k <- splat[1:i]
           if (is.null(data[[k]])) 
               data[[k]] <<- list()
       }
       data[[splat]] <<- entries
   })
4: renv_lockfile_read(lockpath)
3: renv_status_check_missing_lockfile(project, lockpath)
2: renv_status_impl(project, libpaths, lockpath, cache)
1: renv::status()

Run Code Online (Sandbox Code Playgroud)

我从哪里开始排除故障？

PS我使用的是Windows 10和R 4.0.4

更新这里是 renv.lock 文件 …

r renv

use*_*890

2022 02-19

2
推荐指数

1
解决办法

378
查看次数