小编Fag*_*ain的帖子

XGBoost:xgb.cv调用有什么问题?

我正在尝试在Python上使用xgboost.

这是我的代码. 虽然看起来我用它是正确的方法xgb.train,xgb.cv但我仍然犯了错误.

以下适用于我:

###### XGBOOST ######

import datetime
startTime = datetime.datetime.now()

import xgboost as xgb
data_train   = np.array(traindata.drop('Category',axis=1))
labels_train = np.array(traindata['Category'].cat.codes)

data_valid   = np.array(validdata.drop('Category',axis=1))
labels_valid = np.array(validdata['Category'].astype('category').cat.codes)

weights_train = np.ones(len(labels_train))
weights_valid  = np.ones(len(labels_valid ))

dtrain = xgb.DMatrix( data_train, label=labels_train,weight = weights_train)
dvalid  = xgb.DMatrix( data_valid , label=labels_valid ,weight = weights_valid )

param = {'bst:max_depth':5, 'bst:eta':0.05, # eta [default=0.3]
         #'min_child_weight':1,'gamma':0,'subsample':1,'colsample_bytree':1,'scale_pos_weight':0, # default
         # max_delta_step:0 # default
         'min_child_weight':5,'scale_pos_weight':0, 'max_delta_step':2,
         'subsample':0.8,'colsample_bytree':0.8,
         'silent':1, 'objective':'multi:softprob' }

param['nthread'] = 4
param['eval_metric'] …
Run Code Online (Sandbox Code Playgroud)

python xgboost

8
推荐指数
1
解决办法
1877
查看次数

R中的REGEX:从字符串中提取单词

我想这是一个常见的问题,我发现了很多网页,包括一些来自SO,但我不明白如何实现它.

我是REGEX的新手,我想在R中使用它来从句子中提取前几个单词.

例如,如果我的判决是

z = "I love stack overflow it is such a cool site"
Run Code Online (Sandbox Code Playgroud)

我喜欢把我的输出作为(如果我需要前四个单词)

[1] "I love stack overflow"
Run Code Online (Sandbox Code Playgroud)

或者(如果我需要最后四个字)

[1] "such a cool site"
Run Code Online (Sandbox Code Playgroud)

当然,以下作品

paste(strsplit(z," ")[[1]][1:4],collapse=" ")
paste(strsplit(z," ")[[1]][7:10],collapse=" ")
Run Code Online (Sandbox Code Playgroud)

但我想尝试一个性能问题的正则表达式解决方案,因为我需要处理非常大的文件(也为了解它)

我看了几个链接,包括 Regex从字符串中提取前3个单词http://osherove.com/blog/2005/1/7/using-regex-to-return-the-first-n-words-in -a-string.html

所以我尝试了类似的东西

gsub("^((?:\S+\s+){2}\S+).*",z,perl=TRUE)
Error: '\S' is an unrecognized escape in character string starting ""^((?:\S"
Run Code Online (Sandbox Code Playgroud)

我尝试了其他的东西,但它通常返回我整个字符串,或空字符串.

substr的另一个问题是它返回一个列表.也许看起来[[]]操作员在处理大文件和应用东西时会慢一点(??).

看起来R中使用的语法有些不同?谢谢 !

regex string r extract

6
推荐指数
1
解决办法
8149
查看次数

在F#中使用CsvProvider

我是F#的初学者,我正在尝试使用CsvProvider并重现这里给出的例子

http://fsharp.github.io/FSharp.Data/library/CsvProvider.html

所以在F#互动中,我打字

>type Stocks = CsvProvider<"MSFT.csv">;;

type Stocks = CsvProvider<...>

> let msft = CsvProvider<"MSFT.csv">.GetSample();;

val msft : CsvProvider<...>

> msft;;
val it : CsvProvider<...> =
  FSharp.Data.Runtime.CsvFile`1[System.Tuple`1[System.String]]

    {Headers = Some [|"MSFT.csv"|];
 NumberOfColumns = 1;
 Quote = '"';
 Rows = seq [];
 Separators = ",";}

> let firstRow = msft.Rows |> Seq.head;;
System.ArgumentException: The input sequence was empty.
Parameter name: source
>    at Microsoft.FSharp.Collections.SeqModule.Head[T](IEnumerable`1 source)
   at <StartupCode$FSI_0044>.$FSI_0044.main@()
Stopped due to error
Run Code Online (Sandbox Code Playgroud)

我的理解是CsvProvider基于CSV文件创建一个类型,该文件使得以后能够以相同的格式读取该文件或不同的文件/流.我认为我没有目录问题,因为如果文件位于错误的目录中,该函数将返回错误.当创建msft时,F#表示NumberOfColumns = 1,但这显然是错误的.

这也不起作用

> let msft = Stocks.Parse("MSFT.csv");; …
Run Code Online (Sandbox Code Playgroud)

csv io f# f#-data

6
推荐指数
1
解决办法
1668
查看次数

F#Deedle访问一行

这是一个基本问题,但我找不到阅读教程的简单答案

假设我有这个简单的框架

type Person = 
  { Name:string; Age:int; Countries:string list; }

let peopleRecds = 
  [ { Name = "Joe"; Age = 51; Countries = [ "UK"; "US"; "UK"] }
    { Name = "Tomas"; Age = 28; Countries = [ "CZ"; "UK"; "US"; "CZ" ] }
    { Name = "Eve"; Age = 2; Countries = [ "FR" ] }
    { Name = "Suzanne"; Age = 15; Countries = [ "US" ] } ]

// Turn the list of records into data …
Run Code Online (Sandbox Code Playgroud)

f# f#-data deedle

6
推荐指数
2
解决办法
154
查看次数

如何将文本文件作为字符向量导入R中

我想知道是否存在一个R已存在的简单命令,并允许将char文本文件(.txt)导入char矢量.

该文件可能是英文文本有像绳子"Hello my name is Fagui Curtain" 和R中的输出将是一个char向量A使得A[1]<-"H",A[2]<-"e",A[3]<-"l",等....

我试过扫描功能,但它会返回单词 A[1]<-"Hello",A[2]<-"my"....

我搜索了我的问题,但找不到任何有用的东西.

谢谢

string import r vector

4
推荐指数
1
解决办法
6954
查看次数

F#将Map转换为Dict的有效方法(反之亦然)

我没有看到任何本机功能来从Dict转换为Map,反之亦然.(比如Map.ofDict或Dict.ofMap)(主要区别是Map是不可变的,而Dict是可变的)

我错过了什么吗?

谢谢

f# dictionary

4
推荐指数
1
解决办法
1184
查看次数

F#优先级队列

我试图使用这段代码

https://code.msdn.microsoft.com/windowsdesktop/Net-Implementation-of-a-d3ac7b9d

实现Prim算法的基于堆的实现,以解决非定向连通图中的最小生成树(MST)问题.

经过几次迭代后,我发现堆/优先级队列不再得到很好的维护.这是PriorityQueue的头部没有堆中最低的Key.

PQ 0 [-7230, 309]
...
PQ 146 [-7277, 308]
Run Code Online (Sandbox Code Playgroud)

有没有人使用此代码并遇到类似的问题?如果有人在看它,我可以在GitHub上发布一个链接

我的需求是堆数据结构,它支持删除中间的元素.看起来Fsharpx.collections没有这样的数据结构.

有人知道某处有好的实施吗?

谢谢

heap f# priority-queue

4
推荐指数
1
解决办法
517
查看次数

Python熊猫中的日期时间strptime:出了什么问题?

import datetime as datetime
datetime.strptime('2013-01-01 09:10:12', '%Y-%m-%d %H:%M:%S')
Run Code Online (Sandbox Code Playgroud)

产生

()最后一次调用最后一次的属性错误跟踪(最近一次调用)作为datetime ----> 2 datetime.strptime('2013-01-01 09:10:12','%Y-%m-%d%H :%M:%S')3 z = minidf ['日期'] 4 z

AttributeError:'module'对象没有属性'strptime'

我的目标是转换一个pandas dataframe列,其格式仍然是数据对象

import datetime as datetime
#datetime.strptime('2013-01-01 09:10:12', '%Y-%m-%d %H:%M:%S')
z = minidf['Dates']

0     2015-05-13 23:53:00
1     2015-05-13 23:53:00
2     2015-05-13 23:33:00
3     2015-05-13 23:30:00
4     2015-05-13 23:30:00
5     2015-05-13 23:30:00
6     2015-05-13 23:30:00
7     2015-05-13 23:30:00
8     2015-05-13 23:00:00
9     2015-05-13 23:00:00
10    2015-05-13 22:58:00
Name: Dates, dtype: object
Run Code Online (Sandbox Code Playgroud)

奖金问题是,我使用pd.read_csv更多列的更大文件中的函数获取此列.是否可以传递参数,pd.read_csv直接将其转换为dtype: datetime64[ns]格式

python datetime strptime pandas

4
推荐指数
2
解决办法
2万
查看次数

/usr/bin/clang 命令在 MacOS 上尝试 pip install TA-lib 失败

我正在尝试 pip install TA-lib 并获取此日志:

> pip install TA-lib
Collecting TA-lib
  Downloading TA-Lib-0.4.10.tar.gz (829kB)
    100% |????????????????????????????????| 839kB 822kB/s 
Building wheels for collected packages: TA-lib
  Running setup.py bdist_wheel for TA-lib ... error
  Complete output from command /Library/Frameworks/Python.framework/Versions/2.7/Resources/Python.app/Contents/MacOS/Python -u -c "import setuptools, tokenize;__file__='/private/var/folders/gm/z065gk616xg6g0xgn4c7_bvc0000gn/T/pip-build-z2UL44/TA-lib/setup.py';f=getattr(tokenize, 'open', open)(__file__);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code, __file__, 'exec'))" bdist_wheel -d /var/folders/gm/z065gk616xg6g0xgn4c7_bvc0000gn/T/tmpSTzWMxpip-wheel- --python-tag cp27:
  /private/var/folders/gm/z065gk616xg6g0xgn4c7_bvc0000gn/T/pip-build-z2UL44/TA-lib/setup.py:77: UserWarning: Cannot find ta-lib library, installation may fail.
    warnings.warn('Cannot find ta-lib library, installation may fail.')
  running bdist_wheel
  running build
  running build_py
  creating build
  creating build/lib.macosx-10.6-intel-2.7
  creating build/lib.macosx-10.6-intel-2.7/talib
  copying …
Run Code Online (Sandbox Code Playgroud)

python installation ta-lib

3
推荐指数
1
解决办法
1656
查看次数

F#中的尾递归:堆栈溢出

我正试图在大图上实施Kosaraju的算法作为任务的一部分[MOOC Algo I Stanford on Coursera]

https://en.wikipedia.org/wiki/Kosaraju%27s_algorithm

当前代码适用于小图,但我在运行时执行期间遇到了Stack Overflow.

尽管已经阅读了F#中的Expert相关章节,或者网站上的其他可用示例和SO,我仍然没有得到如何使用continuation来解决这个问题

下面是通用的完整代码,但在执行DFSLoop1和递归函数DFSsub时它已经失败了.我认为我没有使函数tail递归[因为指令

t<-t+1
G.[n].finishingtime <- t
Run Code Online (Sandbox Code Playgroud)

?]

但我不明白我如何正确实施延续.

当仅考虑失败的部分时,DFSLoop1将我们将应用深度优先搜索的图形作为参数.我们需要记录完成时间作为算法的一部分,以便在第二个DFS循环(DFSLoop2)中进入算法的第二部分[当然我们在此之前就失败了].

open System
open System.Collections.Generic
open System.IO

let x = File.ReadAllLines "C:\Users\Fagui\Documents\GitHub\Learning Fsharp\Algo Stanford I\PA 4 - SCC.txt";;
// let x = File.ReadAllLines "C:\Users\Fagui\Documents\GitHub\Learning Fsharp\Algo Stanford I\PA 4 - test1.txt";;
// val x : string [] =

let splitAtTab (text:string)=
    text.Split [|'\t';' '|]

let splitIntoKeyValue (A: int[]) = 
    (A.[0], A.[1])

let parseLine (line:string)=
    line
    |> splitAtTab
    |> Array.filter (fun s -> not(s=""))
    |> …
Run Code Online (Sandbox Code Playgroud)

stack-overflow f# tail-recursion continuation-passing kosaraju-algorithm

2
推荐指数
1
解决办法
478
查看次数