我正在尝试在Python上使用xgboost.
这是我的代码.
虽然看起来我用它是正确的方法xgb.train,xgb.cv但我仍然犯了错误.
以下适用于我:
###### XGBOOST ######
import datetime
startTime = datetime.datetime.now()
import xgboost as xgb
data_train = np.array(traindata.drop('Category',axis=1))
labels_train = np.array(traindata['Category'].cat.codes)
data_valid = np.array(validdata.drop('Category',axis=1))
labels_valid = np.array(validdata['Category'].astype('category').cat.codes)
weights_train = np.ones(len(labels_train))
weights_valid = np.ones(len(labels_valid ))
dtrain = xgb.DMatrix( data_train, label=labels_train,weight = weights_train)
dvalid = xgb.DMatrix( data_valid , label=labels_valid ,weight = weights_valid )
param = {'bst:max_depth':5, 'bst:eta':0.05, # eta [default=0.3]
#'min_child_weight':1,'gamma':0,'subsample':1,'colsample_bytree':1,'scale_pos_weight':0, # default
# max_delta_step:0 # default
'min_child_weight':5,'scale_pos_weight':0, 'max_delta_step':2,
'subsample':0.8,'colsample_bytree':0.8,
'silent':1, 'objective':'multi:softprob' }
param['nthread'] = 4
param['eval_metric'] …Run Code Online (Sandbox Code Playgroud) 我想这是一个常见的问题,我发现了很多网页,包括一些来自SO,但我不明白如何实现它.
我是REGEX的新手,我想在R中使用它来从句子中提取前几个单词.
例如,如果我的判决是
z = "I love stack overflow it is such a cool site"
Run Code Online (Sandbox Code Playgroud)
我喜欢把我的输出作为(如果我需要前四个单词)
[1] "I love stack overflow"
Run Code Online (Sandbox Code Playgroud)
或者(如果我需要最后四个字)
[1] "such a cool site"
Run Code Online (Sandbox Code Playgroud)
当然,以下作品
paste(strsplit(z," ")[[1]][1:4],collapse=" ")
paste(strsplit(z," ")[[1]][7:10],collapse=" ")
Run Code Online (Sandbox Code Playgroud)
但我想尝试一个性能问题的正则表达式解决方案,因为我需要处理非常大的文件(也为了解它)
我看了几个链接,包括 Regex从字符串中提取前3个单词和 http://osherove.com/blog/2005/1/7/using-regex-to-return-the-first-n-words-in -a-string.html
所以我尝试了类似的东西
gsub("^((?:\S+\s+){2}\S+).*",z,perl=TRUE)
Error: '\S' is an unrecognized escape in character string starting ""^((?:\S"
Run Code Online (Sandbox Code Playgroud)
我尝试了其他的东西,但它通常返回我整个字符串,或空字符串.
substr的另一个问题是它返回一个列表.也许看起来[[]]操作员在处理大文件和应用东西时会慢一点(??).
看起来R中使用的语法有些不同?谢谢 !
我是F#的初学者,我正在尝试使用CsvProvider并重现这里给出的例子
http://fsharp.github.io/FSharp.Data/library/CsvProvider.html
所以在F#互动中,我打字
>type Stocks = CsvProvider<"MSFT.csv">;;
type Stocks = CsvProvider<...>
> let msft = CsvProvider<"MSFT.csv">.GetSample();;
val msft : CsvProvider<...>
> msft;;
val it : CsvProvider<...> =
FSharp.Data.Runtime.CsvFile`1[System.Tuple`1[System.String]]
{Headers = Some [|"MSFT.csv"|];
NumberOfColumns = 1;
Quote = '"';
Rows = seq [];
Separators = ",";}
> let firstRow = msft.Rows |> Seq.head;;
System.ArgumentException: The input sequence was empty.
Parameter name: source
> at Microsoft.FSharp.Collections.SeqModule.Head[T](IEnumerable`1 source)
at <StartupCode$FSI_0044>.$FSI_0044.main@()
Stopped due to error
Run Code Online (Sandbox Code Playgroud)
我的理解是CsvProvider基于CSV文件创建一个类型,该文件使得以后能够以相同的格式读取该文件或不同的文件/流.我认为我没有目录问题,因为如果文件位于错误的目录中,该函数将返回错误.当创建msft时,F#表示NumberOfColumns = 1,但这显然是错误的.
这也不起作用
> let msft = Stocks.Parse("MSFT.csv");; …Run Code Online (Sandbox Code Playgroud) 这是一个基本问题,但我找不到阅读教程的简单答案
假设我有这个简单的框架
type Person =
{ Name:string; Age:int; Countries:string list; }
let peopleRecds =
[ { Name = "Joe"; Age = 51; Countries = [ "UK"; "US"; "UK"] }
{ Name = "Tomas"; Age = 28; Countries = [ "CZ"; "UK"; "US"; "CZ" ] }
{ Name = "Eve"; Age = 2; Countries = [ "FR" ] }
{ Name = "Suzanne"; Age = 15; Countries = [ "US" ] } ]
// Turn the list of records into data …Run Code Online (Sandbox Code Playgroud) 我想知道是否存在一个R已存在的简单命令,并允许将char文本文件(.txt)导入char矢量.
该文件可能是英文文本有像绳子"Hello my name is Fagui Curtain"
和R中的输出将是一个char向量A使得A[1]<-"H",A[2]<-"e",A[3]<-"l",等....
我试过扫描功能,但它会返回单词
A[1]<-"Hello",A[2]<-"my"....
我搜索了我的问题,但找不到任何有用的东西.
谢谢
我没有看到任何本机功能来从Dict转换为Map,反之亦然.(比如Map.ofDict或Dict.ofMap)(主要区别是Map是不可变的,而Dict是可变的)
我错过了什么吗?
谢谢
我试图使用这段代码
https://code.msdn.microsoft.com/windowsdesktop/Net-Implementation-of-a-d3ac7b9d
实现Prim算法的基于堆的实现,以解决非定向连通图中的最小生成树(MST)问题.
经过几次迭代后,我发现堆/优先级队列不再得到很好的维护.这是PriorityQueue的头部没有堆中最低的Key.
PQ 0 [-7230, 309]
...
PQ 146 [-7277, 308]
Run Code Online (Sandbox Code Playgroud)
有没有人使用此代码并遇到类似的问题?如果有人在看它,我可以在GitHub上发布一个链接
我的需求是堆数据结构,它支持删除中间的元素.看起来Fsharpx.collections没有这样的数据结构.
有人知道某处有好的实施吗?
谢谢
import datetime as datetime
datetime.strptime('2013-01-01 09:10:12', '%Y-%m-%d %H:%M:%S')
Run Code Online (Sandbox Code Playgroud)
产生
()最后一次调用最后一次的属性错误跟踪(最近一次调用)作为datetime ----> 2 datetime.strptime('2013-01-01 09:10:12','%Y-%m-%d%H :%M:%S')3 z = minidf ['日期'] 4 z
AttributeError:'module'对象没有属性'strptime'
我的目标是转换一个pandas dataframe列,其格式仍然是数据对象
import datetime as datetime
#datetime.strptime('2013-01-01 09:10:12', '%Y-%m-%d %H:%M:%S')
z = minidf['Dates']
0 2015-05-13 23:53:00
1 2015-05-13 23:53:00
2 2015-05-13 23:33:00
3 2015-05-13 23:30:00
4 2015-05-13 23:30:00
5 2015-05-13 23:30:00
6 2015-05-13 23:30:00
7 2015-05-13 23:30:00
8 2015-05-13 23:00:00
9 2015-05-13 23:00:00
10 2015-05-13 22:58:00
Name: Dates, dtype: object
Run Code Online (Sandbox Code Playgroud)
奖金问题是,我使用pd.read_csv更多列的更大文件中的函数获取此列.是否可以传递参数,pd.read_csv直接将其转换为dtype: datetime64[ns]格式
我正在尝试 pip install TA-lib 并获取此日志:
> pip install TA-lib
Collecting TA-lib
Downloading TA-Lib-0.4.10.tar.gz (829kB)
100% |????????????????????????????????| 839kB 822kB/s
Building wheels for collected packages: TA-lib
Running setup.py bdist_wheel for TA-lib ... error
Complete output from command /Library/Frameworks/Python.framework/Versions/2.7/Resources/Python.app/Contents/MacOS/Python -u -c "import setuptools, tokenize;__file__='/private/var/folders/gm/z065gk616xg6g0xgn4c7_bvc0000gn/T/pip-build-z2UL44/TA-lib/setup.py';f=getattr(tokenize, 'open', open)(__file__);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code, __file__, 'exec'))" bdist_wheel -d /var/folders/gm/z065gk616xg6g0xgn4c7_bvc0000gn/T/tmpSTzWMxpip-wheel- --python-tag cp27:
/private/var/folders/gm/z065gk616xg6g0xgn4c7_bvc0000gn/T/pip-build-z2UL44/TA-lib/setup.py:77: UserWarning: Cannot find ta-lib library, installation may fail.
warnings.warn('Cannot find ta-lib library, installation may fail.')
running bdist_wheel
running build
running build_py
creating build
creating build/lib.macosx-10.6-intel-2.7
creating build/lib.macosx-10.6-intel-2.7/talib
copying …Run Code Online (Sandbox Code Playgroud) 我正试图在大图上实施Kosaraju的算法作为任务的一部分[MOOC Algo I Stanford on Coursera]
https://en.wikipedia.org/wiki/Kosaraju%27s_algorithm
当前代码适用于小图,但我在运行时执行期间遇到了Stack Overflow.
尽管已经阅读了F#中的Expert相关章节,或者网站上的其他可用示例和SO,我仍然没有得到如何使用continuation来解决这个问题
下面是通用的完整代码,但在执行DFSLoop1和递归函数DFSsub时它已经失败了.我认为我没有使函数tail递归[因为指令
t<-t+1
G.[n].finishingtime <- t
Run Code Online (Sandbox Code Playgroud)
?]
但我不明白我如何正确实施延续.
当仅考虑失败的部分时,DFSLoop1将我们将应用深度优先搜索的图形作为参数.我们需要记录完成时间作为算法的一部分,以便在第二个DFS循环(DFSLoop2)中进入算法的第二部分[当然我们在此之前就失败了].
open System
open System.Collections.Generic
open System.IO
let x = File.ReadAllLines "C:\Users\Fagui\Documents\GitHub\Learning Fsharp\Algo Stanford I\PA 4 - SCC.txt";;
// let x = File.ReadAllLines "C:\Users\Fagui\Documents\GitHub\Learning Fsharp\Algo Stanford I\PA 4 - test1.txt";;
// val x : string [] =
let splitAtTab (text:string)=
text.Split [|'\t';' '|]
let splitIntoKeyValue (A: int[]) =
(A.[0], A.[1])
let parseLine (line:string)=
line
|> splitAtTab
|> Array.filter (fun s -> not(s=""))
|> …Run Code Online (Sandbox Code Playgroud) stack-overflow f# tail-recursion continuation-passing kosaraju-algorithm