NoI*_*his 2 f# map dataframe deedle
我正在学习F#.我正在尝试将a转换Map<string, seq<DateTime * float>>为Deedle数据帧(http://bluemountaincapital.github.io/Deedle/tutorial.html#creating).
我有以下代码:
let folderFnct (aFrame:Frame) colName datesAndValues =
let newSerie = Series(Seq.map (fun x -> fst x) datesAndValues, Seq.map (fun y -> snd y) datesAndValues)
let newFrame = aFrame.Join([colName], [newSerie], kind=JoinKind.Inner)
newFrame
let mapToDeedleFrame myMap frame =
Map.fold ( fun s ticker datesAndValues -> folderFnct s ticker datesAndValues) frame myMap
Run Code Online (Sandbox Code Playgroud)
mapToDeedleFrame使用现有框架折叠地图.文件夹功能folderFnct:
<DateTime * float>)制作一系列的.问题在于:
let newFrame = aFrame.Join([colName], [newSerie], kind=JoinKind.Inner)
Run Code Online (Sandbox Code Playgroud)
哪里:
未定义字段,构造函数或成员"Join"
我已经确定了这个问题的三个可能原因:
aFrame.Join没有定义?我试着明确指定类型aFramemapToDeedleFrame一个空的框架?folderFnct的情况下模式匹配aFrame吗?非常感谢!
编辑1
根据托马斯的建议,这是我到目前为止所提出的建议.
let folderFnct (aFrame:Frame<'a, 'b>) columnName (seqOfTuples: seq<'a*'b>) =
let newSerie = Series(Seq.map (fun x -> fst x) seqOfTuples, Seq.map (fun y -> snd y) seqOfTuples)
let otherFrame = Frame([columnName], [newSerie])
let newFrame = aFrame.Join((otherFrame), kind=JoinKind.Inner)
newFrame
let mapToDeedleFrame myMap frame =
Map.fold ( fun state k vals -> folderFnct state k vals) frame myMap
Run Code Online (Sandbox Code Playgroud)
缺少的最后一步是:如何快速传递空帧(可能避免创建虚拟帧)mapToDeedleFrame?我已经尝试[]过了
let frame = mapToDeedleFrame mapTS []
Run Code Online (Sandbox Code Playgroud)
这可能是一个愚蠢的问题,但我是F#的新手,我想知道是否有一种Empty语言内置的类型.
关注问题
在我阅读的源文件中(https://github.com/BlueMountainCapital/Deedle/blob/master/src/Deedle/Frame.fs):
member frame.Join<'V>(colKey, series:Series<'TRowKey, 'V>, kind, lookup) =
let otherFrame = Frame([colKey], [series])
frame.Join(otherFrame, kind, lookup)
Run Code Online (Sandbox Code Playgroud)
而在屏幕上弹出的功能描述中:

从上面的图片中我可以猜测Frame的类型与colKey相同,而且,据我所知,colKey只是添加了来自serie的连接的dataframe列的关键.作为一个完整的菜鸟,我很困惑..
编辑2
我重写了代码:
let seriesListMapper (colName:string, series:Series<'a, 'b>) =
[colName => series] |> frame
let frameListReducer (accFrame: Frame<'a, 'b>) (aFrame: Frame<'a, 'b>) =
accFrame.Join(aFrame, kind=JoinKind.Outer)
let seriesListToFrame (seriesList: List<string * Series<'a, 'b>>) =
seriesList |> List.map (fun elem -> seriesListMapper elem) |> List.reduce(fun acc elem -> frameListReducer acc elem)
Run Code Online (Sandbox Code Playgroud)
问题是:
let frame = seriesListToFrame seriesList
Run Code Online (Sandbox Code Playgroud)
将帧返回为Frame,而seriesList则返回 (string *Series<DateTime, float>) list
我认为问题在于:
let seriesListMapper (colName:string, series:Series<'a, 'b>) =
[colName => series] |> frame
Run Code Online (Sandbox Code Playgroud)
实际上seriesListMapper表示为
seriesListMapper: colName:string * series:Series<'a, 'b> -> Frame<'a, string>
Run Code Online (Sandbox Code Playgroud)
我不明白如何以及为什么值转换为string从float.
一个有趣的事情是绘制框架frame.Format()实际上确认数据看起来是正确的.这只是这种"奇怪"的转换string.
在的类型标注folderFnct,你有aFrame:Frame.但是,表示数据框的类型是具有两个类型参数的泛型类型(分别表示行和列的索引类型),因此注释应该是aFrame:Frame<_, _>.
将系列添加到框架的另一种方法是使用变异操作:
aFrame.AddSeries(colName, newSeries)
Run Code Online (Sandbox Code Playgroud)
但是,这仅支持左连接(数据帧只能通过添加新系列进行变异,但不能以改变索引的方式进行变异).但是,您可以使用此方法,然后在构造后从帧中删除所有缺失值.
编辑:回答关于泛型类型的问题:
Series<K, V>表示具有K包含类型值的类型的键的V系列(例如,具有通常索引的观察的序列将具有K=int和V=float)
Frame<R, C>表示包含异构数据(每列可能有不同类型)的框架,其中行由索引R并且列由索引编制C.对于通常索引的框架R=int,通常,您的列将被命名为C=string(但您也可以使用其他索引)