映射到Deedle Frame

NoI*_*his 2 f# map dataframe deedle

我正在学习F#.我正在尝试将a转换Map<string, seq<DateTime * float>>为Deedle数据帧(http://bluemountaincapital.github.io/Deedle/tutorial.html#creating).

我有以下代码:

let folderFnct (aFrame:Frame) colName datesAndValues =
    let newSerie = Series(Seq.map (fun x -> fst x) datesAndValues, Seq.map (fun y -> snd y) datesAndValues)
    let newFrame = aFrame.Join([colName], [newSerie], kind=JoinKind.Inner)
    newFrame


let mapToDeedleFrame myMap frame =       
    Map.fold ( fun s ticker datesAndValues -> folderFnct s ticker datesAndValues) frame myMap
Run Code Online (Sandbox Code Playgroud)

mapToDeedleFrame使用现有框架折叠地图.文件夹功能folderFnct:

  • 采取框架
  • 使用Map键作为框架中的列名,和
  • 处理values(<DateTime * float>)制作一系列的.

问题在于:

let newFrame = aFrame.Join([colName], [newSerie], kind=JoinKind.Inner)
Run Code Online (Sandbox Code Playgroud)

哪里:

未定义字段,构造函数或成员"Join"

我已经确定了这个问题的三个可能原因:

  1. 为什么aFrame.Join没有定义?我试着明确指定类型aFrame
  2. 我怎么能养活到mapToDeedleFrame一个空的框架?
  3. 我应该在空folderFnct的情况下模式匹配aFrame吗?

非常感谢!

编辑1

根据托马斯的建议,这是我到目前为止所提出的建议.

let folderFnct (aFrame:Frame<'a, 'b>) columnName (seqOfTuples: seq<'a*'b>) =
    let newSerie = Series(Seq.map (fun x -> fst x) seqOfTuples, Seq.map (fun y -> snd y) seqOfTuples)
    let otherFrame = Frame([columnName], [newSerie])
    let newFrame = aFrame.Join((otherFrame), kind=JoinKind.Inner)
    newFrame


let mapToDeedleFrame myMap frame =       
    Map.fold ( fun state k vals -> folderFnct state k vals) frame myMap
Run Code Online (Sandbox Code Playgroud)

缺少的最后一步是:如何快速传递空帧(可能避免创建虚拟帧)mapToDeedleFrame?我已经尝试[]过了

let frame = mapToDeedleFrame mapTS []
Run Code Online (Sandbox Code Playgroud)

这可能是一个愚蠢的问题,但我是F#的新手,我想知道是否有一种Empty语言内置的类型.

关注问题

在我阅读的源文件中(https://github.com/BlueMountainCapital/Deedle/blob/master/src/Deedle/Frame.fs):

  member frame.Join<'V>(colKey, series:Series<'TRowKey, 'V>, kind, lookup) =    
    let otherFrame = Frame([colKey], [series])
    frame.Join(otherFrame, kind, lookup)
Run Code Online (Sandbox Code Playgroud)

而在屏幕上弹出的功能描述中:

PRINTSCREEN

从上面的图片中我可以猜测Frame的类型与colKey相同,而且,据我所知,colKey只是添加了来自serie的连接的dataframe列的关键.作为一个完整的菜鸟,我很困惑..

编辑2

我重写了代码:

let seriesListMapper (colName:string, series:Series<'a, 'b>) = 
    [colName => series] |> frame


let frameListReducer (accFrame: Frame<'a, 'b>) (aFrame: Frame<'a, 'b>) =
     accFrame.Join(aFrame, kind=JoinKind.Outer)


let seriesListToFrame (seriesList: List<string * Series<'a, 'b>>) =
    seriesList |> List.map (fun elem -> seriesListMapper elem) |> List.reduce(fun acc elem -> frameListReducer acc elem)
Run Code Online (Sandbox Code Playgroud)

问题是:

let frame = seriesListToFrame seriesList
Run Code Online (Sandbox Code Playgroud)

将帧返回为Frame,而seriesList则返回 (string *Series<DateTime, float>) list

我认为问题在于:

let seriesListMapper (colName:string, series:Series<'a, 'b>) = 
    [colName => series] |> frame
Run Code Online (Sandbox Code Playgroud)

实际上seriesListMapper表示为

seriesListMapper: colName:string * series:Series<'a, 'b> -> Frame<'a, string>
Run Code Online (Sandbox Code Playgroud)

我不明白如何以及为什么值转换为stringfloat.

一个有趣的事情是绘制框架frame.Format()实际上确认数据看起来是正确的.这只是这种"奇怪"的转换string.

Tom*_*cek 6

在的类型标注folderFnct,你有aFrame:Frame.但是,表示数据框的类型是具有两个类型参数的泛型类型(分别表示行和列的索引类型),因此注释应该是aFrame:Frame<_, _>.

将系列添加到框架的另一种方法是使用变异操作:

aFrame.AddSeries(colName, newSeries)
Run Code Online (Sandbox Code Playgroud)

但是,这仅支持左连接(数据帧只能通过添加新系列进行变异,但不能以改变索引的方式进行变异).但是,您可以使用此方法,然后在构造后从帧中删除所有缺失值.

编辑:回答关于泛型类型的问题:

  • Series<K, V>表示具有K包含类型值的类型的键的V系列(例如,具有通常索引的观察的序列将具有K=intV=float)

  • Frame<R, C>表示包含异构数据(每列可能有不同类型)的框架,其中行由索引R并且列由索引编制C.对于通常索引的框架R=int,通常,您的列将被命名为C=string(但您也可以使用其他索引)