我有一个稀疏数据集,其列数以csv格式变化.以下是文件文本的示例.
12223, University
12227, bridge, Sky
12828, Sunset
13801, Ground
14853, Tranceamerica
14854, San Francisco
15595, shibuya, Shrine
16126, fog, San Francisco
16520, California, ocean, summer, golden gate, beach, San Francisco
Run Code Online (Sandbox Code Playgroud)
我用的时候
read.csv("data.txt", header = F)
Run Code Online (Sandbox Code Playgroud)
R将数据集解释为具有3列,因为大小是从前5行确定的.无论如何强制r将数据放在更多列中?
我有一个设计矩阵,我正在使用scipy模块在稀疏矩阵中进行转换
它有很多行,只有很少的列
有了这种形状,使用CSC或CSR设计会更好吗?或者他们是否严格等同于执行速度?
基本上,它看起来像这个例子:(但真正的行中还有更多的行)
谢谢 !