我使用:
data=Import["http://weburl/","Data"]
从一个站点导入数据.在该页面上有表格.这将创建嵌套列表,您可以轻松地以表格形式获取数据.例如:
Grid[data[[1]]]
会给出这样的东西:
Player Age Shots Goals
P1 24 10 2
P2 22 5 0
P3 28 11 1
...
Run Code Online (Sandbox Code Playgroud)
现在,这是问题所在.如果html表中的一个单元格为空,例如"Age"的条目,那么在html中,这将是这样的:<td></td>.Mathematica根本不包括在列表中,甚至不包括例如"Null"值.相反,这一行只是由长度为3的列表表示,数据将被移动一列,因此您将获得"镜头"代替"年龄"和"目标"代替"镜头"和"目标" "会空的.例如,一个年龄未知的"P4"(html表中的空单元格),有10个镜头并且得分为0的目标将被导入为长度为3的列表而不是4并且移动一个:
Player Age Shots Goals
P1 24 10 2
P2 22 5 0
P3 10 0
...
Run Code Online (Sandbox Code Playgroud)
这会带来一个难题,因为如果您有一些空字段,那么您无法从列表中分辨出它属于哪一列.在Mathematica中导入时,有没有办法在html表中的空单元格上放置"Null"?例如,列表中的P4元素将如下所示:
data[[1,5]]
{"P4","Null",10,0}
而不是:
{"P4",10,0}