我最近一直在研究一个虚拟数据集,我发现提供给我的数据都是单行的.一个类似的例子描述如下:
Name,Age,Gender,Occupation A,10,M,Student B,11,M,Student C,11,F,Student
Run Code Online (Sandbox Code Playgroud)
我想导入数据并获得如下输出:
Name Age Gender Occupation
A 10 M Student
B 11 M Student
C 12 F Student
Run Code Online (Sandbox Code Playgroud)
可能会出现可能缺少价值的情况.导入此类数据需要逻辑.任何人都可以帮助我构建导入此类数据集的逻辑.
我尝试了正常的导入,但它确实没有帮助.刚刚按read.csv()功能导入文件,它没有给我一个预期的结果.
编辑:如果数据如下:
Name,Age,Gender,Occupation ABC XYZ,10,M,Student B,11,M,Student C,11,F,Student
Run Code Online (Sandbox Code Playgroud)
我想要一个像这样的输出:
Name Age Gender Occupation
ABC XYZ 10 M Student
B 11 M Student
C 12 F Student
Run Code Online (Sandbox Code Playgroud) 当我在 Alteryx 中读取 Excel TSV 时,我试图弄清楚如何删除具有特定名称的列?
以下是我收到的示例tsv 数据
name given_name family_name email default_email_language id deactivated blocked incargo created_at logins_count last_login last_ip locked_ips tags Apple Banana Grapes Pineapple fruit1 fruit2
AB CD AB CD abcd@mail.com x 1234 YES YES YES creationdate 23 logindate ipinfo X x YES NO NO NO NO NO
EF GH EF GH efgh@mail.com x 2345 NO NO YES creationdate logindate ipinfo X x NO YES YES YES NO NO
我想删除名为default_email_language, id, last_ip …