我有一个数据集,我使用命令将其导出outsheet到 csv 文件中。有些行在某个地方断线。使用十六进制编辑器,我可以识别记录中换行符“0a”的控制字符。产生换行符的变量值在视觉上(在 Stata 中)仅显示 5 个字符。但如果我计算字符数:
gen xlen = length(x)
Run Code Online (Sandbox Code Playgroud)
我得到 6。我可以编写一个 Perl 程序来解决这个问题,但我更喜欢在导出之前删除 Stata 中的控制字符(例如使用regexr())。有谁知道如何删除控制字符?
该char()函数调用特定的 ASCII 字符。因此,您可以通过用空字符串替换这些字符来删除它们。
replace x = subinstr(x, char(10), "", .)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5971 次 |
| 最近记录: |