Dan*_*ruz 6 amazon-web-services amazon-athena aws-glue aws-glue-data-catalog
我正在设置一个新的爬网程序,该爬网程序按计划执行,但由于内部有逗号的双引号而失败
我搜索并发现 OpenCSVSerDe lib 用于编辑表详细信息,但我正在创建新表,我想知道如何添加一些配置以允许爬虫正确生成数据目录
如果 csv 文件具有像"$3.62","4,406"
数据目录那样的价值
col0 col1
"$3.62" "4,406"
Run Code Online (Sandbox Code Playgroud)
但我得到:
col0 col1 col2
"$3.62" "4 406"
Run Code Online (Sandbox Code Playgroud)
小智 1
尝试创建一个分类器(Crawlers \xe2\x86\x92 Classifiers)并将其分配给特定的爬网程序(Crawler Info \xe2\x86\x92 Tags、描述、安全配置和分类器)。
\n\n\n 归档时间: |
|
查看次数: |
3194 次 |
最近记录: |