mat*_*boy 5 java csv apache-tika
我正在使用Apache 的Java 库Tikatika-core (版本1.10)。
是否存在org.apache.tika.detect.DetectorCSV 文件?MIME 类型应该是text/csv,但我找不到类似的东西。
我想使用很好的detect方法
目前(v1.10)tika-mimetypes.xml定义text/csv如下:
<mime-type type="text/csv">
<glob pattern="*.csv"/>
<sub-class-of type="text/plain"/>
</mime-type>
Run Code Online (Sandbox Code Playgroud)
这意味着 Apache Tika 仅通过文件名进行检测。如果您使用Tika#detect(File)Tika 会将文件名(在Metadata.RESOURCE_NAME_KEY键下)添加到Metadata传递给检测器的对象。URL 也有类似的行为。
如果你想注入文件名,你可以使用类似的东西:
new Tika().detect(is, fileName)
Run Code Online (Sandbox Code Playgroud)
如果您想要一些基于内容的启发式方法,请随时在Tika 的 JIRA中检查并提交票证。
| 归档时间: |
|
| 查看次数: |
3894 次 |
| 最近记录: |