从MS Word文档构建数据库的最佳方法是什么?

Age*_*geu 5 python database algorithm

请告诉我如何解决这个问题:

我在MS Word中的文档中有一个顺序的元数据列表.基本思想是创建一个Python算法来迭代信息,从数据库中检索PROCESS的名称,何时成为队列.

示例元数据:

过程: Process Walker(1965)
精确参考: Walker Process Equipment.,Inc.诉Food Machinery Corp.

链接: http ://caselaw.lp.findlaw.com/scripts/getcase.pl?court = US&vol = 382&invol =

程序类型:Certiorari至美国第七巡回上诉法院.缔约方:Walker Process Equipment,Inc.

行业:系统是......

开始时间: 10月12-13日阿格达斯,1965年
总结:食品机械公司已启动了一个进程,以阻止或延缓竞争对手通过使用以欺诈手段获得专利的项目.该案件涉及污水处理系统曝气设备中使用的"膝盖摇摆式扩散器"专利,问题在于"在专利局之前通过欺诈获得的专利的维护和执行"是否可能成为反托拉斯处罚的依据.
进化过程的报告:请愿者,回答回应......

重要性: a)第一个为争议诊断建立分析的案例......

大约有200页包含上述信息.

我想到了在Python中实现一个算法的想法,能够打破这个信息序列并尝试将其存储在Web数据库(我正在寻找的开源应用程序)中,以便进行免费咨询.

Ane*_*sm9 3

查看AntiWord将文档转换为纯文本,然后使用 grep 和 sed 将其转换为可以通过管道传输到脚本中的格式。