用Java解析固定宽度文本日志的策略

jkh*_*ler 2 java regex logging parsing

我试图弄清楚如何最好地解析以下日志文​​件,拆分由水平线分隔的每个部分并提取各种数据,例如'COMPANY123','BIMMU',日期(2/18等)和然后创建一个字符串,其中包含由水平线分隔的部分中包含的所有其他数据.

即,我想创建一个'statement'对象数组,每个对象具有以下属性:

Company name, Account, Date, Data.
Run Code Online (Sandbox Code Playgroud)

例如,下面的第二条记录,

Account = 'BIMMU'
Firm = 'Super Corporation'
Date= 9/14/11
Data = '* * * * * * * * TODAYS ACCOUNT ACTIVITY * * * * * * * * * * *
        9/14/11 Y9 CALL OESX OCT 11 ........ etc'
Run Code Online (Sandbox Code Playgroud)

日志是固定宽度的文本文件,变量(日期等)总是出现在行中的相同位置,例如 sSalesCode = line.substring(142, 147);

我是否可以在两次传递中执行此操作,例如将代码拆分为由水平线分隔的部分,然后单独解析这些部分?

在这里写这篇文章有助于我深入思考,但如果其他人有任何聪明的想法,那么听到它们会很棒.


------------------------------------------------------------------------------------------------------------------------------------F   BIASPBIMMU
BIMMU    BIASP-COMPANY123 KG              (Z )  9/14/11  EU (T-  I- )                      MT-0                              F   BIASP²BIMMU
CALLS     2/18  YI              50.00-X (49)                                                                                        F   BIASP²BIMMU
------------------------------------------------------------------------------------------------------------------------------------F   BIASPBIMMU
BIMMU    BIMM2-SUPER CORPORATION KG              (Z )  9/14/11  EU (T-  I- )                      MT-0                              F   BIMM2²BIMMU
                                                                                                                                    F   BIMM2²BIMMU
* * * * * * * * * * * * * * * * * * *     T O D A Y S    A C C O U N T    A C T I V I T Y    * * * * * * * * * * * * * * * * * * * *F   BIMM2²BIMMU
 9/14/11        Y9             500   GO  CALL OESX   OCT 11  2400            9.60    EU                                        .00  F   BIMM2²BIMMU
                                                              GO-PARFSecurities Ser                                                 F   BIMM2²BIMMU
                Y9        *    500 *     COMMISSIONS                                 EU                                     250.00- F   BIMM2²BIMMU
                Y9                       PERTES & PROFITS NETS                       EU                                     250.00- F   BIMM2BIMMU
CALLS     9/14  E1          17,825.00-H ( 1)                                                                                        F   BIMM2²BIMMU
CALLS     9/14  E1          17,825.00-N ( 1)                                                                                        F   BIMM2²BIMMU
-----------------------------------------------------------------------------------------------------------------------------------                                                                                                                                                                      
Run Code Online (Sandbox Code Playgroud)

小智 5

您可以尝试使用框架Fixedformat4j.它使用注释并快速工作.我已经为我的项目部分实现了它,以了解它是如何工作的.

您可以使用以下注释创建类:

@Record
public class LogRecord {
    private String firm;
    private String user;
    private Date logonDate;
    private String logData;

    public String getFirm() {
        return firm;
    }

    @field(offset=10, length=10)
    public void setFirm(String firm) {
        this.firm = firm;
    }

    public String getUser() {
        return user;
    }

    @field(offset=0, length=10)
    public void setUser(String user) {
        this.user = user;
    }

    public Date getLogonDate() {
        return logonDate;
    }

    @field(offset=nn, length=8)
    @FixedFormatPattern("mm/dd/yy")  
    public void setLogonDate(Date logonDate) {
        this.logonDate = logonDate;
    }

    public String getLogData() {
        return logData;
    }

    @field(offset=mm, length=yy)
    public void setLogData(String logData) {
        this.logData = logData;
    }

}
Run Code Online (Sandbox Code Playgroud)

然后使用FixedFormatManager实例化它.