解析Java中的任何日期

Max*_*Max 73 java date

我知道这个问题有很多问题,显然你无法解析任何日期.但是,我发现python-dateutil库能够解析我抛出的每个日期,同时在确定日期格式字符串时完全没有必要.Joda时间总是作为一个伟大的Java日期解析器出售,但它仍然需要您在选择Format(或创建自己的)之前决定日期的格式.你不能只调用DateFormatter.parse(mydate)并神奇地获得一个Date对象.

例如,使用python-dateutil正确解析日期"Wed Mar 04 05:09:06 GMT-06:00 2009":

import dateutil.parser
print dateutil.parser.parse('Wed Mar 04 05:09:06 GMT-06:00 2009')
Run Code Online (Sandbox Code Playgroud)

但以下Joda时间调用不起作用:

    String date = "Wed Mar 04 05:09:06 GMT-06:00 2009";
    DateTimeFormatter fmt = ISODateTimeFormat.dateTime();
    DateTime dt = fmt.parseDateTime(date);
    System.out.println(date);
Run Code Online (Sandbox Code Playgroud)

并且创建自己的DateTimeFormatter会破坏目的,因为这似乎与使用具有正确格式字符串的SimpleDateFormatter相同.

是否有类似的方法来解析Java中的日期,比如python-dateutil?我不关心错误,我只是希望它大多完美.

Bal*_*usC 99

你最好的选择是要求正则表达式提供帮助以匹配日期格式模式和/或做暴力强制.

几年前,我写了一个小傻DateUtil,完成了这项工作.这是相关的摘录:

private static final Map<String, String> DATE_FORMAT_REGEXPS = new HashMap<String, String>() {{
    put("^\\d{8}$", "yyyyMMdd");
    put("^\\d{1,2}-\\d{1,2}-\\d{4}$", "dd-MM-yyyy");
    put("^\\d{4}-\\d{1,2}-\\d{1,2}$", "yyyy-MM-dd");
    put("^\\d{1,2}/\\d{1,2}/\\d{4}$", "MM/dd/yyyy");
    put("^\\d{4}/\\d{1,2}/\\d{1,2}$", "yyyy/MM/dd");
    put("^\\d{1,2}\\s[a-z]{3}\\s\\d{4}$", "dd MMM yyyy");
    put("^\\d{1,2}\\s[a-z]{4,}\\s\\d{4}$", "dd MMMM yyyy");
    put("^\\d{12}$", "yyyyMMddHHmm");
    put("^\\d{8}\\s\\d{4}$", "yyyyMMdd HHmm");
    put("^\\d{1,2}-\\d{1,2}-\\d{4}\\s\\d{1,2}:\\d{2}$", "dd-MM-yyyy HH:mm");
    put("^\\d{4}-\\d{1,2}-\\d{1,2}\\s\\d{1,2}:\\d{2}$", "yyyy-MM-dd HH:mm");
    put("^\\d{1,2}/\\d{1,2}/\\d{4}\\s\\d{1,2}:\\d{2}$", "MM/dd/yyyy HH:mm");
    put("^\\d{4}/\\d{1,2}/\\d{1,2}\\s\\d{1,2}:\\d{2}$", "yyyy/MM/dd HH:mm");
    put("^\\d{1,2}\\s[a-z]{3}\\s\\d{4}\\s\\d{1,2}:\\d{2}$", "dd MMM yyyy HH:mm");
    put("^\\d{1,2}\\s[a-z]{4,}\\s\\d{4}\\s\\d{1,2}:\\d{2}$", "dd MMMM yyyy HH:mm");
    put("^\\d{14}$", "yyyyMMddHHmmss");
    put("^\\d{8}\\s\\d{6}$", "yyyyMMdd HHmmss");
    put("^\\d{1,2}-\\d{1,2}-\\d{4}\\s\\d{1,2}:\\d{2}:\\d{2}$", "dd-MM-yyyy HH:mm:ss");
    put("^\\d{4}-\\d{1,2}-\\d{1,2}\\s\\d{1,2}:\\d{2}:\\d{2}$", "yyyy-MM-dd HH:mm:ss");
    put("^\\d{1,2}/\\d{1,2}/\\d{4}\\s\\d{1,2}:\\d{2}:\\d{2}$", "MM/dd/yyyy HH:mm:ss");
    put("^\\d{4}/\\d{1,2}/\\d{1,2}\\s\\d{1,2}:\\d{2}:\\d{2}$", "yyyy/MM/dd HH:mm:ss");
    put("^\\d{1,2}\\s[a-z]{3}\\s\\d{4}\\s\\d{1,2}:\\d{2}:\\d{2}$", "dd MMM yyyy HH:mm:ss");
    put("^\\d{1,2}\\s[a-z]{4,}\\s\\d{4}\\s\\d{1,2}:\\d{2}:\\d{2}$", "dd MMMM yyyy HH:mm:ss");
}};

/**
 * Determine SimpleDateFormat pattern matching with the given date string. Returns null if
 * format is unknown. You can simply extend DateUtil with more formats if needed.
 * @param dateString The date string to determine the SimpleDateFormat pattern for.
 * @return The matching SimpleDateFormat pattern, or null if format is unknown.
 * @see SimpleDateFormat
 */
public static String determineDateFormat(String dateString) {
    for (String regexp : DATE_FORMAT_REGEXPS.keySet()) {
        if (dateString.toLowerCase().matches(regexp)) {
            return DATE_FORMAT_REGEXPS.get(regexp);
        }
    }
    return null; // Unknown format.
}
Run Code Online (Sandbox Code Playgroud)

(咳嗽,双支撑初始化,咳嗽,这只是为了让它全部适合100 char最大长度;))

您可以使用新的正则表达式和日期格式模式轻松扩展它.

  • 你怎么处理模棱两可的日期?例如,"03/04/2010"意味着什么 - 2010年4月3日或2010年3月4日? (3认同)
  • 我猜假设一个或另一个(可配置) (3认同)
  • @Jesper:`/`分隔符通常用于表示`MM/dd/yyyy`(主要用于美国/英国语言环境).`-`分隔符通常用于表示`dd-MM-yyyy`(主要用于欧洲语言环境). (3认同)
  • @Jesper是的,你必须在一个月或一天之间决定格式,否则你永远不会到达任何地方. (3认同)
  • @kittylyst:那是对的.更多的是,没有一个防弹的方法:) (3认同)

Cac*_*sky 49

有一个名为Natty的漂亮图书馆我认为适合您的目的:

Natty是一个用Java编写的自然语言日期解析器.给定日期表达式,natty将应用标准语言识别和翻译技术来生成具有可选解析和语法信息的相应日期列表.

您也可以在线试用!

  • 是的,令人惊讶的是,Natty 无法处理日-月-年格式。 (4认同)
  • 它失败了"13/02/2002",我得到2月22日,似乎不是很国际化. (3认同)

小智 10

你可以试试dateparser

它可以自动识别任何字符串,并正确快速地将其解析为DateCalendarLocalDateTimeOffsetDateTime1us~1.5us

它不基于任何natural language analyzerSimpleDateFormatregex.Pattern

有了它,您不必准备任何适当的模式,例如yyyy-MM-dd'T'HH:mm:ss.SSSZyyyy-MM-dd'T'HH:mm:ss.SSSZZ

Date date = DateParserUtils.parseDate("2015-04-29T10:15:00.500+0000");
Calendar calendar = DateParserUtils.parseCalendar("2015-04-29T10:15:00.500Z");
LocalDateTime dateTime = DateParserUtils.parseDateTime("2015-04-29 10:15:00.500 +00:00");
Run Code Online (Sandbox Code Playgroud)

一切正常,请尽情享受。


Rob*_*ana 7

我所看到的是一个Date util类,它包含几种典型的日期格式.因此,当调用DateUtil.parse(date)时,它会尝试在内部使用每种日期格式解析日期,并且只有在没有内部格式可以解析它时才会抛出异常.

它基本上是一个蛮力的方法来解决你的问题.