Sri*_*Sri 5 java regex twitter
需要从Java中的源字符串中提取出标签字符串.任何想法/例子?
谢谢,斯里兰卡
这是我正在使用的(它也处理UTF-8标签,而不仅仅是ASCII):
private static final Pattern TAG_PATTERN =
Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");
Run Code Online (Sandbox Code Playgroud)
顺便说一下,你应该能够从推文实体中获取主题标签(include_entities=true)