(如果您可以假设 Java >= 9,则 4castle's answer 比以下更好)
您需要创建一个匹配器并使用它来迭代地查找匹配项。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
...
List<String> allMatches = new ArrayList<String>();
Matcher m = Pattern.compile("your regular expression here")
.matcher(yourStringHere);
while (m.find()) {
allMatches.add(m.group());
}
在此之后,allMatches
包含匹配项,如果您确实需要,可以使用 allMatches.toArray(new String[0])
获取一个数组。
您还可以使用 MatchResult
编写帮助函数来循环匹配,因为 Matcher.toMatchResult()
返回当前组状态的快照。
例如你可以写一个惰性迭代器让你做
for (MatchResult match : allMatches(pattern, input)) {
// Use match, and maybe break without doing the work to find all possible matches.
}
通过做这样的事情:
public static Iterable<MatchResult> allMatches(
final Pattern p, final CharSequence input) {
return new Iterable<MatchResult>() {
public Iterator<MatchResult> iterator() {
return new Iterator<MatchResult>() {
// Use a matcher internally.
final Matcher matcher = p.matcher(input);
// Keep a match around that supports any interleaving of hasNext/next calls.
MatchResult pending;
public boolean hasNext() {
// Lazily fill pending, and avoid calling find() multiple times if the
// clients call hasNext() repeatedly before sampling via next().
if (pending == null && matcher.find()) {
pending = matcher.toMatchResult();
}
return pending != null;
}
public MatchResult next() {
// Fill pending if necessary (as when clients call next() without
// checking hasNext()), throw if not possible.
if (!hasNext()) { throw new NoSuchElementException(); }
// Consume pending so next call to hasNext() does a find().
MatchResult next = pending;
pending = null;
return next;
}
/** Required to satisfy the interface, but unsupported. */
public void remove() { throw new UnsupportedOperationException(); }
};
}
};
}
有了这个,
for (MatchResult match : allMatches(Pattern.compile("[abc]"), "abracadabra")) {
System.out.println(match.group() + " at " + match.start());
}
产量
在 0 b 在 1 a 在 3 c 在 4 a 在 5 a 在 7 b 在 8 a 在 10
在 Java 9 中,您现在可以使用 Matcher#results()
来获取 Stream<MatchResult>
,您可以使用它来获取匹配的列表/数组。
import java.util.regex.Pattern;
import java.util.regex.MatchResult;
String[] matches = Pattern.compile("your regex here")
.matcher("string to search from here")
.results()
.map(MatchResult::group)
.toArray(String[]::new);
// or .collect(Collectors.toList())
Java 使正则表达式过于复杂,而且它不遵循 perl 风格。查看 MentaRegex,了解如何在一行 Java 代码中实现这一点:
String[] matches = match("aa11bb22", "/(\\d+)/g" ); // => ["11", "22"]
这是一个简单的例子:
Pattern pattern = Pattern.compile(regexPattern);
List<String> list = new ArrayList<String>();
Matcher m = pattern.matcher(input);
while (m.find()) {
list.add(m.group());
}
(如果你有更多的捕获组,你可以通过它们的索引来引用它们作为 group 方法的参数。如果你需要一个数组,那么使用 list.toArray()
)
Pattern.matches()
是一个静态方法,您不应在 Pattern
实例上调用它。 Pattern.matches(regex, input)
只是 Pattern.compile(regex).matcher(input).matches()
的简写。
Pattern pattern =
Pattern.compile(console.readLine("%nEnter your regex: "));
Matcher matcher =
pattern.matcher(console.readLine("Enter input string to search: "));
boolean found = false;
while (matcher.find()) {
console.format("I found the text \"%s\" starting at " +
"index %d and ending at index %d.%n",
matcher.group(), matcher.start(), matcher.end());
found = true;
}
使用 find
并将生成的 group
插入您的数组/列表/任何内容。
Set<String> keyList = new HashSet();
Pattern regex = Pattern.compile("#\\{(.*?)\\}");
Matcher matcher = regex.matcher("Content goes here");
while(matcher.find()) {
keyList.add(matcher.group(1));
}
return keyList;
ArrayList
和LinkedList
进行基准测试,结果可能令人惊讶。allMatches
与yourStringHere.length()
的长度之和),您可能可以预先计算allMatches
的大小合适。根据我的经验,LinkedList
内存和迭代效率方面的成本通常不值得,因此LinkedList
不是我的默认姿势。但是在优化热点时,绝对值得交换列表实现以查看是否有改进。Matcher#results
获得一个Stream
,您可以使用它来生成一个数组(请参阅 my answer)。