Wie der Inhalt der eckigen Klammern in einer Reihe von Text in c # Regex extrahieren
Frage
wenn ich eine Textzeichenfolge wie unten habe, wie kann ich sammle den Inhalt der Klammern in einer Sammlung in C #, auch wenn es über Zeilenumbrüche geht?
eg ...
string s = "test [4df] test [5yu] test [6nf]";
sollte mir geben ..
Sammlung [0] = 4df
Sammlung [1] = 5yu
Sammlung [2] = 6nf
Lösung
Sie können dies tun, mit regulären Ausdrücken, und ein bisschen Linq.
string s = "test [4df] test [5y" + Environment.NewLine + "u] test [6nf]";
ICollection<string> matches =
Regex.Matches(s.Replace(Environment.NewLine, ""), @"\[([^]]*)\]")
.Cast<Match>()
.Select(x => x.Groups[1].Value)
.ToList();
foreach (string match in matches)
Console.WriteLine(match);
Ausgabe:
4df
5yu
6nf
Hier ist, was mit dem regulären Ausdruck bedeutet:
\[ : Match a literal [
( : Start a new group, match.Groups[1]
[^]] : Match any character except ]
* : 0 or more of the above
) : Close the group
\] : Literal ]
Andere Tipps
Regex regex = new Regex(@"\[[^\]]+\]", RegexOptions.Multiline);
Der Schlüssel ist, um richtig die Sonderzeichen in regulären Ausdrücken zu entkommen, zum Beispiel können Sie einen [
Charakter auf diese Weise entsprechen: @"\["
Regex rx = new Regex(@"\[.+?\]");
var collection = rx.Matches(s);
Sie müssen die eckigen Klammern weg trimmen, der wichtige Teil der faule Operator ist.
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow