DTDを解析するためのより良いregexはありますか?
質問
OFX 1.03用のDTDを持っています(1.60を開発およびリリースしたにもかかわらず、最新バージョンですが、脱線します...)
Regexを使用して、エンティティ、要素、その他のタグをその部分に分割するグループを追加して、次のようなタグを取得するためにさらに処理したいと思います。
<!ENTITY % ACCTTOMACRO "(BANKACCTTO | CCACCTTO | INVACCTTO)">
そして、このようなオブジェクトを作成します
new EntityTag {string name = "%accttomacro"; string [] ChildTypes = new String [] {"Bankacctto"、 "ccacctto"、 "Invacctto"}};
私はこのように見える正規表現を持っています:
Regex re = new Regex(@"<!(\b)+([\s\S])?[^>]+>");
確かに、私はRegexが初めてなので、これまでにこれを手に入れました。これにより、コメントなしで各タグのDTDを介したマッチコレクションが得られます。
前述のオブジェクトの作成を容易にするために、グループ化を活用したいと思います。
私が完全に間違った道を歩んでいる場合は、私に指示してください。ただし、このドキュメントをダウンロードする場合は、標準ではないと思うかもしれません。 (Visual Studioは、このドキュメントのフォーマット方法でいくつかの赤い旗を投げかけます)
私は誰もがトラブルに行くことを期待していませんが、ここの好奇心が強いのは リンク 仕様をダウンロードします。
解決
スキーマも利用できるようです。代わりにスキーマをダウンロードして、それをXMLパーサー(たとえば、linq-to-xml)で解析してみませんか?
所属していません StackOverflow