ウェブをこするとき、どのように私は、テキストとしてHTMLのエスケープ文字/エンティティを抽出することができますか? (ルビー&鋸山)

StackOverflow https://stackoverflow.com/questions/2122118

  •  22-09-2019
  •  | 
  •  

質問

で私のルビー+ Mechanizeの(鋸山)スクリプト私は、コードのこの部分を使用します:

row.at_xpath('td[3]/div[1]/a/text()').to_s.strip

:のような記事タイトルのhtmlルックスフォーラムで

<a href="showthread.php?t=233891" >&lt;/body&gt; on Footer ?</a>

私は、XPathからこの文字列を受け取るの &lt;/body&gt; on Footer ?

私は、Webブラウザの </body> on Footer ?

で見ることができるもの取得したいと思い

私はすべてのHTMLエスケープ文字のためにそれを行うことができますどのように/エンティティ?

役に立ちましたか?

解決

アンエスケープに、この記事にhref="https://stackoverflow.com/questions/1600526/how-to-encode-decode-html-entities-in-ruby">

または

にhtmlentitiesする

と呼ばれるルビーのパッケージがあります
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top