検索エンジンは、JavaScriptで生成されたWebページをインデックス化できますか?

StackOverflow https://stackoverflow.com/questions/826275

質問

Googleなどの検索エンジンは、JavaScriptで生成されたWebページをインデックスに登録できますか? JavaScriptによって生成された(たとえばGWTを使用して)ページでソースを右クリックして選択すると、動的に生成されたHTMLは表示されません。検索エンジンでも生成されたHTMLを見ることができない場合、インデックスを作成する必要はほとんどないでしょうか?

役に立ちましたか?

解決

あなたの疑いは正しい-JSで生成されたコンテンツは、検索ボットに見えるように頼ることはできません。また、JSをオフにした人は誰も見ることができません。そして、前回作業中のサイトにテストを追加しました(これは月に数十万人のユニークなビスタがいる大規模なメインストリーム視聴者サイトでした) 、ユーザーの約10%がJavascriptを実行していませんでした。これには、検索ボット、JSが無効になっているPCブラウザー、多くのモバイル、スクリーンリーダーを使用している視覚障害者などが含まれます。

これが、JS(代替オプションなし)を介して生成されたコンテンツが本当に悪いアイデアである理由です。

基本に戻ります。最初に、RESTのような原則に基づいて(少なくとも状態の変更にPOSTリクエストが必要な範囲で) bare-bones(X)HTML を使用してサイトを作成します。単純なセマンティックマークアップ。CSSとJavascriptを忘れます。

ステップ1は、それを正しく行い、サイト全体(または意味のある限り)を検索ボットやLynxのようなユーザーエージェントに対してこのようにうまく機能させることです。

次に、ビジュアルレイヤーを追加します。CSS/グラフィック/メディアを視覚的に洗練しますが、元の(X)HTMLマークアップを大幅に変更しないでください。オリジナルのテキストのみのサイトがそのまま機能するようにします。マークアップをきれいに保ちます!

3番目は、動作レイヤーを追加することです:Javascript(Ajax)。 Ajax対応のJSを使用しているユーザー/ブラウザ向けに、エクスペリエンスをより速く、よりスムーズに、より快適にするものを提供してください。 Javascriptを使用しないユーザーも引き続き歓迎します。検索ボット、視覚障害者、多くのモバイルなども同様です。

これは、Webデザイン界ではプログレッシブエンハンスメントと呼ばれます。こうすれば、あなたのサイトはすべての人にとって合理的な形で機能します。

他のヒント

  

検索エンジンでも生成されたHTMLを見ることができない場合、インデックスを作成する必要はあまりありません

これで要約できます。技術的には、検索エンジンがボット/スパイダー用のJavaScriptエンジンを実装するのを止めることはありませんが、通常は行われません。可能ですが、できません。

一方、検索エンジンのユーザーエージェントを探り、読みやすいものを提供することができます。しかし、検索エンジンは通常これを好まないため、通常のブラウザに送信するものとの違いを検出した場合、かなり厳しく罰せられます。

良い経験則: Lynx でそれを見ることができれば、 Googleでインデックスを作成できます。

Lynxは優れたテストです。視覚障害者のスクリーンリーダーがあなたのページをどのように見るかについてのアイデアも得られるからです。

はい、Google(およびほとんどの場合Bing)は動的に生成されたHTMLのインデックスを作成します。詳細はこちらをご覧ください: http://searchengineland.com/tested-googlebot- crawls-javascript-heres-learned-220157

Googleは、単純なJavascriptを実行して一部のコンテンツを発見していますが、完全なスクリプトを実行することはできません。 SEOが心配な場合は、ページの静的バージョンの提供を検討する必要があります。

GWTでこれを処理する方法はいくつかあります。これはこのテーマに関する素晴らしい議論です。 SEOコンテンツがGWTルートを介して提供されるものと同一である限り、ユーザーエージェントがボットの場合、静的SEOコンテンツを提供するのが最良のオプションのようです。これには多くの作業が必要になる場合がありますが、検索エンジン向けに最適化された完全にリッチなGWTアプリが本当に必要な場合は、価値があるかもしれません。

単一ページインターフェース SPI( AJAX集中型)アプリケーションは、Googleおよび他のクローラーによってインデックスを取得できます。難易度は、使用するWebフレームワークによって異なります。

基本的な JavaScript を実行しても、ほとんどのWebサイトは LIBRARIES および FRAMEWORKS を使用しますが、Googleボットのようなボットはそう思わないまたは他のスパイダーもWebページにリンクされた Js ファイルをロードし、ロードしないとJSコードはエラーを生成します。

/*Correct Me If I am wrong*/
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top