Google Scholarバッチ検索を行い、結果の数だけを取り戻すにはどうすればよいですか?
-
03-10-2019 - |
質問
Scholar.google.com(染色体領域のリスト)で検索したいことの大きなリストがあり、各検索用語の結果の数のみにしか望んでいません。誰かがこれを行うための最良の方法を知っていますか?
解決
このRubyスクリプトを使用できます
#!/usr/bin/ruby
require 'net/http'
require 'uri'
def number_of_results(search_query)
url = 'http://scholar.google.com/scholar'
query = '?hl=en&btnG=Search&as_sdt=2001&as_sdtp=on&q='+search_query
url = URI.parse(url)
page = Net::HTTP.new(url.host).get(url.path + query).body
if page =~ /of about <b>([0-9,]*)<\/b>\./
return $1
else
return nil
end
number_of_results(ARGV.join(' '))
ターミナル/コンソールから電話をかけます search.rb search term
また、用語の配列がある場合
['foo','bar','baz','quux'].each {|term|
puts number_of_results(term)
}
所属していません StackOverflow