Google Scholar からのデータ橋渡し

google.gif (3315 バイト)

Google ScholarはGoogleが提供する強力な学術文献検索エンジンです。この検索結果をRef for Windowsに簡単に読み込めるような橋渡しをします。


ダウンロード

uniref.gif (430 バイト)Ref 2000用 Google Scholar 橋渡しユーティリティーをダウンロードする

reficon.gif (1117 バイト)Ref 98用 Google Scholar 橋渡しユーティリティーをダウンロードする

インストールすると、自動的に設定画面が開きます。まずヘルプをよくお読みください。


機能

橋渡し機能とは、Google Scholarでエクスポートされたファイルの情報を、Ref fow Windowsで確実に読み込むことのできる標準タグ無しテキストファイル形式にしてクリップボードに送ることを言います。Ref for Windowsがインポート待機状態であれば、ボタンを一つ押すだけで、結果を読み込むことができます。

また、一番最初の取り込みにつづいて、Alkキイ(Shiftキイ、Ctrlキイ)を押しながら取り込みをすると、連続的に取り込まれます。それを、最後にまとめてインポートすることができます。

 連続取り込みは、少し注意が必要です。読み込みの項の注意をよく読んでください。

設定

Ref fow Windowsに読み込むことができるようにするためには、4つの設定が必要です。

1) Bridge.exe での設定

Google Scholarからの橋渡しを可能にするには、上で設定したファイルの形式とBridge.exeとを関連づけて置く必要があります。

bridge.gif (6928 バイト)

インストールした直後に Bridge が起動して、上図のようなダイアログが表示されます(Bridge.exeはRef for Windowsのフォルダから起動することもできます)。

そこで、使用するファイル形式を選択し、関連づけを設定しておきます。ファイル形式は BibTeX、EndNote、RefManの中から現在も今後も最も使用する可能性の少ない形式を指定してください。

この設定をすると、例えばBibTeX形式のファイル scholar.bib をダブルクリックすると、自動的にこのBridge.exeが起動されることになります。逆にこのように設定をすると、その設定が有効の間はBibTeX形式のファイルは他に使いようが無くなりますので注意してください。

ただし、すでに他のプログラムが使用するような設定がされている状態では、これでも関連づけがうまく行かない場合があります。その場合には3) エクスプローラなどのブラウザの設定で設定をし直してください。

 この設定を元に戻すには、エクスプローラの『ツール』−『フォルダオプション』で、ファイルタイプのタブを押し、登録されているファイルタイプの中から、該当する拡張子を選んで変更ボタンを押し、適切なプログラムと関連づけをし直してください。

『読み込んで、そのままクリップボードに送る』

このオプションをONにしておくと、読み込まれたファイルがそのまま変更なしで出力されます。ファイル取り込み機能を利用する場合に使います。連続取り込みモードを使用すると、ブラウザから直接一つ一つダウンロードするよりも便利です。ただし、このオプションをONにすると、Ref for Windowsに直接読み込むことはできません。通常はOFFにしておきます。

『クリップボード゙に書き込んだことを知らせる』

このオプションをONにしておくと、読み込むたびに「クリップボードに書き込みました。インポートできます。」というメッセージを表示します。特に連続取り込みをする時には役に立ちます。表示は約2秒間持続し、自動的に消えます。

2) Google Scholarでの設定

scholar.gif (2397 バイト)

Googel Scholarの『Scholar設定』のページの一番下の方に上図のような文献管理の欄があります。そこで、文献へのリンクを表示するオプションをOnにしてください。

ファイルの形式は、BibTeX, EndNote, RefManの中から、1) の設定と同じ形式を指定してください。そして、どの形式を選択したかを確認の上、右端の『保存』ボタンを押します。

 ただし、BibTeXを選んだ場合には、ブラウザによってはどうしても直接取り込まれない場合があります。その場合はEndNoteRefManに変更してください。

3) エクスプローラなどのブラウザでの設定

2)のように設定しても、Google Scholarで取り込みをするたびに、ファイルを開くかどうかを確認するダイアログが開いて、煩わしいことがあります。そのような場合には、以下の設定をします(Internet Explorerでの例です)。

エクスプローラの『ツール』−『フォルダオプション』から表示される画面で、『ファイルタイプ』タブをクリックします。そこで、取り込みに使用するファイル形式の拡張子を探します。沢山ありますが、めざすのは

.bib BibTeXFile
.enw EndNoteExportFile
.ris FefManExportFile

のどれかです(上の1)、2)で設定したファイルの形式に合わせてください)。そこで、『詳細設定』を押し、アクションがopenになっていることを確認して、『ダウンロード後に開く確認をする』のチェックを外し、OKを押して閉じます。これでファイルを開くかどうかのダイアログは表示されなくなります。

2) において関連付けの再設定が必要な場合には、例えば.bibの場合には『拡張子'BIB'の詳細』において変更を押し、推奨されたプログラムの中からBridge.exeを指定してください。

4) Ref for Windowsでの設定

選ばれたファイル形式が何であれ、それを変換してRef for Windowsには標準タグ無しテキストファイル形式ファイルとしてクリップボート経由で送ります。Ref for Windowsのリスト画面において『ファイル』−『インポート』−『タグ無しテキストファイル』を選択し、『詳細設定』で『標準設定に戻す』ボタンを押しておくと確実です(通常は標準設定になっています)。

また、リスト画面で『レコード』−『レコードを受ける』を使って読み込む場合には、特別な設定は必要ありません。この方が便利でしょう。

読み込み

Google Scholarからエクスポートをすると、すぐにBridge.exeが自動的に起動され、内容がクリップボードに書き込まれて準備完了状態となります。Ref for Windowsの標準タグ無しテキストファイルのインポートをクリップボード経由でおこなうと、新規のレコードとして読み込むこともできますが、リスト画面の『レコード』−『レコードを受ける』で読み込む方が、設定が全く必要無く、便利でしょう。

連続取り込み

取り込みのときに、同時にAltキイを押し続けていると、クリップボードには追記モード(Appendモード)で書き込まれます(Altキイ、Shiftキイ、Ctrlキイのどれを押しても同様の動作をしますが、Altキイが一番他の機能との干渉が無いようです)。それをまとめてインポートすると、一挙に読み込むことができます。何件でも取り込むことが可能ですが、もし前の取り込みの情報が失われると時間の無駄ですから、少しづつインポートし、再開するときには、最初だけは連続取り込みではない方法で取り込んでください(前の情報は消去されます)。

ただし、いくつかの注意点があります。

  1. 前に書き込まれた内容に続けて書き込まれることになりますので、ここで追記モード以外の取り込みをすると、それ以前の取り込みは全部キャンセルされます。連続取り込みの時は確実に取り込まれていることを確認しながら作業をしてください。
  2. 取り込みは瞬間的には終わりません。取り込みデータのリクエストがGoogleのサーバーに届いて、データが戻って来るのには一定の時間がかかります。Altキイなどを押しているか否かは、データが帰って来てから判断をすることになります。一番確実な方法は『設定の2) 』において『クリップボード゙に書き込んだことを知らせる』オプションをONにしておくことです(この設定は何時でも実行することが可能です)。このメッセージが出れば、クリップボードへ送る作業は終了したということですから、間違いがありません。連続取り込み作業の間はAltキイを押しっぱなしにするのが、一番確実です。
  3. 取り込みが終了したことを知らせるメッセージがブラウザの裏にかくれて、見えない場合があります。その場合でも一番下のタスクバーには表示がされます。この表示が出れば、連続取り込みは問題無く進んだということを意味します。無事に取り込まれた場合のメッセージは2秒以内に自動的に消えます。

ただし、このようにして読み込まれた状態ではフル情報は提供されていません。たとえばAbstract(Comment)は空白のままです。一部の情報は欠落していることもあります。この場合、レコード画面で『ツール』−『プラグインユーティリティー』を使用すると、PubMedからの情報であれば、簡単に詳細情報を読み込んだり、PDFファイルをダウンロードしたりすることが可能です。

文字コードの問題点

ダウンロードされる文字が通常では8ビット文字であるため、漢字とヨーロッパ系の文字(ウムラウトなど)が共存できません。この問題を処理しようとしているのは、現状ではBibTeX形式のみです(2006年9月1日現在)。例えばBibTeXでは

title={{Die Grundlage der allgemeinen Relativit{\"a}tstheorie}},

と出力しますが、EndNote形式では

%T Die Grundlage der allgemeinen Relativit?tstheorie

のように無視して?に置きかえているだけです。RefMan形式も同様です。

BibTeXではバックスラッシュを無理して倍角のバックスラッシュに置きかえています。この処理方法は間違っているので、そのうち正しく ¥記号で出力するように変更されると思います。

この橋渡しユーティリティーは基本的にshift-JIS文字を処理するように作成されていますが、Ref 2000用のユーティリティーではユニコードを内部処理に使っています。表面上では機能上での違いはほとんどありませんが、BibTeX形式の読み込みの場合には、特殊文字を正しく処理して、ユニコード文字に変換した上でクリップボードにユニコードテキスト形式で書き込みます。Ref 2000はそれを正しく読み込み、ユニコード文字として取り込みます。例えばウムラウトの付いた文字やギリシャ文字などが書き込まれたBibTeX形式であれば、この方法は有効です。


greenball.gif (257 バイト)ホームページに戻る