SelfDOIについて

今年から国内の機関リポジトリで各大学が独自にDOIを設定出来るようになるそうです。 http://www.nii.ac.jp/irp/archive/system/jalc

この管理入力についてのガイドラインが公開されたので、見てみました。

使用できるDOIには、JaLC DOIとCrossRef DOIの2種類があり、対象と費用が異なっています。 CrossRefの方が対象が限られており、1データあたり1ドルの費用が必要になります。 どちらを選択することもできますが、1データに入力できるのはどちらか1つになります。

システム的には入力時にどちらにするか選べる必要があることになります。 更に、どちらも選択する事が出来ないようにする必要があります。

OAI-PMHで出力するメタデータ

OAI-PMHで出力するメタデータは、junii2でオプショナルな要素とされているものが使用されています。

まずselfDOI項目のraという属性でJaLCなのかCrossRefなのかを指定します。 加えて、JaLCの場合は、creatorのid属性、CrossRefの場合はタイトル等のlang属性です。

どちらも今までjunii2のガイドラインに出てきていない要素ですので対応していないところも多いのではないでしょうか。 Earmasの場合、何かしらの対応が必要になります。

creatorのid属性は、なんとでもなりそうですが、lang属性の機能追加は大変です。

  • 「言語」項目の値を見て自動で設定する
  • 入力フィールドの横に言語選択を追加する
  • 入力されている内容を見てアルファベットと記号だけなら英語にする

といった対応が考えられますが、「言語」項目の値のとおりに入力されているかどうかは何の保証もありませんし、 入力フィールドの横に言語選択を追加するのは入力が面倒です。入力されている内容がアルファベットかどうかで判断 するのは正確さに疑問が残ります。

現実的な落とし所としては、CrossRefを使用する場合は入力時にちゃんとチェックをし、うっかり防止で指定の項目がアルファベットのみかどうかのチェックをして、lang属性はenにする。というところではないかと思われます。

入力時のチェックに関する問題

JaLCとCrossRefのどちらも、使用できる対象のデータのNiiTypeが決まっており、それ以外のNIItypeのデータには使用できません。 CrossRefを使用する場合は、データ入力に関する制限がjunii2とは異なっており雑誌に関数情報や、書籍に関する情報が必須になっていたりします。

selfDOIを使っている場合、内容によりJaLCとCrossRefかを判断し、必須項目のチェック、入力値のチェックを変える必要があります。 これは、汎用のシステムでは無理でこれにシステム的に対応しようとすると、ほとんど専用のシステムになります。

また、この仕様がどの程度確定した情報なのかもわからないため、費用かけて機能追加して1年で仕様が変更になるといった事も考えられます。

OpenEarmasでは専用のチェック機能を付け、有効にした場合、データ登録時に入力内容をチェックする、といった感じで想像しています。

データ自体に関する制限

システムのデータに関する制限として

  • NIItypeは変更できない。
  • selfDOIを入力したデータを削除した場合、使用したDOIが欠番になる。
  • 登録したselfDOIを削除する場合、一度selfDOI項目を空にしてハーベストされるまで待つ必要がある、使用したselfDOIは欠番になる。

という制限があり、運用上の色々と問題が考えられます。

selfDOIを連番で振っている場合はそれほど大きな問題になりませんが、オープンアクセスサミットでの北海道大学での事例(http://www.nii.ac.jp/irp/event/2014/OA_summit/docs/1_03.pdf)のように 「紀要タイトル+巻号+ページ」とする場合、運用によっては問題が出てきそうです。

selfDOIを間違えてしまった場合

例えば「紀要タイトル+巻号+ページ」のページを間違えて前の論文と間違えていた場合

正しい
A論文のselfDOI : abc.123.1
B論文のselfDOI : abc.123.10

間違い
A論文のselfDOI : abc.123.10
B論文のselfDOI : abc.123.1

この場合、どうしようもありません。修正する方法がなく、消すと欠番になるため、このような間違いをした場合、 この規則とは外れるデータを登録することになります。

公開を間違えてしまった場合

まだ公開するつもりではなかったデータを誤って公開してしまった場合、一旦取り下げて再度公開する事があります。 この場合、selfDOIが欠番になるため、やはり「紀要タイトル+巻号+ページ」という規則とは異なるデータを登録することになります。

使用したselfDOIの管理

使用中と欠番となったselfDOIの値を間違って入力してしまわないように管理する必要があります。

使用中のselfDOIの値、公開データを削除して欠番になった場合のみでしたら、システム内にあるデータとの突き合わせをすればいいだけですが、selfDOI項目の値を空にして欠番にした場合、 履歴をすべて保持しているシステム以外はシステム内にデータがないためチェックができません。

そのため、selfDOI項目については重複チェック用のデータを用意して、公開時に使用したselfDOIを追加していくといった処理が必要になります。OpenEarmasでもこの方法になります。

selfDOIの修正処理

ガイドラインには修正時の処理は書かれていませんので、直接値を修正して良いのかどうかはわかりません。ガイドラインに書かれていることだけで対応すると、修正する場合は

  1. selfDOIの値を消す
  2. ハーベストされるまで待つ
  3. selfDOIの値を直す
  4. ハーベストされるまで待つ

という事になります。少なくとも2回ハーベストされる必要があるため、修正は反映されるまで機関によっては2ヶ月3ヶ月かかるという事になります。

selfDOIを使用する場合

まず、selfDOIを連番にするか規則を元に手入力するかを検討する必要があります。

連番にする場合は特に問題はありませんが、規則を元に手入力するは、規則のとおりに入力できなくなった時の対応を考えておく必要があります。

その上で、入力チェックをどこまでやるのか、雑誌単位での自動付番をするのか等を検討することになります。

何にせよまずは、信用できる業者に相談してみるのがいいのではないでしょうか。
(例えば ENUTechnologiesのような・・・)