質問:
安定したダウンロードURL
Manuel
2017-06-01 04:40:03 UTC
view on stackexchange narkive permalink

私が定期的に直面している大きな問題の1つは、バイオインフォマティクスデータ(RefSeqリリースやNCBIゲノムリリースなど)をダウンロードするためのURLが消えることです。

これに対する良い解決策はありますか?

>
動作を停止した特定のURLの例はありますか?一部のプロジェクトは、パーマリンクを提供するために非常に懸命に努力しています。
ゲノムリリースはバージョン管理されているため、URLは移動する可能性がありますが、データはまだそこにあります。
安定したURLを探しているプラ​​ットフォームやデータの種類を指定できますか?多くのサイトは、大きなダウンロード用のftpサーバーを提供しています
これは良い質問だと思います。おそらく小さな変更が加えられます。大きなデータベースのURIが消えることはめったにありませんが、安定した識別子が常に明確にマークされているとは限りません(たとえば、Ensemblはデフォルトで安定したURIではなく「現在の」リリースになっています)。
質問はいくつかの例で味付けする必要がありますが、それは非常に良い点になります。
私はNCBIのもの、たとえば、GRCh37の最新リリースが消えてUCSCテーブルから補間する必要があるdbSNPについて言及していました。
1 回答:
#1
+4
Matt Bashton
2017-06-03 18:36:29 UTC
view on stackexchange narkive permalink

Persistent Uniform ResourceLocatorまたはPURLはそのようなソリューションの1つであり、ドメイン名の変更に耐えられると想定される限り、パーマリンクよりも少し堅牢になるように設計されています。バイオオントロジーコミュニティはすでにそれらを使用しています http://purl.bioontology.org/docs/index.html



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...