Manuel
2017-06-01 04:40:03 UTC
私が定期的に直面している大きな問題の1つは、バイオインフォマティクスデータ(RefSeqリリースやNCBIゲノムリリースなど)をダウンロードするためのURLが消えることです。
これに対する良い解決策はありますか?
>
動作を停止した特定のURLの例はありますか?一部のプロジェクトは、パーマリンクを提供するために非常に懸命に努力しています。
ゲノムリリースはバージョン管理されているため、URLは移動する可能性がありますが、データはまだそこにあります。
安定したURLを探しているプラットフォームやデータの種類を指定できますか?多くのサイトは、大きなダウンロード用のftpサーバーを提供しています
これは良い質問だと思います。おそらく小さな変更が加えられます。大きなデータベースのURIが消えることはめったにありませんが、安定した識別子が常に明確にマークされているとは限りません(たとえば、Ensemblはデフォルトで安定したURIではなく「現在の」リリースになっています)。
質問はいくつかの例で味付けする必要がありますが、それは非常に良い点になります。
私はNCBIのもの、たとえば、GRCh37の最新リリースが消えてUCSCテーブルから補間する必要があるdbSNPについて言及していました。