質問:
KEGGから代謝経路の遺伝子名を抽出するにはどうすればよいですか?
becko
2017-09-24 16:14:22 UTC
view on stackexchange narkive permalink

注:この質問は Biostarsでも質問されています

解糖に関与する遺伝子名のリストを取得する必要があります(例)。手動ではなく、スクリプトでこれを行う必要があります。理想的にはPythonを使用します。 KEGGはこれを行うのに適切なデータベースだと思いますが、他の(無料の)提案でもかまいません。

どうすればよいですか?

あなたの知る限り、metaCyc、reactomeなどの他の代謝経路があります...
この質問がBiostarsに再投稿されていることがわかりました。解決策は次のとおりです[https://www.biostars.org/p/274321/#274326](https://www.biostars.org/p/274321/#274326)
三 答え:
terdon
2017-09-24 17:39:49 UTC
view on stackexchange narkive permalink

KEGG APIを使用してこの小さなスクリプトを作成しました:

#!/ usr / bin / env python3import urllib.requestimport reimport syspathway = 'hsa00010'#glycolysisurl = "http://rest.kegg.jp/get/" + Pathwaywith urllib.request.urlopen(url)as f:lines = f.read()。decode( ' utf-8 ')。splitlines()want = 0 for line in lines:fields = line.split()##遺伝子のリストはここから始まりますif fields [0] ==' GENE ':want = 1 ##行GENEは異なりますprint(fields [2] .rstrip( ';'))##ファイルの次のセクションに到達しましたelif want == 1 and re.match( '^ \ S'、line):sys.exit (); ## want == 1およびlen(fields)>1:print(fields [1] .rstrip( ';')) の場合、まだ遺伝子のリストにあります
Pierre
2017-09-24 19:20:25 UTC
view on stackexchange narkive permalink

togowsのRESTAPIを使用する:kegg経路に関連付けられた遺伝子のjson構造をフェッチできます。例: http://togows.org/entry/kegg-pathway/hsa00010/genes.json

  [{"3101": "HK3; hexokinase 3 [ KO:K00844] [EC:2.7.1.1] "、" 3098 ":" HK1;ヘキソキナーゼ1 [KO:K00844] [EC:2.7.1.1] "、" 3099 ":" HK2;ヘキソキナーゼ2 [KO:K00844] [EC:2.7.1.1] "、" 80201 ":" HKDC1; 1を含むヘキソキナーゼドメイン[KO:K00844] [EC:2.7.1.1] "、" 2645 ":" GCK;グルコキナーゼ[KO:K12407] [EC: 2.7.1.2] "、" 2821 ":" GPI;グルコース-6-リン酸イソメラーゼ[KO:K01810] [EC:5.3.1.9] "、" 5213 ":" PFKM;ホスホフルクトキナーゼ、筋肉[KO:K00850] [EC :2.7.1.11] "、" 5214 ":" PFKP;ホスホフルクトキナーゼ、血小板[KO:K00850] [EC:2.7.1.11] "、" 5121 ":" PFKL;ホスホフルクトキナーゼ、肝臓型[KO:K00850] [EC: 2.7.1.11] "、" 2203 ":" FBP1;フルクトース-ビスホスファターゼ1 [KO:K03841] [EC:3.1.3.11] "、" 8789 ":" FBP2;フルクトース-ビスホスファターゼ2 [KO:K03841] [EC: 3.1.3.11] "、" 230 ":" ALDOC;アルドラーゼ、フルクトース-ビスホスフェートC [KO:K01623] [EC:4.1.2.13] "、" 226 ":" ALDOA;アルドラーゼ、フルクトース-ビスホスフェートA [KO:K01623] ] [EC:4.1.2.13] "、 "229": "ALDOB;アルドラーゼ、フルクトース二リン酸B [KO:K01623] [EC:4.1.2.13] "、" 7167 ":" TPI1;トリオースリン酸イソメラーゼ1 [KO:K01803] [EC:5.3.1.1] "、" 2597 ":" GAPDH;グリセルアルデヒド-3-リン酸デヒドロゲナーゼ[KO:K00134] [EC:1.2.1.12] "、" 26330 ":" GAPDHS;グリセルアルデヒド-3-リン酸デヒドロゲナーゼ、精子形成[KO:K10705] [EC:1.2.1.12] "、" 5232 ":" PGK2;ホスホグリセリン酸キナーゼ2 [KO:K00927] [EC:2.7.2.3] "、" 5230 ":" PGK1;ホスホグリセリン酸キナーゼ1 [KO:K00927] [EC:2.7.2.3] "、" 5223 ":" PGAM1;ホスホグリセリン酸ムターゼ1 [KO:K01834] [EC:5.4.2.11] "、" 5224 ":" PGAM2;ホスホグリセリン酸ムターゼ2 [KO:K01834] [EC:5.4.2.11] "、" 441531 ":" PGAM4;ホスホグリセリン酸ムターゼファミリーメンバー4 [KO:K01834] [EC:5.4.2.11] "、" 2027 ":" ENO3;エノラーゼ3 [KO:K01689] [EC:4.2.1.11] "、" 2026 ":" ENO2;エノラーゼ2 [KO:K01689] [EC:4.2.1.11] "、
"2023": "ENO1;エノラーゼ1 [KO:K01689] [EC:4.2.1.11]"、 "5315": "PKM;ピルビン酸キナーゼ、筋肉[KO:K00873] [EC:2.7.1.40]"、 "5313 ":" PKLR;ピルビン酸キナーゼ、肝臓およびRBC [KO:K12406] [EC:2.7.1.40] "、" 5161 ":" PDHA2;ピルビン酸デヒドロゲナーゼアルファ2 [KO:K00161] [EC:1.2.4.1] "、 「5160」:「PDHA1;ピルビン酸デヒドロゲナーゼアルファ1 [KO:K00161] [EC:1.2.4.1]」、「5162」:「PDHB;ピルビン酸デヒドロゲナーゼ(リポアミド)ベータ[KO:K00162] [EC:1.2.4.1] "、" 1737 ":" DLAT;ジヒドロリポアミドS-アセチルトランスフェラーゼ[KO:K00627] [EC:2.3.1.12] "、" 1738 ":" DLD;ジヒドロリポアミドデヒドロゲナーゼ[KO:K00382] [EC:1.8.1.4] "、 "160287": "LDHAL6A; 6Aのような乳酸デヒドロゲナーゼA [KO:K00016] [EC:1.1.1.27]"、 "92483": "LDHAL6B; 6Bのような乳酸デヒドロゲナーゼA [KO:K00016] [EC:1.1.1.27] "、" 3939 ":" LDHA;乳酸デヒドロゲナーゼA [KO:K00016] [EC:1.1.1.27] "、" 3945 ":" LDHB;乳酸デヒドロゲナーゼB [KO:K00016] [EC:1.1.1.27] "、 "3948": "LDHC;乳酸デヒドロゲナーゼC [KO:K00016] [EC:1.1.1.27]"、 "124": "ADH1A;アルコールデイドロゲナーゼ1A(クラスI)、アルファポリペプチド[KO:K13951] [EC:1.1.1.1] "、" 125 ":" ADH1B;アルコールデヒドロゲナーゼ1B(クラスI)、ベータポリペプチド[KO:K13951] [EC:1.1.1.1] "、" 126 ":" ADH1C;アルコールデヒドロゲナーゼ1C(クラスI)、ガンマポリペプチド[KO:K13951] [EC:1.1.1.1] "、" 131 ":" ADH7;アルコールデヒドロゲナーゼ7(クラスIV)、ミューまたはシグマポリペプチド[KO:K13951] [EC:1.1.1.1] "、" 127 ":" ADH4;アルコールデヒドロゲナーゼ4(クラスII)、piポリペプチド[KO:K13980] [EC:1.1.1.1] "、" 128 ":" ADH5;アルコールデヒドロゲナーゼ5(クラスIII)、chiポリペプチド[KO:K00121] [EC:1.1.1.1 1.1.1.284] "、" 130 ":" ADH6;アルコールデヒドロゲナーゼ6(クラスV)[KO:K13952] [EC:1.1.1.1] "、" 10327 ":" AKR1A1;アルドケトレダクターゼファミリー1メンバーA1 [KO:K00002] [EC:1.1.1.2] "、" 217 ":" ALDH2;アルデヒドデヒドロゲナーゼ2ファミリー(ミトコンドリア)[KO:K00128] [EC:1.2.1.3] "、" 224 ":" ALDH3A2;アルデヒドデヒドロゲナーゼ3ファミリーメンバーA2 [KO:K00128] [EC:1.2.1.3] "、
"219": "ALDH1B1;アルデヒドデヒドロゲナーゼ1ファミリーメンバーB1 [KO:K00128] [EC:1.2.1.3]"、 "501": "ALDH7A1;アルデヒドデヒドロゲナーゼ7ファミリーメンバーA1 [KO:K14085] [EC:1.2。 1.3 1.2.1.8 1.2.1.31] "、" 223 ":" ALDH9A1;アルデヒドデヒドロゲナーゼ9ファミリーメンバーA1 [KO:K00149] [EC:1.2.1.3 1.2.1.47] "、" 221 ":" ALDH3B1;アルデヒドデヒドロゲナーゼ3ファミリーメンバーB1 [KO:K00129] [EC:1.2.1.5] "、" 222 ":" ALDH3B2;アルデヒドデヒドロゲナーゼ3ファミリーメンバーB2 [KO:K00129] [EC:1.2.1.5] "、" 220 ":" ALDH1A3 ;アルデヒドデヒドロゲナーゼ1ファミリーメンバーA3 [KO:K00129] [EC:1.2.1.5] "、" 218 ":" ALDH3A1;アルデヒドデヒドロゲナーゼ3ファミリーメンバーA1 [KO:K00129] [EC:1.2.1.5] "、" 84532 ":" ACSS1;アシル-CoAシンテターゼ短鎖ファミリーメンバー1 [KO:K01895] [EC:6.2.1.1] "、" 55902 ":" ACSS2;アシル-CoAシンテターゼ短鎖ファミリーメンバー2 [KO:K01895] [ EC:6.2.1.1] "、" 130589 ":" GALM;ガラクトースムタロターゼ[KO:K01785] [EC:5.1.3.3] "、" 5236 ":" PGM1;ホスホグルコムターゼ1 [KO:K01835] [EC:5.4。 2.2] "、" 55276 ":" PGM2; phosphoglucオムターゼ2 [KO:K15779] [EC:5.4.2.7 5.4.2.2] "、" 2538 ":" G6PC;グルコース-6-ホスファターゼ触媒サブユニット[KO:K01084] [EC:3.1.3.9] "、" 57818 ":" G6PC2;グルコース-6-ホスファターゼ触媒サブユニット2 [KO:K01084] [EC:3.1.3.9] "、" 92579 ":" G6PC3;グルコース-6-ホスファターゼ触媒サブユニット3 [KO:K01084] [EC:3.1.3.9] "、" 83440 ":" ADPGK; ADP依存性グルコキナーゼ[KO:K08074] [EC:2.7.1.147] "、" 669 ":" BPGM;ビスホスホグリセリン酸ムターゼ[KO:K01837] [EC:5.4.2.11 5.4.2.4] "、" 9562 ":" MINPP1;複数のイノシトール-ポリリン酸ホスファターゼ1 [KO:K03103] [EC:3.1.3.80 3.1.3.62] "、" 5105 ":" PCK1;ホスホエノールピルビン酸カルボキシキナーゼ1 [KO:K01596] [EC:4.1.1.32] "、" 5106 ":" PCK2;ホスホエノールピルビン酸カルボキシキナーゼ2、ミトコンドリア[KO:K01596] [EC:4.1.1.32] "}]  
gringer
2018-01-12 08:29:44 UTC
view on stackexchange narkive permalink

Biostarsからの回答:

GeneSCF 'prepare_database'モジュールは、対応する遺伝子を持つすべての経路をプレーンテキストファイルの単純なテーブル形式として抽出します。提供されたリンクから「2ステッププロセス」(小見出し)を確認します(最初のステップで作業が完了します)。


遺伝子の抽出には KEGG REST APIを使用できます経路からの名前。 Pythonリクエストライブラリを使用して、KEGG RESTAPIへのREST呼び出しとクエリ情報を行うことができます。 PythonプログラミングとRESTWebサービスの初心者の場合は、このチュートリアルに従ってください。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...