配列検索 よくあるご質問

よくあるご質問
質問
Q1
ホモロジー検 索 におけるスコア値 (Score) と同 一 性 (Identities) の関 係 は?
Q2
アライメント情 報 に表 示 されるハイフン (-),プラス (+),コロン (:) などの意 味 を知りたい.
Q3
BLAST ホモロジー検 索 の結 果 で,自 分 が作 成 した配 列 質 問 式 に含 めていない XXX や
NNN が表 示 されることがあります.なぜですか?
(低 分 子 領 域 とは?)
Q4
tBLASTn, tBLASTx, BLASTx を 実 行 * す る と , 結 果 の ア ラ イ メ ン ト 情 報 に Frame 1,
Frame 2 などが表 示 されます.この Frame の意 味 は?
ま た , 一 つ の 回 答 に 一 つ の Frame し か な い 場 合 と Frame 1, Frame 3 な ど 複 数 の
Frame が表 示 される場 合 があります.これはなぜですか?
* tBLASTn は REGISTRY フ ァ イ ル (BLAST), DGENE/PCTGEN/USGENE フ ァ イ ル (BLAST,
GETSIM) で利 用 可 能 .
tBLASTx と BLASTx は REGISTRY ファイル (BLAST) のみで利 用 可 能 .
Q5
ホモロジー検 索 でホモロジー検 索 で曖 昧 コードを使 用 した場 合 と使 用 しなかった場 合 のス
コア値 は同じですか?
例 えば,DGENE ファイルの曖 昧 コード R は A または G を意 味 しますが,コード R で
検 索 した時 の結 果 は,(コード A の結 果 OR コード G の結 果 ) と同 じになりますか
Q6
基 となる配 列 (質 問 式 A) と,その一 部 のコードを切 り取 った配 列 (質 問 式 B) の部 分
配 列 検 索 の結 果 は,下 記 の関 係 が成 立します.
質 問 式 A の回 答 件 数 ≦ 質 問 式 B の回 答 件 数
同じ関 係 が,ホモロジー検 索 の結 果 でも成 立 しますか?
Q7
環 状 の核 酸 ・タンパク質 を検 索 する方 法 は?
参考
下 記 サ イ ト に は , 上 記 以 外 の DGENE/PCTGEN/USGENE フ ァ イ ル の BLAST お よ び
GETSIM ホモロジー検 索 に関 する多 くの質 問 が記 載されています (英 語 資 料 ).
ぜひご覧 ください.
http://www.stn-international.com/fileadmin/be_user/STN/pdf/search_materials/Bioseq
uence_Searching/dgenefaq.pdf
1
よくあるご質問
Q1
ホモロジー検 索 におけるスコア値 (Score) と同 一 性 (Identities) の関 係 は?
A1
ホモロジー検 索 では,質 問 式 配 列 と回 答 配 列 が一 致 した局 所 領 域 について類 似 性 を,スコア
値 および同 一 性 パーセントで表しています.
スコア値 (Score)
・
配 列 質 問 式 および結 果 のコードの一 致 ,不 一 致 ,類 似 性 により,点 数 が決 まっており,そ
の点 数 を加 算していくことでスコア値 が算 出 されます.
- BLAST : 核 酸
Query: 67 ggagacgtagattcggagg
||||||||||||||||a||
Sbjct: 44 ggagacgtagattcggcgg
← 質問式
← 回答
デフォールト設 定 の場 合
コードが一 致
: 1 点
コードが不 一 致
: -3 点
- BLAST : タンパク質
選 択 した置 換 行 列 により,コードの点 数 が異 なります.
下 記 は,デフォールト BLOSUM 62 におけるマトリックスチャートです.
Query: 22 KPIKLVELINIHV
Sbjct: 565 KPIK+VELGKIHV
Sbjct: 565 KPIKIVELGKIHV
・
← 質問式
← 回答
K-K で一 致
L+I でファミリー一 致
I G で不 一 致
: 5 点
: 2 点
: -4 点
以 上 より,一 致 しているコード,ファミリーで一 致 しているコードが多 いほど,高 いスコア値 に
なります.
2
よくあるご質問
同 一 性 パーセント (Identitties)
・ 局 所 領 域 において塩 基 やアミノ酸 コードが一 致 している割 合を示 します.
Identities = 29/30 (96%)
Query:
16 caggttccctggtgcaggcagcgctgactc 45
|||||||||||||C||||||||||||||||
Subject: 65 caggttccctggtccaggcagcgctgactc 94
局 所 領 域 の配 列 長
一 致 しているコード数
⇒ 同 一 性 パーセント
: 30
: 29
: 29/30 (96%)
スコア値 (Score) と同 一 性 パーセント (Identities)の関 係
例 ) 質 問 式 の配 列 長 が 200 である場 合
(200 コードが完 全 に一 致 した時 のスコア値 を 400 と仮 定 し,100 コードが一 致した時 のスコア
値 を 300 と仮 定します.)
1. 質 問 式 の配 列 と完 全 に同 じ配 列 (配 列 長 200) のレコード
質問式
1
200
回答
1
200
200 コードが完 全 に一 致 する
スコア値 は 400
同 一 性 パーセント : 100% (200/200)
2. 全 配 列 長 が 400 で,質 問 式 の配 列 を完 全 に含 むレコード
1
質問式
回答
200
400
1
100
300
200 コードが完 全 に一 致 する
スコア値 は 400
同 一 性 パーセント : 100% (200/200)
3. 全 配 列 長 が 400 で,質 問 式 の一 部 の配 列 と完 全 に一 致 する配 列 を有 するレコード
回答
51
1
質問式
150
200
1
400
151
250
100 コードが一 致 する
スコア値 は 300
同 一 性 パーセント : 100% (100/100)
4. 全 配 列 長 が 150 で,質 問 式 の一 部 の配 列 と完 全 に一 致 する配 列 を有 するレコード
質問式
回答
51
1
1
31
150
130
200
150
100 コードが一 致 する
スコア値 は 300
同 一 性 パーセント : 100% (100/100)
・ 1. と 2. は回 答 の配 列 長 に関 わらず,局 所 領 域 で一 致 したコードの数 が同 じなので,スコア値
が同じです.(最 大 スコア値 )
・ 3. と 4. は同 一 性 パーセント (局 所 領 域 においてコードが一 致 している割 合 ) が 100% と高 い
ですが,1., 2. に比 べて一 致したコードが半 分 のため,スコア値が低 くなります.
3
よくあるご質問
Q2
アライメント情 報 に表 示 されるハイフン (-),プラス (+),コロン (:) などの意 味 を知りたい.
A2
アライメント情 報 に表 示 される記 号 は,核 酸 ,タンパク質 および BLAST,GETSIM ホモロジー
検 索 で異 なります.
・
核 酸 – REGISTRY BLAST および DGENE/PCTGEN/USGENE ファイルの BLAST
Query: 67 ggagacgtagattcggaggcggccaggcggcg
||||||||||||||||C||||||CA|||||||
Sbjct: 44 ggagacgtagattcggcggcggc—ggcggcg
・
← 質問式
← 回答
: 一致
: 不一致
: ギャップ (GAP)
:
空欄
.
-
:
:
:
:
一致
不一致
U と T の一 致
ギャップ (GAP)
タンパク質 – REGISTRY BLAST および DGENE/PCTGEN/USGENE ファイルの BLAST
Query: 22
QVGKGSVSPNAALVAEKISARSGAE
QVQ+NS+HR+AALVAEKISARSKL+
Sbjct: 565 QVQQNSLHRDAAL-------RSKLQ
・
← 回答
|
空欄
-
核 酸 – DGENE/PCTGEN/USGENE ファイルの GETSIM
29 na overlap starting at 546
aggagugguaggucuuagccagcuguaau
::T:T.CA.:TT.AC.:::::::.GU::.
agtattcatatttactagccagct--aat
・
← 質問式
コード
空欄
+
-
:
:
:
:
一致
不一致
アミノ酸 ファミリーの一 致
ギャップ (GAP)
:
:
:
:
一致
不一致
アミノ酸 ファミリーの一 致
ギャップ (GAP)
タンパク質 – DGENE/PCTGEN/USGENE ファイルの GETSIM
31 aa overlap starting at 569
qlkkflkialetparicp_inysllasllpk
::.::::.:..::.r.n:s:.l:s:.:l.::
qlrkflklaiktpvwlnpsitlsslgs_fpk
:
空欄
.
-
ギャップ (GAP) は質 問 式 または回 答 の配 列 に挿 入 されることがあり,ギャップが挿 入 されると,
スコア値 は下 がります.
4
よくあるご質問
Q3
BLAST ホ モ ロ ジ ー 検 索 の 結 果 で , 自 分 が 作 成 し た 配 列 質 問 式 に 含 め て い な い XXX や
NNN が表 示 されることがあります.なぜですか?
A3
REGISTRY BLAST で , Low Complete Filtering に チ ェ ッ ク が 付 い た 情 報 で 検 索 , ま た は
DGENE/PCTGEN/USGENE ファイルの BLAST で,デフォールト (オプションで -F F を付 与
しない) 検 索 すると,配 列 質 問 式 の低 複 雑 度 領 域 * にマスクフィルタリングが行 われます.
フィルタリングが行 われるのは,質 問 式 に対 してのみで,データベースの配 列 には行 われません.
フィルタプログラムにより見 つけられた配 列 質 問 式 の低 複 雑 度 領 域 は,塩 基 配 列 の場 合 は N,
アミノ酸 配 列 の場 合 は X の文 字 で置 き換えられます.
例 ) アミノ酸 の配 列 質 問 式
NLDDNKNTGIFIISARGGIEGLQQKLWTGISIAIAQAAAALEGLRIAATLQGDNQ
Query:
Subject:
NLDDNKNTGIFIISARGGIEGLQQKLWTGXXXXXXXXXXXXXXXXXXXTLQGDNQ
NLDDNKNTGIFIISARGGIEGLQQKLWTGISIAIAQAAAALEGLRIAATLQGDNQ
NLDDNKNTGIFIISARGGIEGLQQKLWTGISIAIAQAAAALEGLRIAATLQGDNQ
* 低 複 雑 領 域 とは,ホモポリマー領 域 ,短 周 期 リピート,特 定 残 基 への偏 りなど,偏 った組 成
を持った配 列 領 域 のことです.(例 : proline-rich 領 域 ,poly A tails など)
一 般 に,低 複 雑 度 領 域 は構 造 的 な偏 りが反 映 され,BLAST プログラムでは非 常 に高 いス
コアがつく傾 向 があります.このような配 列 は,統 計 的 には有 意 (スコアが高 い) であっても
生 物 学 的 には類 似 度 は高 くないということになります.そのため,フィルタリングを行 うことに
より,このような低 複 雑 度 領 域 に対 する一 致 など,有 意 でない一 致 を結 果 から除 くことがで
きます.
5
よくあるご質問
Q4-1 tBLASTn, tBLASTx, BLASTx を実 行 * すると,結 果 のアライメント情 報 に Frame 1, Frame 2
などが表 示 されます.この Frame の意 味 は?
A4-1 3 つの核 酸 が 1 つのアミノ酸に翻 訳 されます.
tBLASTn, ではデータベース中 の核 酸 配 列 を,tBLASTx, BLASTx では質 問 式 中 の核 酸 配 列
をアミノ酸 配 列 に翻 訳 する際 に,3 つの核 酸 をどこから括 り始 めるかにより翻 訳 されるアミノ酸
にバリエーションが生じます.
この際 の読み枠 を Frame (フレーム,読 み枠 ) と呼 びます.
Frame (フレーム,読 み枠 )
・ Frame をずらせば,一 本 の核 酸 配 列 から三 本 のアミノ酸 配 列 を作 成 できます
また核 酸 には相 補 鎖 もあるので,相 補 鎖 からも,三 本 のアミノ酸 配 列 が作 成 されます.
よって,合 計 6 通 りのアミノ酸 配 列 が作 成され,検 索 に利 用されます.
Frame 1
Frame 2
Frame 3
3’
5’
G T C A A T C A G C A C C T T T G T G G T
C A G T T A G T C G T G G A A A C A C C A
5’
アミノ酸 配 列 に翻 訳 すると,
Frame 1 の場 合
VNQHLCG
Frame 2 の場 合
SISTFV
Frame 3 の場 合
QSAPLW
(相 補 鎖 )
3’
・ Universal Genetic Code Table (遺 伝 子 コード表 ) : 核 酸 をアミノ酸 に翻 訳 する際 に使 用 される表
1: 表 中 の T は T または U を表 現 しています
6
よくあるご質問
例 ) 下 記 のアミノ酸 配 列 を REGISTRY ファイルの tBLASTn で検 索 する.
TVDQHLCGSHLVEALYSVWVHEAKGLPRAAAGAPGVRAELWLDGALLARTAPRAGPG
QLFWAERFHFEALPPARRLSLRLRGLGPGSAVLGRVALALEELDAPRAPAAGLERWF
- ヒットしたホモロジー検 索 の回 答 例
RN 903919-84-6
Length = 351
Score = 35.0 Expect = 7.1
Identities = 15/17 (88%) Positives = 16/17 (94%)
Frame = +3
Query:
2 VDQHLCGSHLVEALYSV 18
V+QHLCGSHLVEALYSV
Subject: 93 VNQHLCGSHLVEALYLV 143
・ 対 応 する RN 903919-84-6 の全 配 列 長 を REGISTRY ファイルで表 示 (SQD 表 示 形 式 )
RN
FS
SQL
NA
903919-84-6 REGISTRY
NUCLEIC ACID SEQUENCE
351
65 a
93 c
100 g
93 t
PATENT ANNOTATIONS (PNTE):
Sequence |Patent
Source
|Reference
=========+==============
Not Given|IN190003
ここから核 酸 配 列 の 翻 訳 を
|unclaimed PAGE
開 始 したので,Frame = +3
|7
SEQ
1
51
101
151
201
251
301
351
aattcatggg cctatggatc cgtctactgc ctctgatcgc gctgctgatc
ctctggggac cggatccagc tgcggccgaa ttccggatgt ttgtcaatca
gcacctttgt ggttctcacc tggtggaggc tctgtacctg gtgtgtgggg
aacgtggttt cttctacaca cccaagaccc gtcgtgaagc tgaagacctt
caagtgggtc aagttgaact tggtgggggt cctggtgcgg gttctcttca
a c c t t t gFrame
g c t c3t cから核
g a g g g酸
a のアミノ酸
t c a c t t cへの翻
aaaa 訳
g cを開
g t g始
g cすると,塩
a t t g t g基
g aコード
g c a g t93 番 目
g c t g c a cから
c a g 143
c a t番
c t目
g cで翻
t c c訳 cされたアミノ酸
t c t a c c a a c (VNQHLCGSHLVEALYLV)
t g g a g a a c t a c t g c a a c t gが質
a 問式
g
のアミノ酸 配 列 と類 似 していた
**RELATED SEQUENCES AVAILABLE WITH SEQLINK**
Q4-2 また,一 つの回 答 に一 つの Frame しかない場 合 と Frame 1, Frame 3 など複 数 の Frame が
表 示 される場 合 があります.これはなぜですか?
A4-2 Frame が一 つしか表 示 されない回 答 は,それ以 外 の Frame とは類 似 性 が無 いことを意 味 し
ています.
複 数 の Frame で類 似 性 が生 じた場 合 は,その類 似 性 のあるヒットした Frame がすべて表 示
されます.
7
よくあるご質問
Q5
ホモロジー検 索 で曖 昧 コードを使 用 した場 合と使 用 しなかった場 合 のスコア値 は同じですか?
例 えば,DGENE ファイルの曖 昧 コード R は A または G を意 味 しますが,コード R で検 索
した時の結 果 は,(コード A の結 果 OR コード G の結 果 ) と同 じになりますか?
A5
いいえ,スコア値は異 なります.
コード R で検 索 した結 果 は,(コード A の結 果 OR コード G の結 果 ) の結 果とは異 なります.
理 由 : 使 用 するコードにより,スコア値 を算 出 するための点 数 が異 なるためです.
・ GETSIM の核 酸 検 索 のマトリックス
- 質 問 式 中 のコード R が回 答 のコード A または G でヒットした時 は 2 点
- 質 問 式 中 のコード A が回 答 のコード A でヒットした時 は 5 点
- 質 問 式 中 のコード G が回 答 のコード G でヒットした時 は 5 点
点 数 が異 なればスコア値 にも影 響 します
8
よくあるご質問
Q6
基 となる配 列 (質 問 式 A) と,その一 部 のコードを切 り取 った配 列 (質 問 式 B) の部 分 配 列
検 索 の結 果 は下 記 のようになりますが,同じ関 係 がホモロジー検 索 の結 果 でも成 立 しますか?
質 問 式 A の回 答 件 数 ≦ 質 問 式 B の回 答 件 数
A6
いいえ,成 立しません.
部 分 配 列 検 索 の結 果 は,質 問 式 の配 列 を含 むすべての配 列 が得 られますが,ホモロジー検
索 では,質 問 式 の配 列 と局 所 領 域 において類 似 した配 列 が得 られます.そのため,通 常 は配
列 長 の長 い質 問 式 A の回 答 件 数 の方 が,質 問 式 B の回 答 件 数 より多 くなります.
(検 証 ) 下 記 の 2 つのアミノ酸 配 列 を REGISTRY ファイルで検 索 する.
・ 質 問 式 A (配 列 長 250)
KYCLNWRHQS
SDACTNLDDN
IAATLQGDNQ
HQLKDKETIQ
AGCSDISSCI
VKLFARSLDR
KNTGIFIISA
VLAITKEFMT
SSDFFVYSKR
ARCVENGLPK
LFGLDHAFSW
RGGIEGLQQK
PVPEDVIHEQ
IFFNGSILSQ
DAAYIQNIIM
IHVRLTNSTM
LWTGISIAIA
LSEAMSRYKR
CLKNFSKLTT
TRLQLLLDHY
YVADPFNPPD
QAAAALEGLR
TFTYLNYLMG
NATTLAENTV
YSMHGGINSE
・ 質 問 式 B (配 列 長 50) : 質 問 式 A の一 部 (上 記 の網 掛 け部 分 ) の配 列
KYCLNWRHQS VKLFARSLDR LFGLDHAFSW IHVRLTNSTM YVADPFNPPD
(検 索 )
質問式
A
B
部 分 配 列 検 索 の結 果 (件 数 )
1
3
BLAST ホモロジー検 索 の結 果 (件 数 )
800
452
BLAST ホモロジー検 索 の結 果 で,質 問 式 A のみで得 られた回 答 例
① CAS 登 録 番 号 821688-36-2
質問式 A
質 問 式 A の 4 ~ 219 番 目 の コ ー ド と 821688-36-2 の 605 ~ 829
番 目 のコードが類 似 していました.
質 問 式 B で考 えた場 合
質 問 式 B の 4~42 番 目 のコードに対 して,821688-36-2 の 605~
647 番 目 のコードが対 応 しています (上 記 の枠 内 ).しかしこの 2 つの
コード間 では一 致 しているコードが少 なく,さらに GAP も入 っています
ので,類 似 性 は非 常 に低 いと考 えられます.そのため,質 問 式 B の回
答 に 821688-36-2 が含 まれていなかったと思 われます.
9
よくあるご質問
② CAS 登 録 番 号 1375769-78-0
質 問 式 A の 112~195 番 目 のコード と 1375769-78-0 の 259~339
番 目 のコードが類 似 していました.
つまり,質 問 式 A の 1~50 番 目 のコード (= 質 問 式 B) に対 しては,
1375769-78-0 のコードは類 似 性 がありませんでした.
10
よくあるご質問
Q7
環 状 の核 酸 ・タンパク質 を検 索 する方 法 は?
A7
REGISTRY ファイル
・ 完 全 な環 状 であれば,特 別 な登 録 処 理 がされており,いずれの位 置 から始 めても検 索 出 来
るようになっています.
・ NTE フィールドに環 化 (CYCLIC) と収 録されます.
検 索 式 : => S コード/SQEP AND CYCLIC/NTE
DGENE/PCTGEN/USGENE ファイル
・ ある位 置 で切 断 され,鎖 状 で登 録されているため,開 始 位 置 を考 慮 する必 要 があります.
・ 環 化 の場 合 は,FEAT フィールドや標 題 ・抄 録 中 に CYCLIC のキーワードが収 録 されてい
る場 合が多 いので,必 要 に応じて環 化 のキーワード/FEAT で検 索 します.
検 索 式 : => RUN GETSEQ コード/SQEP AND CYCL?/FEAT (または CYCL?)
<検 索 例 : 下 記 の環 状 ペプチドを調 査 する>
Gly (G)
Asp (D)
Arg (R)
Lys (K)
Tyr (Y)
REGISTRY ファイル
・ 上 記 の環 状 ペプチドは完 全 な環 状 なので,GDYKR/SQEP, DYKRG/SQEP, YKRGD/SQEP,
KRGDY/SQEP RGDYK/SQEP,の何 れの検 索 式 でもヒットします.
=> FILE REGISTRY
L1
L2
L3
326 S GDYKR/SQEP
54121 S CYCLIC/NTE
319 S L1 AND L2
← G から始める
← 環化で限定するためのキーワード
(検 証 ) 1 個 ずつコードをずらして検 索 します.
L4
L5
L6
L7
L8
L9
L10
L11
L12
321
319
324
319
322
319
322
319
319
S
S
S
S
S
S
S
S
S
DYKRG/SQEP
L4 AND L2
YKRGD/SQEP
L6 AND L2
KRGDY/SQEP
L8 AND L2
RGDYK/SQEP
L10 AND L2
L3 OR L5 OR L7
← D から始める
← 環化されているレコードに限定
← Y から始めます
← K から始めます
← G から始めます
OR L9 OR L11 ← 何 れ の 場 合 も 結 果 は 同 じ で す
11
よくあるご質問
← L3 の 1 件 目 を SQIDE 表 示 形 式 で 表 示
=> D L3 SQIDE 1
L3
RN
CN
ANSWER 1 OF 319 REGISTRY COPYRIGHT 2012 ACS on STN
1380037-49-9 REGISTRY
Cyclo[L-arginylglycyl-L-α-aspartyl-D-tyrosyl-N6-(1-oxooctadecyl)-Llysyl] (CA INDEX NAME)
FS
PROTEIN SEQUENCE; STEREOSEARCH
SQL 5
NTE cyclic
modified (modifications unspecified)
---------------------------------------------------------------------type
------ location -----description
---------------------------------------------------------------------modification
Lys-5
undetermined modification
---------------------------------------------------------------------SEQ
1 RGDYK
=====
HITS AT:
1, 2-5
質 問 式 GDYKR/SQEP と SEQ フィールドの 並 びは 異 な って
いますが,完 全 な環 化 の場 合 は,開 始 位 置 に関 わらずヒットし
ます.
HITS AT フィールドでヒット位 置 が表 示 されます
**RELATED SEQUENCES AVAILABLE WITH SEQLINK**
MF
C45 H75 N9 O9
SR
CA
LC
STN Files:
CA, CAPLUS, TOXCENTER
DT.CA CAplus document type: Patent
RL.P
Roles from patents: PREP (Preparation); PROC (Process)
Absolute stereochemistry.
**PROPERTY DATA AVAILABLE IN THE 'PROP' FORMAT**
1 REFERENCES IN FILE CA (1907 TO DATE)
1 REFERENCES IN FILE CAPLUS (1907 TO DATE)
参 考 : 一 部 が環 状 化 された配 列
REGISTYR ファイルでは,一 部 が環 状 化 された配 列 については,特 別 な登 録 処 理 がされていないため,
開 始 位 置 を考 慮 する必 要 があります
12
よくあるご質問
DGENE ファイル
・ REGISTRY ファイルと異 なり,環 状 の配 列 はある位 置 で切 断 された鎖 状 の形 式 で登 録 されて
いるため,開 始 位 置 を 1 個 ずつずらして検 索するしかありません.
=> FILE DGENE
=> RUN GETSEQ GDYKR/SQEP
L1
0 GDYKR/SQEP
← G から始めます
=> RUN GETSEQ DYKRG/SQEP
L2
2 DYKRG/SQEP
← D から始めます
=> RUN GETSEQ YKRGD/SQEP
L3
1 YKRGD/SQEP
← Y から始めます
=> RUN GETSEQ KRGDY/SQEP
L4
1 KRGDY/SQEP
← K から始めます
=> RUN GETSEQ RGDYK/SQEP
L5
64 RGDYK/SQEP
← R から始めます
=> S CYCL?/FEAT
L6
26800 CYCL?/FEAT
=> S L2 AND L6
L7
0 L2 AND L6
=> S L3 AND L6
L8
0 L3 AND L6
特 徴 表 (FEAT) に環 化 のキーワードが収 録 されて
いるレコードに限 定 します
(特 徴 表 でヒットしない場 合 は,標 題 ・抄 録 中 に環 化
があるレコードまで広 げます ((CYCL?) で検 索 ))
=> S L4 AND L6
L9
0 L4 AND L6
=> S L5 AND L6
L10
38 L5 AND L6
=> D L10 SQIDE 1
L10
AN
AA
SQL
SEQ
← RGDYK/SQEP で ヒ ッ ト し た 回 答 を SQIDE 表 示 形 式 で 表 示
ANSWER 1 OF 38 DGENE COPYRIGHT 2012 THOMSON REUTERS on STN
AZV31409 peptide
DGENE
0 A; 1 R; 0 N; 1 D; 0 B; 0 C; 0 Q; 0 E; 0 Z; 1 G; 0 H; 0 I; 0 L; 1 K; 0
M; 0 F; 0 P; 0 S; 0 T; 0 W; 1 Y; 0 V; 0 Others
5
1 rgdyk
=====
HITS AT: 1-5
1 位 と 5 位 の アミ ノ酸 が 結
FEATURE TABLE:
合 し,環 を形 成 しています
Key
|Location|Qualifier|
=============+========+=========+==========================
Modified-site|1
|note
|"This residue is condensed
|
|
|onto residue 5 to form a
|
|
|cyclic peptide"
Modified-site|5
|note
|"This residue is condensed
|
|
|onto residue 1 to form a
|
|
|cyclic peptide"
完 全 な環 状 配 列 の調 査 は,DGENE ファイルよ りも REGISTRY ファイルの検 索 方 法 が
簡 単 です
13