DDBJ 新塩基配列登録システム:Web から塩基配列を登録する

DDBJ Nucleotide Sequence
Submission Systemの紹介
小菅 武英
Takehide Kosuge, Ph.D
DDBJセンター、アノテーター
DDBJ, Annotator
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
1
目次
メイン
補足
目次
塩基配列データの登録受付は2種類
データ登録~公開までの流れ
DDBJフラットファイル(flat file)
塩基配列の登録を開始する前に
必要な情報について
典型的な登録事例(アノテーション)の見本
フィーチャー、クオリファイア、生物名、CDS、Location 説明
ページへのリンク
DDBJ塩基配列登録システムの特徴
登録を開始する
データ登録ページ
Web版塩基配列登録システムの説明ページ
9
10
11
12
13
DDBJ Nucleotide Sequence Submission System スタート画面
Submission System における入力の流れ
各入力ページの説明
画面上部にあるプログレスバーについて
1. Contact person
登録開始メールについて
2. Hold date
3. Submitter
4. Reference
5. Sequence
14
15
19
20
21
22
23
24
25
26
27
入力可能な塩基配列について
6. Template
7. Annotation 表形式入力画面
7. Annotation Templateでotherを選択した際の入力画面
Confirm後、"Next"ボタンクリック時に表示される最終確認画面
8. Finish
登録完了メール
よくある入力ミス
2014年6月12日
2
3
4
5
6
7
8
28
29
30
31
32
33
34
補足資料
プログレスバーで画面を遷移して修正したときの注意事項
2. Submitter画面 登録者の追加・削除・表示順の変更操作
4. Reference画面 Unpublished の場合
In press 選択時
Published 選択時
Journal入力欄におけるJournal名の入力補助機能について
例: Journal of biological chemistry の検索
TPA 登録を行う場合の塩基配列入力画面
TPA登録における Assembly Information の書式
Assembly Information 入力規則
編集操作
Qualifierの編集アイコンをクリックした場合
Edit Columnをクリックした場合
セルのダブルクリックまたはTemplate: other選択時の場合に
青色文字(qualifierなど)をクリック
生物名の入力について
genetic codeについて
生物名入力におけるカテゴリーの選択について
Category: デフォルトの入力欄
Viruses/Phages 選択時の入力
Environmental Samples 選択時の入力
Artificial construct 選択時の入力
A known species but unregistered in taxonomy database 選択時の入力
Not found in taxonomy database, but already registered
in other sequence data 選択時の入力
A novel species to be proposed in the paper 選択時の入力
annotation file の upload
Upload 可能な annotation file について
annotation file 例
エラーチェックに関する仕様
Upload & Confirmクリック後の画面 Errorが無い場合
Error/Warningが生じた場合
Confirmクリック後の画面 error無しの場合
errorが生じる場合
warningが生じる場合
SubmitterまたはReference内にerrorがある場合
Error/Warning説明ページへのリンク
CDSフィーチャーにおける翻訳エラーと説明ページへのリンク
入力例1 16S rRNAアノテーションの入力例
入力例2 ミトコンドリアCOI配列の入力画面例
入力例3 ミトコンドリアゲノム部分配列のannotation入力例
第29回 DDBJing 講習会 (DDBJ)
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
77
79
2
塩基配列データの登録受付は2種類
登録者
小規模なアノテーション付きの塩基配列
Mass Submission System
(MSS)
DDBJ Nucleotide Sequence
Submission System
(DDBJ塩基配列登録システム)
登録者自身で登録用書式に基
づいて登録ファイルを作成
登録用ファイル送信は主にEmail 経由
ウェブブラウザを使用
指定箇所に入力
公開後はデータの共有
が行われるため、DDBJ
に登録すればGenBank
やENAからも検索が可能
2014年6月12日
多件数または長大な塩基配列
DDBJ
GenBank
INSDC*
ENA
第29回 DDBJing 講習会 (DDBJ)
*INSDC
=International Nucleotide
Sequence Database Collaboration
http://www.insdc.org/
3
データ登録~公開までの流れ
フラットファイル
の公開
登録者 (Submitter(s))
即日公開
回答(email)
塩基配列登録
システム
問題点が
なくなるまで
繰り返す
または
アクセッション
番号発行
問い合わせ(email)
データに不足,
不備や不明な点
がある場合
指定した日付まで非公
開。ただし、以下の場合
は公開処理を行います
•
•
•
DDBJ (annotator)
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
指定した公開日が
到来したとき
登録者から公開依
頼を受けた時
アクセッション 番号
の公表をDDBJで
確認できた場合
4
DDBJフラットファイル(flat file)
DDBJ
で作成
DEFINITION 行
(塩基配列の概要が示される)
アクセッション番号
生物分類情報
登録者情報
塩基配列登録システムに
入力した内容がこの領域
に記載されます
文献情報
アノテーション
Feature
Location
/Qualifier
Feature = source, CDS など
Location = 塩基配列上の
ポジション
Qualifier = feature 配下に
/ で示される
/clone, /gene,
/product など
配列情報
2014年6月12日
LOCUS
DEFINITION
ABxxxxxx
450 bp
mRNA
linear
HUM 01-JUN-2014
Homo sapiens GAPD mRNA for glyceraldehyde-3-phosphate
dehydrogenase, partial cds.
ACCESSION
ABxxxxxx
VERSION
ABxxxxxx.1
KEYWORDS
.
SOURCE
Homo sapiens
ORGANISM Homo sapiens
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;
Catarrhini; Hominidae; Homo.
REFERENCE
1 (bases 1 to 450)
AUTHORS
Mishima,H. and Shizuoka,T.
TITLE
Direct Submission
JOURNAL
Submitted (30-NOV-2013) to the DDBJ/EMBL/GenBank databases.
Contact:Hanako Mishima
National Institute of Genetics, DNA Data Bank of Japan; Yata 1111,
Mishima, Shizuoka 411-8540, Japan
REFERENCE
2
AUTHORS
Mishima,H., Shizuoka,T. and Fuji,I.
TITLE
Glyceraldehyde-3-phosphate dehydrogenase expressed in human liver
JOURNAL
Unpublished (2013)
COMMENT
Human cDNA sequencing project.
FEATURES
Location/Qualifiers
source
1..450
/chromosome="12"
/clone="GT200015"
/clone_lib="lambda gt11 human liver cDNA (GeneTech.
No.20)"
/map="12p13"
/mol_type="mRNA"
/organism="Homo sapiens"
/tissue_type="liver"
CDS
86..>450
/codon_start=1
/gene="GAPD"
/product="glyceraldehyde-3-phosphate dehydrogenase"
/protein_id="BAA12345.1"
/transl_table=1
/translation="MAKIKIGINGFGRIGRLVARVALQSDDVELVAVNDPFITTDYMT
YMFKYDTVHGQWKHHEVKVKDSKTLLFGEKEVTVFGCRNPKEIPWGETSAEFVVEYTG
VFTDKDKAVAQLKGGAKKV"
BASE COUNT
102 a
119 c
131 g
98 t
ORIGIN
1 cccacgcgtc cggtcgcatc gcacttgtag ctctcgaccc ccgcatctca tccctcctct
61 cgcttagttc agatcgaaat cgcaaatggc gaagattaag atcgggatca atgggttcgg
121 gaggatcggg aggctcgtgg ccagggtggc cctgcagagc gacgacgtcg agctcgtcgc
181 cgtcaacgac cccttcatca
ccaccgacta catgacatac atgttcaagt atgacactgt
参考
241 gcacggccag tggaagcatc atgaggttaa ggtgaaggac tccaagaccc ttctcttcgg
301 tgagaaggag gtcaccgtgt
tcggctgcag
gaaccctaag gagatcccat
DDBJ
のデータ公開形式
(flatggggtgagac
file) の説明
361 tagcgctgag tttgttgtgg agtacactgg tgttttcact gacaaggaca aggccgttgc
421 tcaacttaag ggtggtgcta
agaaggtctg
http://www.ddbj.nig.ac.jp/sub/ref10-j.html
//
第29回 DDBJing 講習会 (DDBJ)
5
塩基配列の登録を開始する前に
 Submit可能な配列は、アノテーション付きの塩基配列です
 一度のsubmissionで1024件までの入力が可能です
(ただし各PCの環境により、一度に登録可能な最大件数は1024に
達しない場合もございます。この1024の設定値はDDBJ側のシステム環
境により変更する可能性があります)
 ブラウザは Firefox、Chrome を推奨しています。その他、 IE10、IE11、
Safari などでも経験上使用可能ですが、IE8では使用できません
 DDBJからのメールを受信できるようにしておいてください
※ 以下の場合はMass Submission Systemを利用してください。
・ エントリ数(登録する配列の数)が多い場合
1024 を超えると塩基配列登録システムでは分割が必要です
・ 1エントリあたりに多数(概ね30以上)のFeature がある場合
・ 配列が長い (目安は 500 kb 以上) 場合
・ その他、塩基配列登録システムが対応していない登録
EST、STS、TSA、HTC、GSS、HTG、WGS、CON(AGP)など
(http://www.ddbj.nig.ac.jp/sub/data_categories-j.html, Divisionを参照)
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
6
塩基配列の登録を開始する前に
必要な情報について
• コンタクトパーソン (登録者のうちDDBJと連絡できる方の氏名、Email、所属情報)
• 登録者(可能な限り複数名を指定)
• hold date (非公開にしておく期日) or 即公開希望
• 塩基配列に直接かかわるReference (著者、タイトル)
• 塩基配列(vector、linker、adaptor領域等がトリミング処理済であること)
• 塩基配列に対して記載するアノテーション

塩基配列を得た生物の学名

その生物の採取情報、ストレイン(/strain)、配列を得た組織名(/tissue_type) など

塩基配列の分子種(mRNA or genomic DNA or その他)

遺伝子の塩基配列上の位置(location)

protein-coding sequence (CDS)の場合は開始コドンから終止コドンまでの位置

遺伝子の gene symbol(/gene)とプロダクト名(/product) など
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
7
塩基配列の登録を開始する前に
典型的な登録事例(アノテーション)の見本
http://www.ddbj.nig.ac.jp/sub/example-j.html
2014年6月12日
典型的な登録事例(アノテーション)の見
本をDDBJホームページに用意していま
す。アノテーションの参考にしてください
第29回 DDBJing 講習会 (DDBJ)
8
塩基配列の登録を開始する前に
フィーチャー、クオリファイア、生物名、CDS、Location
説明ページへのリンク
Feature key (フィーチャーキー) の定義
http://www.ddbj.nig.ac.jp/sub/ref5-j.html
Qualifier key (クオリファイアキー) の定義
http://www.ddbj.nig.ac.jp/sub/ref6-j.html
生物名に関する入力規則
http://www.ddbj.nig.ac.jp/sub/ref8-j.html
タンパク質コード配列(CDS)に関する説明
http://www.ddbj.nig.ac.jp/sub/cds-j.html
Location (塩基配列上の位置情報)記述法
http://www.ddbj.nig.ac.jp/sub/ref9-j.html
登録の見本
http://www.ddbj.nig.ac.jp/sub/example-j.html
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
9
DDBJ塩基配列登録システムの特徴
•
Submission完了までにかかる時間を短縮できます
(前登録システムの SAKURA との比較)
•
16S rRNA配列, 1 CDSの配列, Influenza A virus 配列の登録など、典型
的な事例に対しては、アノテーション入力用テンプレートを用意しました。
アノテーションの内容に応じた feature key、qualifier key が自動で選択さ
れる上、表形式の入力が可能です
•
Multi-fasta形式の塩基配列を一度に入力することができます
•
feature key、qualifier keyを自分で選ぶ入力方式にも対応しています
•
DDBJアノテーションファイルのアップロードにも対応しています
•
ブラウザでブックマークすることで、容易に入力の中断・再開が可能です
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
10
登録を開始する
http://www.ddbj.nig.ac.jp/
DDBJホームページから"登録
"アイコンをクリックする
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
11
データ登録ページ
DDBJ Nucleotide Sequence
Submission Systemをクリック
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
12
Web版塩基配列登録システムの説明ページ
使い方の説明
アノテーション記
載に関する各説
明ページへのリ
ンク
ベクター配列の
コンタミチェック
"新規登録の開始"をクリック
すると塩基配列登録システ
ムページに遷移します
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
13
DDBJ Nucleotide Sequence Submission System
スタート画面
Create new submission
をクリックしてスタートします
動作確認済みの推奨ブラウザ
Firefox または Chrome
Safari、IE10、IE11 などにおいても経験上動作可能
ただしIE8では使用できません
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
14
Submission System における入力の流れ
"Create new submission"をクリックしてスタート
1. Contact person を入力
メール受信、メール内リンクを開く
2. Hold date を指定
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
15
3. Submitter を入力
4. Reference を入力
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
16
5. 塩基配列を入力
TPAの場合にはAssembly Information
も入力
6.アノテーション入力用テンプレートを
選択。アノテーションをuploadするか、
直接入力するかを選択
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
17
7. アノテーションを画面上で入
力、または、 uploadする
エラーがなくなるまでアノテー
ションチェック、修正を繰り返す、
最終確認画面表示
8. 完了
登録完了のメールを受信
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
18
各入力ページの説明
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
19
画面上部にあるプログレスバーについて
入力画面上部には進捗を示す
プログレスバーが表示されます
入力済みのページは青字に変化し、
クリック可能になり各ページに直接
ジャンプできます
参考: 補足資料「プログレスバーで
画面を遷移して修正したときの注
意事項」
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
20
1. Contact person
コンタクトパーソンは連絡の窓口となる方で登録者の中の1人を指定します
DDBJからの問い合わせに対する窓口となる方の電子メールアドレス
を入力してください
コンタクトパーソンの氏名を full name で入力します
Email, Fax,
Phone について
フラットファイル
中で配列ととも
に公開してもよ
い場合にチェッ
クを加えます
国名をリストから選択します
同時に、fax、phoneの国番号が自動選択され
ます
FAX番号を入力します
FAXを利用できない場合にはチェックを加えてください
電話番号を入力します(連絡に内線番号が必要な場合
は内線番号も入力してください)
所属機関名を入力します
所属部署名を入力します(任意)
URLを入力します(任意)
郵便番号を入力します
市町村名を入力します
都道府県名を入力します(任意)
市町村名以降の住所を入力します
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
入力が済んだらNextをクリックし
ます。入力したメールアドレス宛
にメールが自動送信されます。
21
登録開始メールについて
コンタクトパーソンメールアドレス宛に登録開始用のリンクを含むメールが自動的
に送信されます。
1時間以内にメール内のリンクから登録を続けてください。
"1.Contact person" ページのEmailアドレスが間違っている場合はメールが届きま
せん。Emailアドレスを修正し、再度Next をクリックしてください。
Subject: DDBJ: Starting the submission
To: [email protected]
National Institute of Genetics
Dear Hanako Mishima
Thank you for using DDBJ.
This email contains a link for proceeding of your nucleotide data submission.
Please click the link below, then, you can continue your registration.
http://ddbj.nig.ac.jp/submission/submissions/5036c6ee55d698c0ad000324/mail_confirmation?token=47444d24e210
6dd81a323f6ed559b715ec8cbbab
If you are not related person of the submission, please discard the email .
メール本文内でリンクがかかっている場合はここをクリック
Note : You must activate your new submission within 1 hour. If you failed
すればブラウザが開きます。
to activate, please try again from the "Contact
person" page.
Note : You can not reply to this mail.
リンクがかかっていない場合は、ここをコピーしてブラウザ
のURL欄に張り付け、リターンキーを押します。
If you encounter trouble while using this submission system, please send an
email to [email protected] and let us know the browser's URL of
your submission.
Thank you,
DNA Data Bank of Japan
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
22
2. Hold date
公開日(Hold date)をカレンダーから選択するか、即公開を選択します。
カレンダーアイコンをクリックし、表示さ
れるカレンダーから公開希望日を指定
してください
または、即公開希望の場合は
ここにチェックを加えてください
入力が済んだらNextをク
リックします
• カレンダーでは、6か月後の日付が自動的にハイライトされています
• 年末・年始はDDBJの休業期間のため選択できません
• 選択できる日付は最大3年後までです
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
23
3. Submitter
Submitter (登録者) 名を入力します
Contact person の 氏名が自動変
換され初期値として入力されます。
修正が必要な場合は適宜変更し
てください。
・Addで登録者を追加できます
(補足資料「2. Submitter」参照)
・DDBJでは複数の登録者の指定
をお願いしております
・入力した順序通りにフラットファ
イル上に表示されます
論文等の著者名に準ずる形式で,氏名の略記を記載してください。
カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。
形式: last name[comma]first name の頭文字[period]middle name の頭文字[period]
例:
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
複数の登録者を記載するようお願いいたします。
Kim,C.S.
Wang,Y.Q.
登録データの修正・更新を行える権利は登録者の
みが有しております。
入力が済んだらNextをク
リックします
参考
登録者(Submitter) の定義
http://www.ddbj.nig.ac.jp/sub/submitter-j.html
2014年6月12日
登録者が1名のみの場合、将来、修正が必要に
なった際に私どもから登録者本人への連絡がとれ
ない場面に遭遇することもございます。1名の登録
者のみでの登録も可能ですが、複数の登録者を記
載いただけるよう推奨しております。たとえば、実作
業者と研究指導者(責任者)、論文著者から登録者
に加えるなど、2名以上の登録者記載に関しまして
ご協力をお願いいたします。
このページで入力を中断・再開するにはブラウザでブックマークす
るか、ページのURLを保存してください。ブラウザーを閉じた後でも
ブックマークしたURLを用いて、再開することが可能です。
第29回 DDBJing 講習会 (DDBJ)
24
4. Reference
Reference情報を入力します
配列に関する主論文(Primary citation)を第一referenceに入力してください
デフォルトで Unpublished が選択されています
論文準備中の場合、論文投稿後、論文を作成する予定がない
場合はUnpublished を選択します
論文が受理されているときは In press、
論文がすでに公開されているなら Published を選びます
Unpublished、In press、Published の選択に応じで入力欄が切り
替わります(補足資料 「4. Reference」参照)
Referenceを追加する
場合にクリックします
参考
Reference
http://www.ddbj.nig.ac.jp/sub/reference2-j.html
2014年6月12日
論文等の著者名に準ずる形式で,氏名の略記を記載してください。
カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。
形式: last name[comma]first name の頭文字[period]middle name の頭文字[period]
例:
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
Kim,C.S.
Wang,Y.Q.
入力が済んだらNextを
クリックします
このページで入力を中断・再開するにはブラウザでブックマークするか、
ページのURLを保存してください。ブラウザーを閉じた後でもブックマー
クしたURLを用いて、再開することが可能です。
第29回 DDBJing 講習会 (DDBJ)
25
5. Sequence
デフォルトで”Yes”が選択されています、自身で塩基配列決定していれば
ここは "YES" のままにします。
公開されているデータベースから塩基配列を一部でも引用している場合
は "No." を選んでください、TPA入力モードに切り替わります (補足資料
「TPA 登録を行う場合の塩基配列入力画面」参照)。
塩基配列を
ペーストします
注意!: アノテーション入力後、この
ページにおいて塩基配列を変更した場
合、7.Annotationで入力した内容は失わ
れます。
または、塩基配列ファ
イルをここからupload
します
入力が済んだらNextを
クリックします
このページで入力を中断・再開するにはブラウザでブックマークする
か、ページのURLを保存してください。ブラウザーを閉じた後でもブッ
クマークしたURLを用いて、再開することが可能です。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
26
入力可能な塩基配列について
Multi-FASTA形式の塩基配列をペースト(またはアップロード)可能です。
Entry name (エントリー名)は、24文字までの半角・英数記号(ただしスペース、
"、?、¥、バックスラッシュを含まない)を用いて設定してください。
Entry name にはそれぞれ異なる名称を付けてください。
同じ Entry name が使用されている場合はエラーとなるため Entry name の修
正が必要になります。
各エントリーの区切りに // を含んでいてもいなくても、問題ありません(例1、
例2 のどちらでも良い)。
本システムでは // 無しの塩基配列を入力した場合、各エントリーの区切りとし
て // が自動的に挿入されます。
塩基配列は、a, c, g, t, m, r, w, s, y, k, v, h, d, b, or n のいずれかで構成される
必要があります。
塩基配列中の スペース、数字は自動的に削除されます。
例1
>CLN01
ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg
aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc
accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa
>CLN02
ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct
gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga
gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa
例2
>CLN01
ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg
aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc
accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa
//
>CLN02
ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct
gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga
gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa
//
塩基配列中の大文字は自動的に小文字に変換されます
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
27
6. Template
ページ内に挙げられているアノテーションパターンに完
全に合致する場合、template を利用した表形式でのア
ノテーション入力が可能になります。リストのいずれか
を選択し、"Input annotation"をクリックしてください。
例えば、バクテリア16S rRNAの登録を行う場合はここを
選択します。
上記リストに該当する項目がな
い場合にother を選択します。
この場合、テーブル形式のアノ
テーション入力は利用できませ
ん。
注意!: アノテーション入力後こ
のページにおいてテンプレートを変
更した場合、7.Annotationで入力し
た内容は失われます。
アノテーションファイルのuploadに
も対応しています。upload機能の説
明は補足資料「annotation file の
upload」をご覧ください。
template選択後、"Input
annotation"をクリックします
このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してくだ
さい。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
28
7. Annotation 表形式入力画面
"6.Template"画面でother以外を選択した場合には表形式のアノテーション入力
画面になります。
基本操作
① sourceフィーチャー横の"Select Qualifier"アイコンをクリック、Qualifierを追加し
ておく。sourceフィーチャー以外のフィーチャーにおいても必要であれば"Select
Qualifier"からQualifierを追加する。
② 各エントリーで"Edit"アイコンをクリックして入力していく
③ Confirmをクリック、Errorがある場合は②に戻って修正
④ Confirmクリック、ErrorがなくなるとNextボタンがクリック可能になる
⑤ Nextをクリック、最終確認画面に遷移
②: Editクリックで、各エ
ントリーごとの編集が
可能です
①: 追加したい
Qualifierを選択し
ます
(a)Qualifier編集アイコン
のクリックで列ごとの編
集が行えます
塩基配列入力時に各
配列の先頭行に指定し
たEntry nameが表示さ ③: annotation入力後、
れます
Confirmをクリックします。
入力した内容の書式チェッ
クが行われます。
2014年6月12日
"Edit"アイコンからの入力に加え次の入力方法が可
能です
a. Qualifier下に表示されている編集アイコンをクリッ
クする (補足資料「Qualifierの編集アイコンをク
リックした場合」参照」)
b. Edit Columnの文字をクリックする(補足資料「Edit
Columnをクリックした場合」参照」)
c. セルをダブルクリックする(補足資料「セルのダブ
ルクリックまたはTemplate: other選択時の場合に
青色文字(qualifierなど)をクリック」参照」 )
?アイコンクリックで各
feature、qualifierの説明
ページが開きます
(b)Edit Columnをクリックした
場合、列ごとの編集が行え、
copy & pasteによる一括入力
が可能です
④⑤: チェック後、次のステップに進める
場合のみ、"Next"がクリック可能になりま
す。アノテーションチェックで問題がある
場合はクリックできません。
第29回 DDBJing 講習会 (DDBJ)
追加情報がある場合
にダブルクリックすれ
ば、テキストでの自由
記載が可能です。
(c)各セルをダブルクリックし
て入力・編集が可能です
このページで入力を中断・再開するにはブラウザで
ブックマークするか、ページのURLを保存してください。
ブラウザーを閉じた後でもブックマークしたURLを用い
て、再開することが可能です。
29
7. Annotation
Templateでotherを選択した際の入力画面
基本操作
① sourceフィーチャーの"Select Qualifier"アイコンをクリック、sourceフィーチャー配下
に記載するQualifierを追加しておく
② "Edit"アイコンをクリックしてsourceフィーチャー配下の情報を入力する
③ Add featureから必要なfeatureを追加。追加したfeatureに必要なQualifierは自動で
選ばれているが、必要であれば適宜追加したfeatureの"Select Qualifier"アイコンをク
リックして qualifierを追加しておく
④ 追加したfeature配下のlocation、qualifier をクリックしてアノテーションを入力、③④
をfeatureの数だけ繰り返す
⑤ "Confirm"ボタンをクリック、Errorがある場合は修正
⑥ "Confirm"をクリック、Errorがなくなると"Next"ボタンがクリック可能になるので
"Next" をクリック、最終確認画面に遷移
①: "Select Qualifier"クリックで、
qualifierを追加します
※ クリックすると、sourceフィーチャーに選
択されたクオリファイアが次のエントリー
以降にコピーされます
②: "Edit" クリックで、エントリーご
との編集が行えます
"Edit"アイコンによる入力に加え次の方法が可能です
a. sourceフィーチャー限定、qualifier左側に表示され
ている編集アイコンをクリックする (補足資料
「Qualifierの編集アイコンをクリックした場合」参
照」)
b. locationやqualifierをクリックする(補足資料「セル
のダブルクリックまたはTemplate: other選択時の
場合に青色文字(qualifierなど)をクリック」参照」 )
③: featureを追加するには、Add featureを
クリックします。フィーチャーリストからマウ
スで選択、クリックすると追加可能です。こ
の図はCDSを追加したときの例です
④: 追加したfeature の location, qualifierを
クリックして値を入力します。 ③④を繰り
返します
"Comment"クリックで、
必要に応じ、追加情報を自由テキス
ト記載で入力することが可能です
(b) Qualifierやlocationなどの青色文字を
直接クリックすることでも編集可能です
(a) 全エントリーを対象に、クリッ
クしたクオリファイア値の編集が
行えます
2014年6月12日
⑤: annotation入力後、
Confirmをクリックします。入力
した内容の書式チェックが行
われます
⑥: チェック後、次のステップに進
める場合のみ、"Next"がクリック可
能になります。アノテーション
チェックで問題がある場合はクリッ
クできません
このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。
ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。
第29回 DDBJing 講習会 (DDBJ)
30
Confirm後、"Next"ボタンクリック時に表示される
最終確認画面
これまでに入力してきた
内容をテキストファイルで
閲覧可能です
※ この欄にはテキスト
入力が可能ですので、
伝えておきたい事項が
あれば記載しておいて
ください
2014年6月12日

問題がなければ、どちらかの "Submit to
DDBJ" ボタンをクリックします。"8. Finish" 画
面に移動します。

修正を行う場合、画面上部のプログレスバー
をクリックし、各画面にジャンプして編集後、
各画面で必ず Next をクリックしてください。
"5.Sequence"、"6.Template"で変更操作を行
うと入力済みのアノテーションが消去される
点については注意してください。

各画面で修正後、画面上部プログレスバー
"7.Annotation"をクリックすると、アノテーショ
ン入力画面にジャンプできます。
"7.Annotation" 画面において Confirm後、
Next をクリックすると再度この画面が表示さ
れます。
第29回 DDBJing 講習会 (DDBJ)
31
8. Finish
DDBJに登録ファイルが転送されました。
この画面が出れば登録完了です。
同時に、登録完了のメール(次ページ)が自動送信さ
れます。
※ このページの URL をブックマー
クしておけば、短期間、閲覧可能
です。
入力した内容をDDBJ登録形式でダウン
ロードできますので、ファイルの保存を行っ
てください。同じファイルがDDBJサーバー
に自動転送されますので、これらのファイ
ルをDDBJにお送りいただく必要はございま
せん。
本システムにおいて問題が生じ場合
は、ここのメールアドレス宛てに連絡
を行ってください。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
32
登録完了メール
From: [email protected]
Subject: DDBJ: Web submission completed
Contact person : [email protected]
Hanako Mishima
National Institute of Genetics
DDBJ center, DDBJ
1111 Yata
Mishima, Shizuoka, 411-8540
Japan
Thank you very much for choosing DDBJ for data submission.
We have received your data. We will soon check and annotate them on the basis of
the manual and rules common to the DDBJ, EMBL-Bank, and GenBank.
If you do not hear from DDBJ after 5 working days after receiving this notice,
please contact us at the following address indicating your Entry ID.
Email address: [email protected]
Sincerely,
DNA Data Bank of Japan
DDBJ Center
National Institute of Genetics
Research Organization of Information
and Systems
Mishima, Shizuoka 411-8540, Japan
fax:
+81-55-981-6849
[Hold-date]
2013-03-29
[Entry ID]
5065382e55d69849870005fe.entry01
5065382e55d69849870005fe.entry02
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
33
よくある入力ミス
•
塩基配列がmulti-fasta形式で入力されていないため、annotation画面の表
示がおかしくなる
•
クローニング時に人為的に加えられたvector、adapter、linker、primer領域は
トリミングする
→ VecScreenでチェック(http://ddbj.nig.ac.jp/vecscreen/)
•
genetic code が適切に入力されていないため、CDSが翻訳エラーになる
→ 補足資料:「genetic codeについて」を参照
•
開始コドンや終止コドンが含まれない部分配列の場合にCDS の locationが
部分配列指定で入力されていないために翻訳エラーになる
→ Location記述法(http://www.ddbj.nig.ac.jp/sub/ref9-j.html) やタンパク
質コード配列; CDS feature について(http://www.ddbj.nig.ac.jp/sub/cdsj.html などを参考に修正する
•
"MGA:No entry name is found other than [ COMMON ], without feature
[ DATATYPE/type=MGA ]."という訳の分からないエラーが表示される
→ /organism、/mol_typeを入力する前に"Confirm"をクリックしたため、
annotationを入力してから"Confirm"をクリックする
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
34
補足資料
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
35
プログレスバーで画面を遷移して修正したとき
の注意事項
 各ページ名をクリックすることで、前のページに戻って閲覧・修正
することが可能です。修正後は、各ページ下部にある"Next"をク
リックしてください
 "5.Sequence"ページで塩基配列を差し替えた場合、入力したアノ
テーションが消去されます
 "6.Template"ページでテンプレートを修正した場合、入力したアノ
テーションが消去されます
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
36
2. Submitter画面
登録者の追加・削除・表示順の変更操作
登録者を追加するには
"Add"をクリックします
Addをクリックすると現れる入力
欄に登録者とメールアドレスを入
力してください
順番入れ替え
下に移動
登録者の順番を変えるには
登録者を削除するには
削除
順番入れ替え
上に移動
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
37
4. Reference画面
Unpublished の場合
Yearは入力の必要がありません。自動で
今年の西暦年が入力済みになります。
論文タイトルを入力します。
論文を準備されない場合も、塩基配列情
報に応じてた適切なタイトルを記載してくだ
さい。
論文の著者名を各欄に1名ずつ入力してください。
Add authorsで入力欄を追加できます。
X をクリックすると入力欄を消せます。
入力が済んだらNextを
クリックします
論文等の著者名に準ずる形式で,氏名の略記を記載してください。
カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。
形式: last name[comma]first name の頭文字[period]middle name の頭文字[period]
例:
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
Kim,C.S.
Wang,Y.Q.
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
38
4. Reference画面
In press 選択時
In press選択時、ジャーナルの略称(ISO abbreviation)を入力してく
ださい。この入力欄にはジャーナル名の入力補助機能がついて
います
参考:補足資料「Journal入力欄におけるJournal名の入力補助機
能について」
Yearを入力します
論文タイトルを入力します
論文の著者名を各欄に1名ずつ入力してください
Add authorsで入力欄を追加できます
X をクリックすると入力欄を消せます
論文等の著者名に準ずる形式で,氏名の略記を記載してください。
カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。
形式: last name[comma]first name の頭文字[period]middle name の頭文字[period]
例:
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
Kim,C.S.
Wang,Y.Q.
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
39
4. Reference画面
Published 選択時
Yearを入力します
In press選択時、ジャーナルの略称(ISO abbreviation)
を入力してください。この入力欄にはジャーナル名の
入力補助機能がついています
参考:補足資料「Journal入力欄におけるJournal名の
入力補助機能について」
論文タイトルを入力します
Volume、Page、を入力します
DOI が分かる場合は入力してください
論文の著者名を各欄に1名ずつ入力してください
Add authorsで入力欄を追加できます
X をクリックすると入力欄を消せます
論文等の著者名に準ずる形式で,氏名の略記を記載してください。
カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。
形式: last name[comma]first name の頭文字[period]middle name の頭文字[period]
例:
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
Kim,C.S.
Wang,Y.Q.
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
40
Journal入力欄におけるJournal名の入力補助
機能について
Journal Name欄にfull nameを入力いただく途中でジャーナル名の候補リストが表示されます。
リストから選択することでISO Abbreviationに自動変換されます。
入力補助辞書は、 NLM Catalog を使用しております。
ISO Abbreviation については、NLM Catalog で検索することができます。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
41
例: Journal of biological chemistry の検索
NLM Catalog(http://www.ncbi.nlm.nih.gov/nlmcatalog/)の
ページにアクセスします
検索したいジャーナル名[journal] を検索窓に入力し、Search
をクリックします
例 journal of biological chemistry[journal]
クリックする
候補が表示されます
検索結果から、該当する方を
クリックします
ISO Abbreviation はこれです
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
42
TPA登録を行う場合の塩基配列入力画面
自身で塩基配列を決定したのではなく、公
開されている塩基配列を引用して塩基配列
を構築した場合は "No" を選択してください。
TPA登録モードに切り替わります。
TPA配列の構築情報(次
ページ参照)をペーストしま
す。各列が空白で区切ら
れていることが重要です。
塩基配列をここに
ペーストします。
または、塩基配列ファ
イルをここからupload
します。
このページで入力を中断・再開するにはブラウザでブックマークす
るか、ページのURLを保存してください。ブラウザーを閉じた後でも
ブックマークしたURLを用いて、再開することが可能です。
2014年6月12日
入力後、Next を
クリックします
第29回 DDBJing 講習会 (DDBJ)
または、Assembly
Information のファイルをこ
こから upload します
43
TPA登録における Assembly Information の書式
入力例
FA01
BM123
Entry
Name
TPA_SPAN
1-552
553-705
1-438
377-695
411-790
790-1191
PRIMARY_IDENTIFIER
ZZ000001.1
ZZ000002.5
ZZ000010.1
ZZ000011.1
ZZ000021.12
ZZ000022.0
TPA 配列上の
location を記載
プライマリーエントリの
アクセッション番号を
バージョン番号とともに
入力する。
PRIMARY_SPAN
54872-55422
1-153
1-438
1-320
1-398
1-401
COMPLEMENT
c
相補鎖に対応
する場合のみ c
を記載
プライマリーエントリの
領域を入力する。
<入力例の意味>
Entry name FA01 において;
TPA塩基配列 1-552 の領域は ZZ000001.1 の 54872-55422 に対応
TPA塩基配列 553-705 の領域は ZZ000002.5 の 1-153 に対応
Entry name BM123 において
TPA塩基配列 1-438 の領域は ZZ000010.1 の 1-438 に対応
TPA塩基配列 377-695 の領域は ZZ000011.1の 1-320 の相補鎖側に対応
TPA塩基配列 411-790 の領域は ZZ000021.12の 1-398 に対応
TPA塩基配列 790-1191 の領域は ZZ000022.0 の 1-401 に対応
いずれもTPA とプライマリーエントリの配列アラインメントに関する規則に従います
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
44
Assembly Information 入力規則
 第1行目は
[tab or space]TPA_SPAN[tab or space]PRIMARY_IDENTIFIER[tab or space]PRIMARY_SPAN[tab or space]COMPLEMENT
である必要があります
 空行は指定しないでください
 Entry name は第1列に記載します、Entry name のある行でエントリーごとのAssembly情報が区切られることになります。
 TPA_SPAN
書式: X..Y もしくは、X-Y (X, Yは数字、X<Y であることが必要)
TPA 配列上の領域を記載します。
例: 100..2000
例: 3400-4000
 PRIMARY_IDENTIFIER
書式: accession number.version
引用するプライマリエントリのアクセッション番号をバージョン番号とともに入力します。未公開のアクセッション番号の場合はバー
ジョン番号を 0 にしてください。
例: AB123456.1
例: AB987654.0
 PRIMARY_SPAN
書式: X..Y もしくは、X-Y (X, Yは数字、X<Y であることが必要)
プライマリエントリからの引用領域を入力します。抜き出した領域が TPA_SPANの領域と対応している必要があります。
例: 1..3345
例: 900-1235
 COMPLEMENT
書式: 空欄もしくは c
プライマリエントリから相補鎖領域を引用する場合にのみ c を指定します。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
45
編集操作
Qualifierの編集アイコンをクリックした場合
クリックしたqualifierにおいて全
エントリーに対しての編集が可
能です。
Copy クリックで、そのエント
リー以降にも同じ値がコピー
されます。
ただし、件数が多い場合やPC
の環境により時間がかかる
場合があります。
Qualifierの値が全エントリー
で同一である場合、同一値を
速やかに入力することができ
る機能です。
編集後"Save"をクリックします
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
46
Edit Columnをクリックした場合
テキストエリア上への一括pasteが可能
表の列ごとに、各入力欄の編集
が可能です。
このテキストエリアに、直接入力するか、表
計算ソフトやテキストエディタなどからcopy
& pasteしてください。エントリーの区切りに
は改行を用います。
編集後"Save"をクリックします
テキストリストからpasteすることで、全エント
リーに対して一括入力を行うことができる機
能です。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
47
セルのダブルクリック
または
Template: other選択時の場合に青色文字(qualifierなど)をクリック
セルのダブルクリック(Template: other選択時は
qualifierのクリック)で入力欄が現れます。入力ウイ
ンドウに対して必要な値を入力してください
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
編集後"Save"をクリックします
48
生物名の入力について
Virus、Phage、環境サンプル、合成配列、
taxonomy databaseに登録が無い場合など
の場合に、カテゴリーを選択します。
この欄に塩基配列を得た生
物の学名を入力します。
正確な学名入力のための入
力補助機能が備わっていま
す。リスト表示された候補か
らマウスでクリックしてくださ
い。
生物の入力と同時に、
Templateの種類に応じて
genetic codeに整数値が自動
的に入力されます(次ページ
参照)。
入力した生物名を検索キーとして、
NCBI taxonomy検索が実行可能
です。
学名のスペルが曖昧なため調べ
たいとき、taxonomic lineageから
検索したいときなどにご利用くだ
さい。
学名がtaxonomy databaseに
存在しない場合など、genetic
codeが自動的に入力されな
いときには、手動でgenetic
codeを入力する必要がありま
す。
参考
Organism qualifier に記載する生物名
http://www.ddbj.nig.ac.jp/sub/ref8-j.html
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
49
genetic codeについて
TemplateでCDSが指定される場合、もしくは、otherを
選択した場合にgenetic codeの入力が必要です。
なぜなら、本システムではCDSフィーチャー配下の
/transl_table に記載する整数値を、生物名入力時の
genetic code 欄の値から取得するためです。
taxonomy databaseから公開されている学名であれば、
scientific name入力欄で表示される候補リストからマ
ウスで選択することによって、genetic codeが自動的に
取得されます。genetic codeが自動入力されない場合
は手動で整数値を入力する必要があります。
genetic code に指定する整数値については、
The genetic
code(http://www.ddbj.nig.ac.jp/sub/geneticcode-e.html)をご
覧ください。
(a)
2014年6月12日
"7.annotation"画面において"Edit"アイコンをクリック
↓
(a) 学名をキーボードから入力、loadingアイコン(くる
くる回転するマーク)が表示されます。
タイピングが速い場合や、学名を copy & pasteした
場合には、loadingアイコンが出ないときがあります。
この場合は学名の入力欄をクリックし、キーボード
の上または下キーを押すことで再検索されます。な
お前後に空白があると検索できませんので必ず取
り除いてください。
↓
(b) 学名が見つかると、候補リストが表示されるので
マウスで選択します
↓
(c) genetic code欄に自動的に値が入力されます。
自動入力されない場合には手動で整数値を入力し
ます
(b)
第29回 DDBJing 講習会 (DDBJ)
(c)
50
生物名入力におけるカテゴリーの選択について
塩基配列が由
来するサンプ
ルに応じて
Categoryを切り
替えてください。
Categoryに応じ
て生物名入力
欄が切り替わ
ります。
Category
内容
Select only for virus, environmental sample, etc.
デフォルトです。以下のカテゴリーでない場合に選択しま
す。
Viruses/Phages
VirusやPhageの場合に選択します、生物名入力補完辞書
がVirus、Phageに切り替わります。
Environmental Samples
環境サンプルの場合に選択します。Scientific name: 入力
欄に自答的に uncultured が記載されます。
Artificial Construct
クローニングベクター、発現ベクター、合成配列の場合に
選択します。
A known species but unregistered in taxonomy database
学名がvalidであるが、NCBI taxonomy databaseで見つから
ない場合に選択します。
Not found in taxonomy database, but already registered in
other sequence data
NCBI taxonomy databaseに無いが、以前の登録で同じ生
物名を使用したことのある場合に選択します。
A novel species to be proposed in the paper
新種を報告する場合に選択します。
こちらもご覧ください。
Organism qualifier に記載する生物名
http://www.ddbj.nig.ac.jp/sub/ref8-j.html
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
51
Category: デフォルトの入力欄
Scientific name 欄に学名を入力
参考
Organism qualifier に記載する生物名:種が同定されている場合
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#species
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
52
Category: Viruses/Phages 選択時の入力
Scientific name欄に、VirusまたはPhageの名を入力します
(入力補完辞書がVirus/Phage用に切り替わります)
参考
Organism qualifier に記載する生物名:ウイルス
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#virus
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
53
Category: Environmental Samples 選択時の入力
補助情報入力欄が出現、必要な場合に記
載をお願いします。自由記載が可能ですが、
入力は必須ではありません。
Scientific name 欄に uncultured が自動記載さ
れるので、それに続く名称を入力します。
たとえば、uncultured の直後に Bacillus sp.を入
力します。
参考
Organism qualifier に記載する生物名:環境サンプル
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#env
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
54
Category: Artificial construct 選択時の入力
Scientific name欄に、ベクター名や合成配列の名称
を入力します (入力補完辞書が人工合成配列用に
切り替わります)
参考
Organism qualifier に記載する生物名:人工的に構築した配列
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#syn
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
55
Category: A known species but unregistered in taxonomy
database 選択時の入力
学名を入力します
taxonomic lineageを入力してくだ
さい(必須)
生物名をvalidであるものと報告して
いる論文を入力してください(必須)
そのほかの情報が存在する場合
に入力します
参考
Organism qualifier に記載する生物名: database で見つからない場合
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#novel
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
56
Category: Not found in taxonomy database, but already
registered in other sequence data 選択時の入力
学名を入力します
生物名をvalid nameとして報告して
いる論文を入力してください(任意)
そのほかの情報が存在する場合
に入力します
参考
Organism qualifier に記載する生物名: database で見つからない場合
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#novel
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
57
Category: A novel species to be proposed in the paper
選択時の入力
論文が公開されるまでは、学名がvalid nameになってないため、
暫定名で登録します。
暫定名の書式は、
Genus sp. ##-yyyy
の通りです。##を登録者名のイニシャル、yyyはその時の年に置
き換えます。
論文で提唱する新種名(学名)を
入力します。
taxonomic lineageを入力してくだ
さい(必須)。
そのほかの情報が存在する場合に入力します。
参考
Organism qualifier に記載する生物名:種が同定されていない、または、新種提唱の場合
http://www.ddbj.nig.ac.jp/sub/ref8-j.html#unidentified
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
58
annotation file の upload
DDBJ 登録用 annotation file をご自身
で作成できる方は、"6.Template"画面
から annotation file のアップロードを
行うことができます。
① other を選択しておきます。
② "Upload annotation file" を
クリックします
④ "Upload & Confirm" をク
リックして annotation file の
チェックを行います
③ annotation file を指定します
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
⑤ Errorが出る場合、annotation
fileを修正し③④を繰り返します。ク
リック可能になればNextをクリックし
ます。最終確認画面に遷移します。
59
Upload 可能な annotation file について
annotation file の作成方法に関する手引きに関しては、アノテーションファイル作成概説
(http://www.ddbj.nig.ac.jp/sub/mss/annotation_file-j.html) をご覧ください。
annotation file には、アノテーション部のみ(次ページ参照)を含めてください。
EST, STS, TSA, HTC, GSS, HTG, WGS, CON (AGP) ファイルのuploadには対応していません。こ
れらの登録については、大量登録システム(MSS) をご利用ください。
1. Contact person、2. Hold date、3. Submitter、4. Reference に記載された内容は、
COMMON情報として upload された annotation file の先頭に加えられます。
COMMON がannotation file内に記載されていた場合は、 1. Contact person、2. Hold date、
3. Submitter、4. Reference に記載された内容に置き換わります。
TPA 登録においては、PRIMARY_CONTIG を annotation file に含めないでください。
5. Sequence 中の Assembly Information の入力内容が自動的に変換され、annotation file
の各エントリーに挿入されます。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
60
annotation file 例
COMMON
この部分は不要、annotation file
に含まれていた場合は、
1. Contact person
2. Hold date
3. Submitter
4. Reference
の入力内容に置き換わります。
SUBMITTER
REFERENCE
DATE
ENT01
Biological featureが記載さ
れたこの領域、つまり、各エ
ントリーのアノテーションの
みを upload してください
source
CDS
217..1104
polyA_site
ENT02
source
CDS
2014年6月12日
1..2878
contact
Hanako Mishima
ab_name
Mishima,H.
ab_name
Yamada,T.
ab_name
Park,C.S.
ab_name
Liu,G.Q.
email
[email protected]
phone
81-55-981-6853
fax
81-55-981-6849
institute
National Institute of Genetics
department
DNA Data Bank of Japan
country
Japan
state
Shizuoka
city
Mishima
street
Yata 1111
zip
411-8540
ab_name
Mishima,H.
ab_name
Yamada,T.
ab_name
Park,C.S.
ab_name
Liu,G.Q.
title
Aquaporin genes
year
2012
status
Unpublished
hold_date
20131130
organism
Homo sapiens
isolate
FA01
mol_type
mRNA
tissue_type
liver
gene
AQP9
product
aquaporin 9
codon_start
1
transl_tabe
1
2878
1..1409
<1..1051
第29回 DDBJing 講習会 (DDBJ)
organism
Shigella flexneri
strain
BM123
mol_type
genomic DNA
gene
APQZ
product
transl_table
aquaporin Z
11
codon_start
2
61
エラーチェックに関する仕様
•
annotation、sequenceの書式チェックには Parser が、CDSの翻訳チェックにはtransCheckerがそれぞれ実
行されます。
•
CDS featureが含まれない場合には、"Confirm"クリックで書式チェック(Parserチェック)のみが行われます。
•
CDSが存在する場合、Confirmクリックでまず書式チェック(Parserチェック) が行われ、入力内容にエラーが
ある場合は書式エラーが表示されます。書式に問題がなければ、その直後にアミノ酸配列への翻訳エ
ラーチェックが実行されます。つまり、書式エラーが解消されるまでは、翻訳チェックが行われません。
例えば、/lat_lon の書式に間違いがある場合は Confirmクリック後 /lat_lon のエラー
のみが表示されます。/lat_lon を修正後、再度Confirmをクリックし、翻訳エラーがある
場合はその結果が表示されます。
/lat_lon 修正、Confirmをクリック
翻訳エラーが表示される
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
62
Upload & Confirmクリック後の画面
Errorが無い場合
エラーが無い場合は"Next"がクリック可
能になります。
Warningがある場合でも、"Next"がクリッ
ク可能になりますが、必要に応じて修正
を行ってください。
アノテーションのチェックが行われた後、画面下にアノテー
ションファイルが表示されます。
COMMONの領域は、1.Contact person~4.Referenceページ
で入力した内容に置き換えられます。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
63
Upload & Confirmクリック後の画面
Error/Warningが生じた場合
修正したannotation fileを指定し、
"Upload & Confirm" を繰り返します。
Errorがなくなるまで繰り返します。
Line番号のクリックで画面下の
Error対象行にジャンプします。
Error/Warning内容が表示
されます。
Errorがなくなると"Next"がクリック可
能になります。
Warningが生じた場合でも入力内容
に問題がなければ、"Next"をクリック
してください。
クリックするとErrorの説
明ページが開きます。
画面下部にDDBJ登録形式のannotation file
が表示されます。
エラー対象はハイライトされます。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
64
Confirmクリック後の画面
error無しの場合
チェック後、次のステップに進め
る場合は、Nextがクリック可能に
なります。
annotation 入力画面の下側にDDBJ
登録形式のアノテーションファイル
が表示されます。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
65
"Confirm"クリック後の画面
errorが生じる場合
① エラー内容が表
示されます
③ エラーが生じている行番号をクリッ
クすると、画面下部に表示されるDDBJ
アノテーションファイル形式の該当行
にジャンプします。
エラーが生じる場合は、Next ボタ
ンをクリックできません
② アイコンをク
リックすると、エ
ラーの説明ペー
ジが開きます(そ
れぞれ日本語と
英語ページ)
⑤ エラー箇所の修正を行う場合
は画面をスクロールアップし、エ
ラーが生じたエントリーの"Edit"ア
イコンをクリックするなどの編集操
作により、修正を行ってください。
エラー修正後、再度"Confirm"をク
リックしてください。
④ エラー対象行がハイライト表示されま
す。どのentry のどの feature、qualifier
がエラーになっているかを確認します。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
66
Confirmクリック後の画面
warningが生じる場合
Warningは、Errorと断定ができないが、注意を促すた
めの警告としての意味で表示されます
Warning の場合には Nextがクリック可能になりますが、
入力内容に問題がないかどうかを確認してください
この例では、submitterの名前の書式に関するwarningが
出ていますが、submitter 名に間違いがないならば
warning を無視してかまいません。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
67
SubmitterまたはReference内にerrorがある場合
① プログレスバーの"3. Submitter"または
"4.Reference" をクリックすると各入力ペー
ジにジャンプします
② 修正後、必ず"Next"ボタンをクリックし
ます
③ 修正後、"7.Annotation" をク
リックするとアノテーション画面に
戻ります
Submitter、Reference に関するerrorやwarningに対して修正を行う場合に
はプログレスバーから"3.Submitter"、"4.Reference"画面に戻って修正を行
うことになります。
① 画面上部のプログレスバーにある"3.Submitter"または"4.Reference"を
クリックする
② "3.Submitter"もしくは"4.Refernece"入力画面上で修正し、必ず"Next"を
クリックする(Nextをクリックしないと修正した内容が反映されません)
③ 画面上部のプログレスバーから、"7.Annotation" をクリックすると
annotation入力画面に戻ることができる
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
68
Error/Warning説明ページへのリンク
Error/Warningの説明は以下のURLでご覧いただけます。
http://www.ddbj.nig.ac.jp/sub/validator-j.html
CDSのアミノ酸翻訳に関するエラー説明は以下のURLからご覧ください。
transChecker エラーメッセージ
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC
(次ページ参照)
以下のリンクもご参照ください
• Feature key の定義
• Qualifier key の定義
• Organism qualifier に記載する生物名
• CDS feature について
• Location の記述法
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
69
CDSフィーチャーにおける翻訳エラーと説明ページへのリンク
翻訳エラーの内容により、リンク先の記載内容に基づき修正してください
Message
[WARNING] 'codon_start' qualifier should be selected. The value is automatically set 1.
[WARNING] 'transl_table' qualifier should be selected. The value is automatically set 1.
[WARNING] Amino acid of 'transl_except' qualifier [#Value] is not [Met].
[WARNING] [#Value] codons are not translatable.
[ERROR] Untranslatable codon [#Codon] is found in the sequence range.
[ERROR] First codon [#Codon] is not a start codon.
[ERROR] Final codon [#Codon] is not a stop codon.
[ERROR] Stop codon '*' is found in the range.
[ERROR] Description of Location [#location of CDS feature] is illegal.
[ERROR] 'codon_start' qualifier is duplicated. The value is automatically set 1.
[ERROR] 'codon_start' qualifier has invalid value [#Value].
[ERROR] 'transl_table' qualifier is duplicated. The value is automatically set 1.
[ERROR] 'transl_table' qualifier has invalid value [#Value].
[ERROR] Amino acid abbreviation [#abbreviation] in 'transl_except' qualifier is illegal.
[ERROR] 'transl_except' qualifier has invalid value [#Value].
[ERROR] Location of 'transl_except' qualifier [#Value] is overlapped.
[ERROR] Location of 'transl_except' qualifier [#Value] is invalid.
[ERROR] Base range of 'transl_except' qualifier [#Value] is mismatched in reading frame.
[ERROR] Amino acid of 'transl_except' qualifier [#Value] is not changed from conceptual translation.
[ERROR] Amino acid of 'transl_except' qualifier [#Value] is not [TERM].
[ERROR] Stop codon is specified by 'transl_except' qualifier [#Value] in mid of CDS location.
[ERROR] Entry [#Entry name] is NOT found in sequence entries.
[FATAL] Proper 'Codon Table' is not found in 'src' folder.
Link
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC22
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC23
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC24
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC25
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC18
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC19
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC20
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC21
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC04
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC05
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC06
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC07
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC08
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC09
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC10
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC11
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC12
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC13
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC14
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC15
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC16
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC17
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC01
[FATAL] Proper 'Amino Table' is not found in 'src' folder.
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC02
[FATAL] Unable to execute Translation.
http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC03
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
70
入力例1
16S rRNAアノテーションの入力例
6.Templateにて"16S rRNA sequence"を選択した場合
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
71
例 16S rRNAアノテーションの入力
① クリックして、必要な
qualifierを追加しておきます。
② Editアイコンをクリッ
クします。
必須feature、推奨qualifierが
初期値として選択されていま
す。
Link:
• Feature key の定義
• Qualifier key の定義
• Organism qualifier に記載する生物名
• CDS feature について
• Location の記述法
2014年6月12日
rRNA featureのlocation、
プロダクト名が初期値
として記載されます。
追加情報がある場合
にダブルクリックすれ
ば、テキストでの自由
記載が可能です。
このページで入力を中断・再開するにはブラウザでブックマークするか、
ページのURLを保存してください。ブラウザーを閉じた後でもブックマークした
URLを用いて、再開することが可能です。
第29回 DDBJing 講習会 (DDBJ)
72
Qualifierを追加するにはSelect Qualifierアイコンをクリック
追加したいqualifier横のチェックボックスにチェックを加えて、
Save をクリックすると、qualifierを追加できます。
qualifierを消す場合は、チェックを外します。値が入力された
qualifierの消去を行う場合"確認ダイアログ"が出現しますの
で、"OK"をクリックすると消去できます。
アノテーションに必須なqualifierは消去不可能です。
templateの種類により、選択可能なqualifierは
異なります。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
73
"Edit"クリック時の編集画面
生物名を学名で入力します(参
考: 補足資料「生物名の入力に
ついて」、「生物名入力における
カテゴリーの選択について」)
strain および、採取情報を
入力します
該当情報がない場合は、
空欄にします。
rRNAのlocationが配列全長として
自動的に設定されます。必要に応
じて修正します。
16S rRNAのテンプレート選択しているの
で、プロダクト名は初めから入力済みに
なっており修正不可能です。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
入力後、Saveをクリックします
74
1件目入力完了時
2件名以降も、1件目と同様にEditアイ
コンをクリックして入力を行い、アノ
テーション入力を完了させてください。
Link:
• Feature key の定義
• Qualifier key の定義
• Organism qualifier に記載する生物名
• CDS feature について
• Location の記述法
2014年6月12日
値が空欄のqualifierは、DDBJに送信されるア
ノテーションファイル中に出力されません。
このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURL
を保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開す
ることが可能です。
第29回 DDBJing 講習会 (DDBJ)
75
annotation入力後"Confirm"をクリックしてチェックを行う
annotation入力後、Confirmをク
リックします。入力した内容の書
式チェックが行われます
参考:
補足資料「エラーチェックに関する仕様」
2014年6月12日
チェック後、次のステップに進める場合のみ、
"Next"がクリック可能になります。チェックで
Errorが生じる場合はクリックできません
このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURL
を保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開す
ることが可能です。
第29回 DDBJing 講習会 (DDBJ)
76
入力例2
ミトコンドリアCOI配列の入力画面例
6.Templateにて"single protein-coding sequence
(CDS), organelle"
を選択した場合の画面例
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
77
この例では /isolate, /collection_date, /lat_lon,
/dev_stage を選択しています。
テクニック2
Edit Column を利用すれば、エクセルなどで
作成したリストからのpasteが可能
補足資料「Edit Columnをクリックした場合」
⇒下表に続く
⇒上表からの続き
テクニック1
編集アイコンから copy 機能
を利用すれば、同じ値のcopy
が可能
補足資料「Qualifierの編集ア
イコンをクリックした場合」
2014年6月12日
Link:
•
Feature key の定義
•
Qualifier key の定義
•
Organism qualifier に記載する生物名
•
CDS feature について
•
Location の記述法
このページで入力を中断・再開するにはブラウザでブックマークするか、ページの
URLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再
開することが可能です。
第29回 DDBJing 講習会 (DDBJ)
78
入力例3
ミトコンドリアゲノム部分配列のannotation入力例
6.Templateにて other を選択した場合
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
79
① "Select Qualifier"で、qualifierを追加します。
この例では、
country
isolate
② このsourceで追加したqualifierを、以降のすべてのエント
organelle
リーのsourceフィーチャーにもコピーしたい場合には、このア
を追加しました。
イコンをクリックします。なお、qualifierの値はコピーされま
せん。
③ Editをクリックして
source feature への入力
を行います。
参考:
•
Feature key の定義
•
Qualifier key の定義
•
Organism qualifier に記載する生物名
•
CDS feature について
•
Location の記述法
2014年6月12日
このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURL
を保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開す
ることが可能です。
第29回 DDBJing 講習会 (DDBJ)
80
Editクリック時
生物名を学名で入力します(参
考: 補足資料「生物名の入力に
ついて」、「生物名入力における
カテゴリーの選択について」)
各情報を入力します
genetic code には生物名入力時に整数値
が自動入力されることを確認、空欄であれ
ば手動でgenetic code(整数値)を入力
入力後、Saveをクリック
④ ここをクリックし、追加したいfeature
をリストから選択すると追加されます
⑤ feature配下に追加すべき
qualifierがある場合に
"Select Qualifier"をクリックし
ます
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
81
⑥ 追加したfeature の locationを修正し
ます。クリックすると入力ウインドウが
現れるので、値を入力します。
⑦ qualifier値を編集します。
qualifierをクリックすると入力ウインドウが現れるので、値
を入力します。
⑧ 続いて、次のfeatureを追加します。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
82
⑨ 同様に、qualifierを選択してから、
値を入力します。この操作をfeature
の数だけ繰り返します。
featureやqualifierを追加後、"Edit"ク
リックによりエントリー単位で編集する
ことも可能です。
入力後、Confirm をクリックします。
入力したアノテーションの書式チェック
が行われます。
2014年6月12日
第29回 DDBJing 講習会 (DDBJ)
83