DDBJ Nucleotide Sequence Submission Systemの紹介 小菅 武英 Takehide Kosuge, Ph.D DDBJセンター、アノテーター DDBJ, Annotator 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 1 目次 メイン 補足 目次 塩基配列データの登録受付は2種類 データ登録~公開までの流れ DDBJフラットファイル(flat file) 塩基配列の登録を開始する前に 必要な情報について 典型的な登録事例(アノテーション)の見本 フィーチャー、クオリファイア、生物名、CDS、Location 説明 ページへのリンク DDBJ塩基配列登録システムの特徴 登録を開始する データ登録ページ Web版塩基配列登録システムの説明ページ 9 10 11 12 13 DDBJ Nucleotide Sequence Submission System スタート画面 Submission System における入力の流れ 各入力ページの説明 画面上部にあるプログレスバーについて 1. Contact person 登録開始メールについて 2. Hold date 3. Submitter 4. Reference 5. Sequence 14 15 19 20 21 22 23 24 25 26 27 入力可能な塩基配列について 6. Template 7. Annotation 表形式入力画面 7. Annotation Templateでotherを選択した際の入力画面 Confirm後、"Next"ボタンクリック時に表示される最終確認画面 8. Finish 登録完了メール よくある入力ミス 2014年6月12日 2 3 4 5 6 7 8 28 29 30 31 32 33 34 補足資料 プログレスバーで画面を遷移して修正したときの注意事項 2. Submitter画面 登録者の追加・削除・表示順の変更操作 4. Reference画面 Unpublished の場合 In press 選択時 Published 選択時 Journal入力欄におけるJournal名の入力補助機能について 例: Journal of biological chemistry の検索 TPA 登録を行う場合の塩基配列入力画面 TPA登録における Assembly Information の書式 Assembly Information 入力規則 編集操作 Qualifierの編集アイコンをクリックした場合 Edit Columnをクリックした場合 セルのダブルクリックまたはTemplate: other選択時の場合に 青色文字(qualifierなど)をクリック 生物名の入力について genetic codeについて 生物名入力におけるカテゴリーの選択について Category: デフォルトの入力欄 Viruses/Phages 選択時の入力 Environmental Samples 選択時の入力 Artificial construct 選択時の入力 A known species but unregistered in taxonomy database 選択時の入力 Not found in taxonomy database, but already registered in other sequence data 選択時の入力 A novel species to be proposed in the paper 選択時の入力 annotation file の upload Upload 可能な annotation file について annotation file 例 エラーチェックに関する仕様 Upload & Confirmクリック後の画面 Errorが無い場合 Error/Warningが生じた場合 Confirmクリック後の画面 error無しの場合 errorが生じる場合 warningが生じる場合 SubmitterまたはReference内にerrorがある場合 Error/Warning説明ページへのリンク CDSフィーチャーにおける翻訳エラーと説明ページへのリンク 入力例1 16S rRNAアノテーションの入力例 入力例2 ミトコンドリアCOI配列の入力画面例 入力例3 ミトコンドリアゲノム部分配列のannotation入力例 第29回 DDBJing 講習会 (DDBJ) 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 77 79 2 塩基配列データの登録受付は2種類 登録者 小規模なアノテーション付きの塩基配列 Mass Submission System (MSS) DDBJ Nucleotide Sequence Submission System (DDBJ塩基配列登録システム) 登録者自身で登録用書式に基 づいて登録ファイルを作成 登録用ファイル送信は主にEmail 経由 ウェブブラウザを使用 指定箇所に入力 公開後はデータの共有 が行われるため、DDBJ に登録すればGenBank やENAからも検索が可能 2014年6月12日 多件数または長大な塩基配列 DDBJ GenBank INSDC* ENA 第29回 DDBJing 講習会 (DDBJ) *INSDC =International Nucleotide Sequence Database Collaboration http://www.insdc.org/ 3 データ登録~公開までの流れ フラットファイル の公開 登録者 (Submitter(s)) 即日公開 回答(email) 塩基配列登録 システム 問題点が なくなるまで 繰り返す または アクセッション 番号発行 問い合わせ(email) データに不足, 不備や不明な点 がある場合 指定した日付まで非公 開。ただし、以下の場合 は公開処理を行います • • • DDBJ (annotator) 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 指定した公開日が 到来したとき 登録者から公開依 頼を受けた時 アクセッション 番号 の公表をDDBJで 確認できた場合 4 DDBJフラットファイル(flat file) DDBJ で作成 DEFINITION 行 (塩基配列の概要が示される) アクセッション番号 生物分類情報 登録者情報 塩基配列登録システムに 入力した内容がこの領域 に記載されます 文献情報 アノテーション Feature Location /Qualifier Feature = source, CDS など Location = 塩基配列上の ポジション Qualifier = feature 配下に / で示される /clone, /gene, /product など 配列情報 2014年6月12日 LOCUS DEFINITION ABxxxxxx 450 bp mRNA linear HUM 01-JUN-2014 Homo sapiens GAPD mRNA for glyceraldehyde-3-phosphate dehydrogenase, partial cds. ACCESSION ABxxxxxx VERSION ABxxxxxx.1 KEYWORDS . SOURCE Homo sapiens ORGANISM Homo sapiens Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae; Homo. REFERENCE 1 (bases 1 to 450) AUTHORS Mishima,H. and Shizuoka,T. TITLE Direct Submission JOURNAL Submitted (30-NOV-2013) to the DDBJ/EMBL/GenBank databases. Contact:Hanako Mishima National Institute of Genetics, DNA Data Bank of Japan; Yata 1111, Mishima, Shizuoka 411-8540, Japan REFERENCE 2 AUTHORS Mishima,H., Shizuoka,T. and Fuji,I. TITLE Glyceraldehyde-3-phosphate dehydrogenase expressed in human liver JOURNAL Unpublished (2013) COMMENT Human cDNA sequencing project. FEATURES Location/Qualifiers source 1..450 /chromosome="12" /clone="GT200015" /clone_lib="lambda gt11 human liver cDNA (GeneTech. No.20)" /map="12p13" /mol_type="mRNA" /organism="Homo sapiens" /tissue_type="liver" CDS 86..>450 /codon_start=1 /gene="GAPD" /product="glyceraldehyde-3-phosphate dehydrogenase" /protein_id="BAA12345.1" /transl_table=1 /translation="MAKIKIGINGFGRIGRLVARVALQSDDVELVAVNDPFITTDYMT YMFKYDTVHGQWKHHEVKVKDSKTLLFGEKEVTVFGCRNPKEIPWGETSAEFVVEYTG VFTDKDKAVAQLKGGAKKV" BASE COUNT 102 a 119 c 131 g 98 t ORIGIN 1 cccacgcgtc cggtcgcatc gcacttgtag ctctcgaccc ccgcatctca tccctcctct 61 cgcttagttc agatcgaaat cgcaaatggc gaagattaag atcgggatca atgggttcgg 121 gaggatcggg aggctcgtgg ccagggtggc cctgcagagc gacgacgtcg agctcgtcgc 181 cgtcaacgac cccttcatca ccaccgacta catgacatac atgttcaagt atgacactgt 参考 241 gcacggccag tggaagcatc atgaggttaa ggtgaaggac tccaagaccc ttctcttcgg 301 tgagaaggag gtcaccgtgt tcggctgcag gaaccctaag gagatcccat DDBJ のデータ公開形式 (flatggggtgagac file) の説明 361 tagcgctgag tttgttgtgg agtacactgg tgttttcact gacaaggaca aggccgttgc 421 tcaacttaag ggtggtgcta agaaggtctg http://www.ddbj.nig.ac.jp/sub/ref10-j.html // 第29回 DDBJing 講習会 (DDBJ) 5 塩基配列の登録を開始する前に Submit可能な配列は、アノテーション付きの塩基配列です 一度のsubmissionで1024件までの入力が可能です (ただし各PCの環境により、一度に登録可能な最大件数は1024に 達しない場合もございます。この1024の設定値はDDBJ側のシステム環 境により変更する可能性があります) ブラウザは Firefox、Chrome を推奨しています。その他、 IE10、IE11、 Safari などでも経験上使用可能ですが、IE8では使用できません DDBJからのメールを受信できるようにしておいてください ※ 以下の場合はMass Submission Systemを利用してください。 ・ エントリ数(登録する配列の数)が多い場合 1024 を超えると塩基配列登録システムでは分割が必要です ・ 1エントリあたりに多数(概ね30以上)のFeature がある場合 ・ 配列が長い (目安は 500 kb 以上) 場合 ・ その他、塩基配列登録システムが対応していない登録 EST、STS、TSA、HTC、GSS、HTG、WGS、CON(AGP)など (http://www.ddbj.nig.ac.jp/sub/data_categories-j.html, Divisionを参照) 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 6 塩基配列の登録を開始する前に 必要な情報について • コンタクトパーソン (登録者のうちDDBJと連絡できる方の氏名、Email、所属情報) • 登録者(可能な限り複数名を指定) • hold date (非公開にしておく期日) or 即公開希望 • 塩基配列に直接かかわるReference (著者、タイトル) • 塩基配列(vector、linker、adaptor領域等がトリミング処理済であること) • 塩基配列に対して記載するアノテーション 塩基配列を得た生物の学名 その生物の採取情報、ストレイン(/strain)、配列を得た組織名(/tissue_type) など 塩基配列の分子種(mRNA or genomic DNA or その他) 遺伝子の塩基配列上の位置(location) protein-coding sequence (CDS)の場合は開始コドンから終止コドンまでの位置 遺伝子の gene symbol(/gene)とプロダクト名(/product) など 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 7 塩基配列の登録を開始する前に 典型的な登録事例(アノテーション)の見本 http://www.ddbj.nig.ac.jp/sub/example-j.html 2014年6月12日 典型的な登録事例(アノテーション)の見 本をDDBJホームページに用意していま す。アノテーションの参考にしてください 第29回 DDBJing 講習会 (DDBJ) 8 塩基配列の登録を開始する前に フィーチャー、クオリファイア、生物名、CDS、Location 説明ページへのリンク Feature key (フィーチャーキー) の定義 http://www.ddbj.nig.ac.jp/sub/ref5-j.html Qualifier key (クオリファイアキー) の定義 http://www.ddbj.nig.ac.jp/sub/ref6-j.html 生物名に関する入力規則 http://www.ddbj.nig.ac.jp/sub/ref8-j.html タンパク質コード配列(CDS)に関する説明 http://www.ddbj.nig.ac.jp/sub/cds-j.html Location (塩基配列上の位置情報)記述法 http://www.ddbj.nig.ac.jp/sub/ref9-j.html 登録の見本 http://www.ddbj.nig.ac.jp/sub/example-j.html 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 9 DDBJ塩基配列登録システムの特徴 • Submission完了までにかかる時間を短縮できます (前登録システムの SAKURA との比較) • 16S rRNA配列, 1 CDSの配列, Influenza A virus 配列の登録など、典型 的な事例に対しては、アノテーション入力用テンプレートを用意しました。 アノテーションの内容に応じた feature key、qualifier key が自動で選択さ れる上、表形式の入力が可能です • Multi-fasta形式の塩基配列を一度に入力することができます • feature key、qualifier keyを自分で選ぶ入力方式にも対応しています • DDBJアノテーションファイルのアップロードにも対応しています • ブラウザでブックマークすることで、容易に入力の中断・再開が可能です 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 10 登録を開始する http://www.ddbj.nig.ac.jp/ DDBJホームページから"登録 "アイコンをクリックする 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 11 データ登録ページ DDBJ Nucleotide Sequence Submission Systemをクリック 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 12 Web版塩基配列登録システムの説明ページ 使い方の説明 アノテーション記 載に関する各説 明ページへのリ ンク ベクター配列の コンタミチェック "新規登録の開始"をクリック すると塩基配列登録システ ムページに遷移します 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 13 DDBJ Nucleotide Sequence Submission System スタート画面 Create new submission をクリックしてスタートします 動作確認済みの推奨ブラウザ Firefox または Chrome Safari、IE10、IE11 などにおいても経験上動作可能 ただしIE8では使用できません 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 14 Submission System における入力の流れ "Create new submission"をクリックしてスタート 1. Contact person を入力 メール受信、メール内リンクを開く 2. Hold date を指定 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 15 3. Submitter を入力 4. Reference を入力 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 16 5. 塩基配列を入力 TPAの場合にはAssembly Information も入力 6.アノテーション入力用テンプレートを 選択。アノテーションをuploadするか、 直接入力するかを選択 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 17 7. アノテーションを画面上で入 力、または、 uploadする エラーがなくなるまでアノテー ションチェック、修正を繰り返す、 最終確認画面表示 8. 完了 登録完了のメールを受信 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 18 各入力ページの説明 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 19 画面上部にあるプログレスバーについて 入力画面上部には進捗を示す プログレスバーが表示されます 入力済みのページは青字に変化し、 クリック可能になり各ページに直接 ジャンプできます 参考: 補足資料「プログレスバーで 画面を遷移して修正したときの注 意事項」 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 20 1. Contact person コンタクトパーソンは連絡の窓口となる方で登録者の中の1人を指定します DDBJからの問い合わせに対する窓口となる方の電子メールアドレス を入力してください コンタクトパーソンの氏名を full name で入力します Email, Fax, Phone について フラットファイル 中で配列ととも に公開してもよ い場合にチェッ クを加えます 国名をリストから選択します 同時に、fax、phoneの国番号が自動選択され ます FAX番号を入力します FAXを利用できない場合にはチェックを加えてください 電話番号を入力します(連絡に内線番号が必要な場合 は内線番号も入力してください) 所属機関名を入力します 所属部署名を入力します(任意) URLを入力します(任意) 郵便番号を入力します 市町村名を入力します 都道府県名を入力します(任意) 市町村名以降の住所を入力します 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 入力が済んだらNextをクリックし ます。入力したメールアドレス宛 にメールが自動送信されます。 21 登録開始メールについて コンタクトパーソンメールアドレス宛に登録開始用のリンクを含むメールが自動的 に送信されます。 1時間以内にメール内のリンクから登録を続けてください。 "1.Contact person" ページのEmailアドレスが間違っている場合はメールが届きま せん。Emailアドレスを修正し、再度Next をクリックしてください。 Subject: DDBJ: Starting the submission To: [email protected] National Institute of Genetics Dear Hanako Mishima Thank you for using DDBJ. This email contains a link for proceeding of your nucleotide data submission. Please click the link below, then, you can continue your registration. http://ddbj.nig.ac.jp/submission/submissions/5036c6ee55d698c0ad000324/mail_confirmation?token=47444d24e210 6dd81a323f6ed559b715ec8cbbab If you are not related person of the submission, please discard the email . メール本文内でリンクがかかっている場合はここをクリック Note : You must activate your new submission within 1 hour. If you failed すればブラウザが開きます。 to activate, please try again from the "Contact person" page. Note : You can not reply to this mail. リンクがかかっていない場合は、ここをコピーしてブラウザ のURL欄に張り付け、リターンキーを押します。 If you encounter trouble while using this submission system, please send an email to [email protected] and let us know the browser's URL of your submission. Thank you, DNA Data Bank of Japan 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 22 2. Hold date 公開日(Hold date)をカレンダーから選択するか、即公開を選択します。 カレンダーアイコンをクリックし、表示さ れるカレンダーから公開希望日を指定 してください または、即公開希望の場合は ここにチェックを加えてください 入力が済んだらNextをク リックします • カレンダーでは、6か月後の日付が自動的にハイライトされています • 年末・年始はDDBJの休業期間のため選択できません • 選択できる日付は最大3年後までです 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 23 3. Submitter Submitter (登録者) 名を入力します Contact person の 氏名が自動変 換され初期値として入力されます。 修正が必要な場合は適宜変更し てください。 ・Addで登録者を追加できます (補足資料「2. Submitter」参照) ・DDBJでは複数の登録者の指定 をお願いしております ・入力した順序通りにフラットファ イル上に表示されます 論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. 複数の登録者を記載するようお願いいたします。 Kim,C.S. Wang,Y.Q. 登録データの修正・更新を行える権利は登録者の みが有しております。 入力が済んだらNextをク リックします 参考 登録者(Submitter) の定義 http://www.ddbj.nig.ac.jp/sub/submitter-j.html 2014年6月12日 登録者が1名のみの場合、将来、修正が必要に なった際に私どもから登録者本人への連絡がとれ ない場面に遭遇することもございます。1名の登録 者のみでの登録も可能ですが、複数の登録者を記 載いただけるよう推奨しております。たとえば、実作 業者と研究指導者(責任者)、論文著者から登録者 に加えるなど、2名以上の登録者記載に関しまして ご協力をお願いいたします。 このページで入力を中断・再開するにはブラウザでブックマークす るか、ページのURLを保存してください。ブラウザーを閉じた後でも ブックマークしたURLを用いて、再開することが可能です。 第29回 DDBJing 講習会 (DDBJ) 24 4. Reference Reference情報を入力します 配列に関する主論文(Primary citation)を第一referenceに入力してください デフォルトで Unpublished が選択されています 論文準備中の場合、論文投稿後、論文を作成する予定がない 場合はUnpublished を選択します 論文が受理されているときは In press、 論文がすでに公開されているなら Published を選びます Unpublished、In press、Published の選択に応じで入力欄が切り 替わります(補足資料 「4. Reference」参照) Referenceを追加する 場合にクリックします 参考 Reference http://www.ddbj.nig.ac.jp/sub/reference2-j.html 2014年6月12日 論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q. 入力が済んだらNextを クリックします このページで入力を中断・再開するにはブラウザでブックマークするか、 ページのURLを保存してください。ブラウザーを閉じた後でもブックマー クしたURLを用いて、再開することが可能です。 第29回 DDBJing 講習会 (DDBJ) 25 5. Sequence デフォルトで”Yes”が選択されています、自身で塩基配列決定していれば ここは "YES" のままにします。 公開されているデータベースから塩基配列を一部でも引用している場合 は "No." を選んでください、TPA入力モードに切り替わります (補足資料 「TPA 登録を行う場合の塩基配列入力画面」参照)。 塩基配列を ペーストします 注意!: アノテーション入力後、この ページにおいて塩基配列を変更した場 合、7.Annotationで入力した内容は失わ れます。 または、塩基配列ファ イルをここからupload します 入力が済んだらNextを クリックします このページで入力を中断・再開するにはブラウザでブックマークする か、ページのURLを保存してください。ブラウザーを閉じた後でもブッ クマークしたURLを用いて、再開することが可能です。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 26 入力可能な塩基配列について Multi-FASTA形式の塩基配列をペースト(またはアップロード)可能です。 Entry name (エントリー名)は、24文字までの半角・英数記号(ただしスペース、 "、?、¥、バックスラッシュを含まない)を用いて設定してください。 Entry name にはそれぞれ異なる名称を付けてください。 同じ Entry name が使用されている場合はエラーとなるため Entry name の修 正が必要になります。 各エントリーの区切りに // を含んでいてもいなくても、問題ありません(例1、 例2 のどちらでも良い)。 本システムでは // 無しの塩基配列を入力した場合、各エントリーの区切りとし て // が自動的に挿入されます。 塩基配列は、a, c, g, t, m, r, w, s, y, k, v, h, d, b, or n のいずれかで構成される 必要があります。 塩基配列中の スペース、数字は自動的に削除されます。 例1 >CLN01 ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa >CLN02 ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa 例2 >CLN01 ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa // >CLN02 ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa // 塩基配列中の大文字は自動的に小文字に変換されます 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 27 6. Template ページ内に挙げられているアノテーションパターンに完 全に合致する場合、template を利用した表形式でのア ノテーション入力が可能になります。リストのいずれか を選択し、"Input annotation"をクリックしてください。 例えば、バクテリア16S rRNAの登録を行う場合はここを 選択します。 上記リストに該当する項目がな い場合にother を選択します。 この場合、テーブル形式のアノ テーション入力は利用できませ ん。 注意!: アノテーション入力後こ のページにおいてテンプレートを変 更した場合、7.Annotationで入力し た内容は失われます。 アノテーションファイルのuploadに も対応しています。upload機能の説 明は補足資料「annotation file の upload」をご覧ください。 template選択後、"Input annotation"をクリックします このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してくだ さい。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 28 7. Annotation 表形式入力画面 "6.Template"画面でother以外を選択した場合には表形式のアノテーション入力 画面になります。 基本操作 ① sourceフィーチャー横の"Select Qualifier"アイコンをクリック、Qualifierを追加し ておく。sourceフィーチャー以外のフィーチャーにおいても必要であれば"Select Qualifier"からQualifierを追加する。 ② 各エントリーで"Edit"アイコンをクリックして入力していく ③ Confirmをクリック、Errorがある場合は②に戻って修正 ④ Confirmクリック、ErrorがなくなるとNextボタンがクリック可能になる ⑤ Nextをクリック、最終確認画面に遷移 ②: Editクリックで、各エ ントリーごとの編集が 可能です ①: 追加したい Qualifierを選択し ます (a)Qualifier編集アイコン のクリックで列ごとの編 集が行えます 塩基配列入力時に各 配列の先頭行に指定し たEntry nameが表示さ ③: annotation入力後、 れます Confirmをクリックします。 入力した内容の書式チェッ クが行われます。 2014年6月12日 "Edit"アイコンからの入力に加え次の入力方法が可 能です a. Qualifier下に表示されている編集アイコンをクリッ クする (補足資料「Qualifierの編集アイコンをク リックした場合」参照」) b. Edit Columnの文字をクリックする(補足資料「Edit Columnをクリックした場合」参照」) c. セルをダブルクリックする(補足資料「セルのダブ ルクリックまたはTemplate: other選択時の場合に 青色文字(qualifierなど)をクリック」参照」 ) ?アイコンクリックで各 feature、qualifierの説明 ページが開きます (b)Edit Columnをクリックした 場合、列ごとの編集が行え、 copy & pasteによる一括入力 が可能です ④⑤: チェック後、次のステップに進める 場合のみ、"Next"がクリック可能になりま す。アノテーションチェックで問題がある 場合はクリックできません。 第29回 DDBJing 講習会 (DDBJ) 追加情報がある場合 にダブルクリックすれ ば、テキストでの自由 記載が可能です。 (c)各セルをダブルクリックし て入力・編集が可能です このページで入力を中断・再開するにはブラウザで ブックマークするか、ページのURLを保存してください。 ブラウザーを閉じた後でもブックマークしたURLを用い て、再開することが可能です。 29 7. Annotation Templateでotherを選択した際の入力画面 基本操作 ① sourceフィーチャーの"Select Qualifier"アイコンをクリック、sourceフィーチャー配下 に記載するQualifierを追加しておく ② "Edit"アイコンをクリックしてsourceフィーチャー配下の情報を入力する ③ Add featureから必要なfeatureを追加。追加したfeatureに必要なQualifierは自動で 選ばれているが、必要であれば適宜追加したfeatureの"Select Qualifier"アイコンをク リックして qualifierを追加しておく ④ 追加したfeature配下のlocation、qualifier をクリックしてアノテーションを入力、③④ をfeatureの数だけ繰り返す ⑤ "Confirm"ボタンをクリック、Errorがある場合は修正 ⑥ "Confirm"をクリック、Errorがなくなると"Next"ボタンがクリック可能になるので "Next" をクリック、最終確認画面に遷移 ①: "Select Qualifier"クリックで、 qualifierを追加します ※ クリックすると、sourceフィーチャーに選 択されたクオリファイアが次のエントリー 以降にコピーされます ②: "Edit" クリックで、エントリーご との編集が行えます "Edit"アイコンによる入力に加え次の方法が可能です a. sourceフィーチャー限定、qualifier左側に表示され ている編集アイコンをクリックする (補足資料 「Qualifierの編集アイコンをクリックした場合」参 照」) b. locationやqualifierをクリックする(補足資料「セル のダブルクリックまたはTemplate: other選択時の 場合に青色文字(qualifierなど)をクリック」参照」 ) ③: featureを追加するには、Add featureを クリックします。フィーチャーリストからマウ スで選択、クリックすると追加可能です。こ の図はCDSを追加したときの例です ④: 追加したfeature の location, qualifierを クリックして値を入力します。 ③④を繰り 返します "Comment"クリックで、 必要に応じ、追加情報を自由テキス ト記載で入力することが可能です (b) Qualifierやlocationなどの青色文字を 直接クリックすることでも編集可能です (a) 全エントリーを対象に、クリッ クしたクオリファイア値の編集が 行えます 2014年6月12日 ⑤: annotation入力後、 Confirmをクリックします。入力 した内容の書式チェックが行 われます ⑥: チェック後、次のステップに進 める場合のみ、"Next"がクリック可 能になります。アノテーション チェックで問題がある場合はクリッ クできません このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。 ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。 第29回 DDBJing 講習会 (DDBJ) 30 Confirm後、"Next"ボタンクリック時に表示される 最終確認画面 これまでに入力してきた 内容をテキストファイルで 閲覧可能です ※ この欄にはテキスト 入力が可能ですので、 伝えておきたい事項が あれば記載しておいて ください 2014年6月12日 問題がなければ、どちらかの "Submit to DDBJ" ボタンをクリックします。"8. Finish" 画 面に移動します。 修正を行う場合、画面上部のプログレスバー をクリックし、各画面にジャンプして編集後、 各画面で必ず Next をクリックしてください。 "5.Sequence"、"6.Template"で変更操作を行 うと入力済みのアノテーションが消去される 点については注意してください。 各画面で修正後、画面上部プログレスバー "7.Annotation"をクリックすると、アノテーショ ン入力画面にジャンプできます。 "7.Annotation" 画面において Confirm後、 Next をクリックすると再度この画面が表示さ れます。 第29回 DDBJing 講習会 (DDBJ) 31 8. Finish DDBJに登録ファイルが転送されました。 この画面が出れば登録完了です。 同時に、登録完了のメール(次ページ)が自動送信さ れます。 ※ このページの URL をブックマー クしておけば、短期間、閲覧可能 です。 入力した内容をDDBJ登録形式でダウン ロードできますので、ファイルの保存を行っ てください。同じファイルがDDBJサーバー に自動転送されますので、これらのファイ ルをDDBJにお送りいただく必要はございま せん。 本システムにおいて問題が生じ場合 は、ここのメールアドレス宛てに連絡 を行ってください。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 32 登録完了メール From: [email protected] Subject: DDBJ: Web submission completed Contact person : [email protected] Hanako Mishima National Institute of Genetics DDBJ center, DDBJ 1111 Yata Mishima, Shizuoka, 411-8540 Japan Thank you very much for choosing DDBJ for data submission. We have received your data. We will soon check and annotate them on the basis of the manual and rules common to the DDBJ, EMBL-Bank, and GenBank. If you do not hear from DDBJ after 5 working days after receiving this notice, please contact us at the following address indicating your Entry ID. Email address: [email protected] Sincerely, DNA Data Bank of Japan DDBJ Center National Institute of Genetics Research Organization of Information and Systems Mishima, Shizuoka 411-8540, Japan fax: +81-55-981-6849 [Hold-date] 2013-03-29 [Entry ID] 5065382e55d69849870005fe.entry01 5065382e55d69849870005fe.entry02 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 33 よくある入力ミス • 塩基配列がmulti-fasta形式で入力されていないため、annotation画面の表 示がおかしくなる • クローニング時に人為的に加えられたvector、adapter、linker、primer領域は トリミングする → VecScreenでチェック(http://ddbj.nig.ac.jp/vecscreen/) • genetic code が適切に入力されていないため、CDSが翻訳エラーになる → 補足資料:「genetic codeについて」を参照 • 開始コドンや終止コドンが含まれない部分配列の場合にCDS の locationが 部分配列指定で入力されていないために翻訳エラーになる → Location記述法(http://www.ddbj.nig.ac.jp/sub/ref9-j.html) やタンパク 質コード配列; CDS feature について(http://www.ddbj.nig.ac.jp/sub/cdsj.html などを参考に修正する • "MGA:No entry name is found other than [ COMMON ], without feature [ DATATYPE/type=MGA ]."という訳の分からないエラーが表示される → /organism、/mol_typeを入力する前に"Confirm"をクリックしたため、 annotationを入力してから"Confirm"をクリックする 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 34 補足資料 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 35 プログレスバーで画面を遷移して修正したとき の注意事項 各ページ名をクリックすることで、前のページに戻って閲覧・修正 することが可能です。修正後は、各ページ下部にある"Next"をク リックしてください "5.Sequence"ページで塩基配列を差し替えた場合、入力したアノ テーションが消去されます "6.Template"ページでテンプレートを修正した場合、入力したアノ テーションが消去されます 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 36 2. Submitter画面 登録者の追加・削除・表示順の変更操作 登録者を追加するには "Add"をクリックします Addをクリックすると現れる入力 欄に登録者とメールアドレスを入 力してください 順番入れ替え 下に移動 登録者の順番を変えるには 登録者を削除するには 削除 順番入れ替え 上に移動 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 37 4. Reference画面 Unpublished の場合 Yearは入力の必要がありません。自動で 今年の西暦年が入力済みになります。 論文タイトルを入力します。 論文を準備されない場合も、塩基配列情 報に応じてた適切なタイトルを記載してくだ さい。 論文の著者名を各欄に1名ずつ入力してください。 Add authorsで入力欄を追加できます。 X をクリックすると入力欄を消せます。 入力が済んだらNextを クリックします 論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q. 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 38 4. Reference画面 In press 選択時 In press選択時、ジャーナルの略称(ISO abbreviation)を入力してく ださい。この入力欄にはジャーナル名の入力補助機能がついて います 参考:補足資料「Journal入力欄におけるJournal名の入力補助機 能について」 Yearを入力します 論文タイトルを入力します 論文の著者名を各欄に1名ずつ入力してください Add authorsで入力欄を追加できます X をクリックすると入力欄を消せます 論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q. 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 39 4. Reference画面 Published 選択時 Yearを入力します In press選択時、ジャーナルの略称(ISO abbreviation) を入力してください。この入力欄にはジャーナル名の 入力補助機能がついています 参考:補足資料「Journal入力欄におけるJournal名の 入力補助機能について」 論文タイトルを入力します Volume、Page、を入力します DOI が分かる場合は入力してください 論文の著者名を各欄に1名ずつ入力してください Add authorsで入力欄を追加できます X をクリックすると入力欄を消せます 論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q. 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 40 Journal入力欄におけるJournal名の入力補助 機能について Journal Name欄にfull nameを入力いただく途中でジャーナル名の候補リストが表示されます。 リストから選択することでISO Abbreviationに自動変換されます。 入力補助辞書は、 NLM Catalog を使用しております。 ISO Abbreviation については、NLM Catalog で検索することができます。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 41 例: Journal of biological chemistry の検索 NLM Catalog(http://www.ncbi.nlm.nih.gov/nlmcatalog/)の ページにアクセスします 検索したいジャーナル名[journal] を検索窓に入力し、Search をクリックします 例 journal of biological chemistry[journal] クリックする 候補が表示されます 検索結果から、該当する方を クリックします ISO Abbreviation はこれです 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 42 TPA登録を行う場合の塩基配列入力画面 自身で塩基配列を決定したのではなく、公 開されている塩基配列を引用して塩基配列 を構築した場合は "No" を選択してください。 TPA登録モードに切り替わります。 TPA配列の構築情報(次 ページ参照)をペーストしま す。各列が空白で区切ら れていることが重要です。 塩基配列をここに ペーストします。 または、塩基配列ファ イルをここからupload します。 このページで入力を中断・再開するにはブラウザでブックマークす るか、ページのURLを保存してください。ブラウザーを閉じた後でも ブックマークしたURLを用いて、再開することが可能です。 2014年6月12日 入力後、Next を クリックします 第29回 DDBJing 講習会 (DDBJ) または、Assembly Information のファイルをこ こから upload します 43 TPA登録における Assembly Information の書式 入力例 FA01 BM123 Entry Name TPA_SPAN 1-552 553-705 1-438 377-695 411-790 790-1191 PRIMARY_IDENTIFIER ZZ000001.1 ZZ000002.5 ZZ000010.1 ZZ000011.1 ZZ000021.12 ZZ000022.0 TPA 配列上の location を記載 プライマリーエントリの アクセッション番号を バージョン番号とともに 入力する。 PRIMARY_SPAN 54872-55422 1-153 1-438 1-320 1-398 1-401 COMPLEMENT c 相補鎖に対応 する場合のみ c を記載 プライマリーエントリの 領域を入力する。 <入力例の意味> Entry name FA01 において; TPA塩基配列 1-552 の領域は ZZ000001.1 の 54872-55422 に対応 TPA塩基配列 553-705 の領域は ZZ000002.5 の 1-153 に対応 Entry name BM123 において TPA塩基配列 1-438 の領域は ZZ000010.1 の 1-438 に対応 TPA塩基配列 377-695 の領域は ZZ000011.1の 1-320 の相補鎖側に対応 TPA塩基配列 411-790 の領域は ZZ000021.12の 1-398 に対応 TPA塩基配列 790-1191 の領域は ZZ000022.0 の 1-401 に対応 いずれもTPA とプライマリーエントリの配列アラインメントに関する規則に従います 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 44 Assembly Information 入力規則 第1行目は [tab or space]TPA_SPAN[tab or space]PRIMARY_IDENTIFIER[tab or space]PRIMARY_SPAN[tab or space]COMPLEMENT である必要があります 空行は指定しないでください Entry name は第1列に記載します、Entry name のある行でエントリーごとのAssembly情報が区切られることになります。 TPA_SPAN 書式: X..Y もしくは、X-Y (X, Yは数字、X<Y であることが必要) TPA 配列上の領域を記載します。 例: 100..2000 例: 3400-4000 PRIMARY_IDENTIFIER 書式: accession number.version 引用するプライマリエントリのアクセッション番号をバージョン番号とともに入力します。未公開のアクセッション番号の場合はバー ジョン番号を 0 にしてください。 例: AB123456.1 例: AB987654.0 PRIMARY_SPAN 書式: X..Y もしくは、X-Y (X, Yは数字、X<Y であることが必要) プライマリエントリからの引用領域を入力します。抜き出した領域が TPA_SPANの領域と対応している必要があります。 例: 1..3345 例: 900-1235 COMPLEMENT 書式: 空欄もしくは c プライマリエントリから相補鎖領域を引用する場合にのみ c を指定します。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 45 編集操作 Qualifierの編集アイコンをクリックした場合 クリックしたqualifierにおいて全 エントリーに対しての編集が可 能です。 Copy クリックで、そのエント リー以降にも同じ値がコピー されます。 ただし、件数が多い場合やPC の環境により時間がかかる 場合があります。 Qualifierの値が全エントリー で同一である場合、同一値を 速やかに入力することができ る機能です。 編集後"Save"をクリックします 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 46 Edit Columnをクリックした場合 テキストエリア上への一括pasteが可能 表の列ごとに、各入力欄の編集 が可能です。 このテキストエリアに、直接入力するか、表 計算ソフトやテキストエディタなどからcopy & pasteしてください。エントリーの区切りに は改行を用います。 編集後"Save"をクリックします テキストリストからpasteすることで、全エント リーに対して一括入力を行うことができる機 能です。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 47 セルのダブルクリック または Template: other選択時の場合に青色文字(qualifierなど)をクリック セルのダブルクリック(Template: other選択時は qualifierのクリック)で入力欄が現れます。入力ウイ ンドウに対して必要な値を入力してください 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 編集後"Save"をクリックします 48 生物名の入力について Virus、Phage、環境サンプル、合成配列、 taxonomy databaseに登録が無い場合など の場合に、カテゴリーを選択します。 この欄に塩基配列を得た生 物の学名を入力します。 正確な学名入力のための入 力補助機能が備わっていま す。リスト表示された候補か らマウスでクリックしてくださ い。 生物の入力と同時に、 Templateの種類に応じて genetic codeに整数値が自動 的に入力されます(次ページ 参照)。 入力した生物名を検索キーとして、 NCBI taxonomy検索が実行可能 です。 学名のスペルが曖昧なため調べ たいとき、taxonomic lineageから 検索したいときなどにご利用くだ さい。 学名がtaxonomy databaseに 存在しない場合など、genetic codeが自動的に入力されな いときには、手動でgenetic codeを入力する必要がありま す。 参考 Organism qualifier に記載する生物名 http://www.ddbj.nig.ac.jp/sub/ref8-j.html 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 49 genetic codeについて TemplateでCDSが指定される場合、もしくは、otherを 選択した場合にgenetic codeの入力が必要です。 なぜなら、本システムではCDSフィーチャー配下の /transl_table に記載する整数値を、生物名入力時の genetic code 欄の値から取得するためです。 taxonomy databaseから公開されている学名であれば、 scientific name入力欄で表示される候補リストからマ ウスで選択することによって、genetic codeが自動的に 取得されます。genetic codeが自動入力されない場合 は手動で整数値を入力する必要があります。 genetic code に指定する整数値については、 The genetic code(http://www.ddbj.nig.ac.jp/sub/geneticcode-e.html)をご 覧ください。 (a) 2014年6月12日 "7.annotation"画面において"Edit"アイコンをクリック ↓ (a) 学名をキーボードから入力、loadingアイコン(くる くる回転するマーク)が表示されます。 タイピングが速い場合や、学名を copy & pasteした 場合には、loadingアイコンが出ないときがあります。 この場合は学名の入力欄をクリックし、キーボード の上または下キーを押すことで再検索されます。な お前後に空白があると検索できませんので必ず取 り除いてください。 ↓ (b) 学名が見つかると、候補リストが表示されるので マウスで選択します ↓ (c) genetic code欄に自動的に値が入力されます。 自動入力されない場合には手動で整数値を入力し ます (b) 第29回 DDBJing 講習会 (DDBJ) (c) 50 生物名入力におけるカテゴリーの選択について 塩基配列が由 来するサンプ ルに応じて Categoryを切り 替えてください。 Categoryに応じ て生物名入力 欄が切り替わ ります。 Category 内容 Select only for virus, environmental sample, etc. デフォルトです。以下のカテゴリーでない場合に選択しま す。 Viruses/Phages VirusやPhageの場合に選択します、生物名入力補完辞書 がVirus、Phageに切り替わります。 Environmental Samples 環境サンプルの場合に選択します。Scientific name: 入力 欄に自答的に uncultured が記載されます。 Artificial Construct クローニングベクター、発現ベクター、合成配列の場合に 選択します。 A known species but unregistered in taxonomy database 学名がvalidであるが、NCBI taxonomy databaseで見つから ない場合に選択します。 Not found in taxonomy database, but already registered in other sequence data NCBI taxonomy databaseに無いが、以前の登録で同じ生 物名を使用したことのある場合に選択します。 A novel species to be proposed in the paper 新種を報告する場合に選択します。 こちらもご覧ください。 Organism qualifier に記載する生物名 http://www.ddbj.nig.ac.jp/sub/ref8-j.html 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 51 Category: デフォルトの入力欄 Scientific name 欄に学名を入力 参考 Organism qualifier に記載する生物名:種が同定されている場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#species 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 52 Category: Viruses/Phages 選択時の入力 Scientific name欄に、VirusまたはPhageの名を入力します (入力補完辞書がVirus/Phage用に切り替わります) 参考 Organism qualifier に記載する生物名:ウイルス http://www.ddbj.nig.ac.jp/sub/ref8-j.html#virus 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 53 Category: Environmental Samples 選択時の入力 補助情報入力欄が出現、必要な場合に記 載をお願いします。自由記載が可能ですが、 入力は必須ではありません。 Scientific name 欄に uncultured が自動記載さ れるので、それに続く名称を入力します。 たとえば、uncultured の直後に Bacillus sp.を入 力します。 参考 Organism qualifier に記載する生物名:環境サンプル http://www.ddbj.nig.ac.jp/sub/ref8-j.html#env 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 54 Category: Artificial construct 選択時の入力 Scientific name欄に、ベクター名や合成配列の名称 を入力します (入力補完辞書が人工合成配列用に 切り替わります) 参考 Organism qualifier に記載する生物名:人工的に構築した配列 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#syn 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 55 Category: A known species but unregistered in taxonomy database 選択時の入力 学名を入力します taxonomic lineageを入力してくだ さい(必須) 生物名をvalidであるものと報告して いる論文を入力してください(必須) そのほかの情報が存在する場合 に入力します 参考 Organism qualifier に記載する生物名: database で見つからない場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#novel 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 56 Category: Not found in taxonomy database, but already registered in other sequence data 選択時の入力 学名を入力します 生物名をvalid nameとして報告して いる論文を入力してください(任意) そのほかの情報が存在する場合 に入力します 参考 Organism qualifier に記載する生物名: database で見つからない場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#novel 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 57 Category: A novel species to be proposed in the paper 選択時の入力 論文が公開されるまでは、学名がvalid nameになってないため、 暫定名で登録します。 暫定名の書式は、 Genus sp. ##-yyyy の通りです。##を登録者名のイニシャル、yyyはその時の年に置 き換えます。 論文で提唱する新種名(学名)を 入力します。 taxonomic lineageを入力してくだ さい(必須)。 そのほかの情報が存在する場合に入力します。 参考 Organism qualifier に記載する生物名:種が同定されていない、または、新種提唱の場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#unidentified 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 58 annotation file の upload DDBJ 登録用 annotation file をご自身 で作成できる方は、"6.Template"画面 から annotation file のアップロードを 行うことができます。 ① other を選択しておきます。 ② "Upload annotation file" を クリックします ④ "Upload & Confirm" をク リックして annotation file の チェックを行います ③ annotation file を指定します 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) ⑤ Errorが出る場合、annotation fileを修正し③④を繰り返します。ク リック可能になればNextをクリックし ます。最終確認画面に遷移します。 59 Upload 可能な annotation file について annotation file の作成方法に関する手引きに関しては、アノテーションファイル作成概説 (http://www.ddbj.nig.ac.jp/sub/mss/annotation_file-j.html) をご覧ください。 annotation file には、アノテーション部のみ(次ページ参照)を含めてください。 EST, STS, TSA, HTC, GSS, HTG, WGS, CON (AGP) ファイルのuploadには対応していません。こ れらの登録については、大量登録システム(MSS) をご利用ください。 1. Contact person、2. Hold date、3. Submitter、4. Reference に記載された内容は、 COMMON情報として upload された annotation file の先頭に加えられます。 COMMON がannotation file内に記載されていた場合は、 1. Contact person、2. Hold date、 3. Submitter、4. Reference に記載された内容に置き換わります。 TPA 登録においては、PRIMARY_CONTIG を annotation file に含めないでください。 5. Sequence 中の Assembly Information の入力内容が自動的に変換され、annotation file の各エントリーに挿入されます。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 60 annotation file 例 COMMON この部分は不要、annotation file に含まれていた場合は、 1. Contact person 2. Hold date 3. Submitter 4. Reference の入力内容に置き換わります。 SUBMITTER REFERENCE DATE ENT01 Biological featureが記載さ れたこの領域、つまり、各エ ントリーのアノテーションの みを upload してください source CDS 217..1104 polyA_site ENT02 source CDS 2014年6月12日 1..2878 contact Hanako Mishima ab_name Mishima,H. ab_name Yamada,T. ab_name Park,C.S. ab_name Liu,G.Q. email [email protected] phone 81-55-981-6853 fax 81-55-981-6849 institute National Institute of Genetics department DNA Data Bank of Japan country Japan state Shizuoka city Mishima street Yata 1111 zip 411-8540 ab_name Mishima,H. ab_name Yamada,T. ab_name Park,C.S. ab_name Liu,G.Q. title Aquaporin genes year 2012 status Unpublished hold_date 20131130 organism Homo sapiens isolate FA01 mol_type mRNA tissue_type liver gene AQP9 product aquaporin 9 codon_start 1 transl_tabe 1 2878 1..1409 <1..1051 第29回 DDBJing 講習会 (DDBJ) organism Shigella flexneri strain BM123 mol_type genomic DNA gene APQZ product transl_table aquaporin Z 11 codon_start 2 61 エラーチェックに関する仕様 • annotation、sequenceの書式チェックには Parser が、CDSの翻訳チェックにはtransCheckerがそれぞれ実 行されます。 • CDS featureが含まれない場合には、"Confirm"クリックで書式チェック(Parserチェック)のみが行われます。 • CDSが存在する場合、Confirmクリックでまず書式チェック(Parserチェック) が行われ、入力内容にエラーが ある場合は書式エラーが表示されます。書式に問題がなければ、その直後にアミノ酸配列への翻訳エ ラーチェックが実行されます。つまり、書式エラーが解消されるまでは、翻訳チェックが行われません。 例えば、/lat_lon の書式に間違いがある場合は Confirmクリック後 /lat_lon のエラー のみが表示されます。/lat_lon を修正後、再度Confirmをクリックし、翻訳エラーがある 場合はその結果が表示されます。 /lat_lon 修正、Confirmをクリック 翻訳エラーが表示される 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 62 Upload & Confirmクリック後の画面 Errorが無い場合 エラーが無い場合は"Next"がクリック可 能になります。 Warningがある場合でも、"Next"がクリッ ク可能になりますが、必要に応じて修正 を行ってください。 アノテーションのチェックが行われた後、画面下にアノテー ションファイルが表示されます。 COMMONの領域は、1.Contact person~4.Referenceページ で入力した内容に置き換えられます。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 63 Upload & Confirmクリック後の画面 Error/Warningが生じた場合 修正したannotation fileを指定し、 "Upload & Confirm" を繰り返します。 Errorがなくなるまで繰り返します。 Line番号のクリックで画面下の Error対象行にジャンプします。 Error/Warning内容が表示 されます。 Errorがなくなると"Next"がクリック可 能になります。 Warningが生じた場合でも入力内容 に問題がなければ、"Next"をクリック してください。 クリックするとErrorの説 明ページが開きます。 画面下部にDDBJ登録形式のannotation file が表示されます。 エラー対象はハイライトされます。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 64 Confirmクリック後の画面 error無しの場合 チェック後、次のステップに進め る場合は、Nextがクリック可能に なります。 annotation 入力画面の下側にDDBJ 登録形式のアノテーションファイル が表示されます。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 65 "Confirm"クリック後の画面 errorが生じる場合 ① エラー内容が表 示されます ③ エラーが生じている行番号をクリッ クすると、画面下部に表示されるDDBJ アノテーションファイル形式の該当行 にジャンプします。 エラーが生じる場合は、Next ボタ ンをクリックできません ② アイコンをク リックすると、エ ラーの説明ペー ジが開きます(そ れぞれ日本語と 英語ページ) ⑤ エラー箇所の修正を行う場合 は画面をスクロールアップし、エ ラーが生じたエントリーの"Edit"ア イコンをクリックするなどの編集操 作により、修正を行ってください。 エラー修正後、再度"Confirm"をク リックしてください。 ④ エラー対象行がハイライト表示されま す。どのentry のどの feature、qualifier がエラーになっているかを確認します。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 66 Confirmクリック後の画面 warningが生じる場合 Warningは、Errorと断定ができないが、注意を促すた めの警告としての意味で表示されます Warning の場合には Nextがクリック可能になりますが、 入力内容に問題がないかどうかを確認してください この例では、submitterの名前の書式に関するwarningが 出ていますが、submitter 名に間違いがないならば warning を無視してかまいません。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 67 SubmitterまたはReference内にerrorがある場合 ① プログレスバーの"3. Submitter"または "4.Reference" をクリックすると各入力ペー ジにジャンプします ② 修正後、必ず"Next"ボタンをクリックし ます ③ 修正後、"7.Annotation" をク リックするとアノテーション画面に 戻ります Submitter、Reference に関するerrorやwarningに対して修正を行う場合に はプログレスバーから"3.Submitter"、"4.Reference"画面に戻って修正を行 うことになります。 ① 画面上部のプログレスバーにある"3.Submitter"または"4.Reference"を クリックする ② "3.Submitter"もしくは"4.Refernece"入力画面上で修正し、必ず"Next"を クリックする(Nextをクリックしないと修正した内容が反映されません) ③ 画面上部のプログレスバーから、"7.Annotation" をクリックすると annotation入力画面に戻ることができる 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 68 Error/Warning説明ページへのリンク Error/Warningの説明は以下のURLでご覧いただけます。 http://www.ddbj.nig.ac.jp/sub/validator-j.html CDSのアミノ酸翻訳に関するエラー説明は以下のURLからご覧ください。 transChecker エラーメッセージ http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC (次ページ参照) 以下のリンクもご参照ください • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 69 CDSフィーチャーにおける翻訳エラーと説明ページへのリンク 翻訳エラーの内容により、リンク先の記載内容に基づき修正してください Message [WARNING] 'codon_start' qualifier should be selected. The value is automatically set 1. [WARNING] 'transl_table' qualifier should be selected. The value is automatically set 1. [WARNING] Amino acid of 'transl_except' qualifier [#Value] is not [Met]. [WARNING] [#Value] codons are not translatable. [ERROR] Untranslatable codon [#Codon] is found in the sequence range. [ERROR] First codon [#Codon] is not a start codon. [ERROR] Final codon [#Codon] is not a stop codon. [ERROR] Stop codon '*' is found in the range. [ERROR] Description of Location [#location of CDS feature] is illegal. [ERROR] 'codon_start' qualifier is duplicated. The value is automatically set 1. [ERROR] 'codon_start' qualifier has invalid value [#Value]. [ERROR] 'transl_table' qualifier is duplicated. The value is automatically set 1. [ERROR] 'transl_table' qualifier has invalid value [#Value]. [ERROR] Amino acid abbreviation [#abbreviation] in 'transl_except' qualifier is illegal. [ERROR] 'transl_except' qualifier has invalid value [#Value]. [ERROR] Location of 'transl_except' qualifier [#Value] is overlapped. [ERROR] Location of 'transl_except' qualifier [#Value] is invalid. [ERROR] Base range of 'transl_except' qualifier [#Value] is mismatched in reading frame. [ERROR] Amino acid of 'transl_except' qualifier [#Value] is not changed from conceptual translation. [ERROR] Amino acid of 'transl_except' qualifier [#Value] is not [TERM]. [ERROR] Stop codon is specified by 'transl_except' qualifier [#Value] in mid of CDS location. [ERROR] Entry [#Entry name] is NOT found in sequence entries. [FATAL] Proper 'Codon Table' is not found in 'src' folder. Link http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC22 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC23 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC24 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC25 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC18 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC19 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC20 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC21 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC04 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC05 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC06 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC07 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC08 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC09 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC10 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC11 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC12 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC13 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC14 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC15 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC16 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC17 http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC01 [FATAL] Proper 'Amino Table' is not found in 'src' folder. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC02 [FATAL] Unable to execute Translation. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC03 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 70 入力例1 16S rRNAアノテーションの入力例 6.Templateにて"16S rRNA sequence"を選択した場合 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 71 例 16S rRNAアノテーションの入力 ① クリックして、必要な qualifierを追加しておきます。 ② Editアイコンをクリッ クします。 必須feature、推奨qualifierが 初期値として選択されていま す。 Link: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法 2014年6月12日 rRNA featureのlocation、 プロダクト名が初期値 として記載されます。 追加情報がある場合 にダブルクリックすれ ば、テキストでの自由 記載が可能です。 このページで入力を中断・再開するにはブラウザでブックマークするか、 ページのURLを保存してください。ブラウザーを閉じた後でもブックマークした URLを用いて、再開することが可能です。 第29回 DDBJing 講習会 (DDBJ) 72 Qualifierを追加するにはSelect Qualifierアイコンをクリック 追加したいqualifier横のチェックボックスにチェックを加えて、 Save をクリックすると、qualifierを追加できます。 qualifierを消す場合は、チェックを外します。値が入力された qualifierの消去を行う場合"確認ダイアログ"が出現しますの で、"OK"をクリックすると消去できます。 アノテーションに必須なqualifierは消去不可能です。 templateの種類により、選択可能なqualifierは 異なります。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 73 "Edit"クリック時の編集画面 生物名を学名で入力します(参 考: 補足資料「生物名の入力に ついて」、「生物名入力における カテゴリーの選択について」) strain および、採取情報を 入力します 該当情報がない場合は、 空欄にします。 rRNAのlocationが配列全長として 自動的に設定されます。必要に応 じて修正します。 16S rRNAのテンプレート選択しているの で、プロダクト名は初めから入力済みに なっており修正不可能です。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 入力後、Saveをクリックします 74 1件目入力完了時 2件名以降も、1件目と同様にEditアイ コンをクリックして入力を行い、アノ テーション入力を完了させてください。 Link: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法 2014年6月12日 値が空欄のqualifierは、DDBJに送信されるア ノテーションファイル中に出力されません。 このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURL を保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開す ることが可能です。 第29回 DDBJing 講習会 (DDBJ) 75 annotation入力後"Confirm"をクリックしてチェックを行う annotation入力後、Confirmをク リックします。入力した内容の書 式チェックが行われます 参考: 補足資料「エラーチェックに関する仕様」 2014年6月12日 チェック後、次のステップに進める場合のみ、 "Next"がクリック可能になります。チェックで Errorが生じる場合はクリックできません このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURL を保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開す ることが可能です。 第29回 DDBJing 講習会 (DDBJ) 76 入力例2 ミトコンドリアCOI配列の入力画面例 6.Templateにて"single protein-coding sequence (CDS), organelle" を選択した場合の画面例 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 77 この例では /isolate, /collection_date, /lat_lon, /dev_stage を選択しています。 テクニック2 Edit Column を利用すれば、エクセルなどで 作成したリストからのpasteが可能 補足資料「Edit Columnをクリックした場合」 ⇒下表に続く ⇒上表からの続き テクニック1 編集アイコンから copy 機能 を利用すれば、同じ値のcopy が可能 補足資料「Qualifierの編集ア イコンをクリックした場合」 2014年6月12日 Link: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法 このページで入力を中断・再開するにはブラウザでブックマークするか、ページの URLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再 開することが可能です。 第29回 DDBJing 講習会 (DDBJ) 78 入力例3 ミトコンドリアゲノム部分配列のannotation入力例 6.Templateにて other を選択した場合 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 79 ① "Select Qualifier"で、qualifierを追加します。 この例では、 country isolate ② このsourceで追加したqualifierを、以降のすべてのエント organelle リーのsourceフィーチャーにもコピーしたい場合には、このア を追加しました。 イコンをクリックします。なお、qualifierの値はコピーされま せん。 ③ Editをクリックして source feature への入力 を行います。 参考: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法 2014年6月12日 このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURL を保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開す ることが可能です。 第29回 DDBJing 講習会 (DDBJ) 80 Editクリック時 生物名を学名で入力します(参 考: 補足資料「生物名の入力に ついて」、「生物名入力における カテゴリーの選択について」) 各情報を入力します genetic code には生物名入力時に整数値 が自動入力されることを確認、空欄であれ ば手動でgenetic code(整数値)を入力 入力後、Saveをクリック ④ ここをクリックし、追加したいfeature をリストから選択すると追加されます ⑤ feature配下に追加すべき qualifierがある場合に "Select Qualifier"をクリックし ます 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 81 ⑥ 追加したfeature の locationを修正し ます。クリックすると入力ウインドウが 現れるので、値を入力します。 ⑦ qualifier値を編集します。 qualifierをクリックすると入力ウインドウが現れるので、値 を入力します。 ⑧ 続いて、次のfeatureを追加します。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 82 ⑨ 同様に、qualifierを選択してから、 値を入力します。この操作をfeature の数だけ繰り返します。 featureやqualifierを追加後、"Edit"ク リックによりエントリー単位で編集する ことも可能です。 入力後、Confirm をクリックします。 入力したアノテーションの書式チェック が行われます。 2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 83
© Copyright 2024 ExpyDoc