20150724_tsato

医療情報システム研究室
SMDtP 班
【文献調査】
Improved peak detection in mass spectrum by
incorporating continuous wavelet transform-based
pattern matching
佐藤 琢磨
廣安 知之
2015 年 7 月 24 日
1
タイトル
連続ウェーブレット変換をベースとしたパターンマッチングによる質量スペクトルピーク検出精度の向上
2
著者
Du Pan,Warren A. Kibbe,Simon M.Lin
3
出典
Du Pan,Warren A. Kibbe,Simon M.Lin,”Improved peak detection in mass spectrum by incorporating contin-
uous wavelet transform-based pattern matching.” Bioinformatics Vol.22,No.17,2006,pp.2059-2065.
4
アブストラクト
モチベーション:現在のピーク検出アルゴリズムは質量分析(MS)スペクトルにおけるノイズが偽陽性の割合
を高めるという課題が存在する.偽陽性の割合は小さな振幅を持つピークを検出する際にとりわけ問題となる.通
常ピーク検出前に様々なベースライン補正アルゴリズムや平滑方法が用いられる.しかし,この手法はベースラ
イン補正や,平滑化に影響を受けるため,計測と解析結果との間にピークの矛盾が生じる.
結果:ほとんどのピーク検出のアルゴリズムは,ピークの形状を無視し,単に振幅をもとにピークを決定する.
私たちの手法では,真のピークは特徴的な形を持ち,フィットの程度を表す係数を与える shape-matching 関数を
用いることで,よりロバストなピーク検出を行うことができる.連続ウェーブレット変換を用いたピーク検出アル
ゴリズムは様々なスケールと振幅を用いてピーク検出を行う手法である.スペクトラムをウェーブレット空間に
変換することにより,パターンマッチング問題は単純化され,さらにピーク検出とスパイクノイズや有色雑音から
信号を分離することが可能である.この変換は SN 比の影響を向上させる.また,ピーク検出の前処理としてベー
スライン補正や平滑処理を必要とせず,様々な状況下においてロバスト性を向上させることが可能である.この
手法を評価するためにポリペプチドの位置を表した SELDI-TOF spectra を用いた.そして一般的に用いられる 2
種類の既存のピーク検出手法と比較を行った.その結果,連続ウェーブレット変換をベースとしたアルゴリズム
は偽陽性率を低く抑えながら、CWT ベースのアルゴリズムは、強弱両方のピークを識別することが示された.
入手先:このアルゴリズムは R と Bioconductor プロジェクトから入手することができる.
5
キーワード
Heartbeat,Respiratory rate,Neonates,Physiological growth process ,Noninvasive, Piezoceramic sensor
参考文献
[1]Jeffries N. Algorithms for alignment of mass spectrometry proteomic data. Bioinformatics 2005;21:3066-3073
ピーク検出の精度が与える影響に関して.
[2]Li J., et al. Independent validation of candidate breast cancer serum biomarkers identified by mass spectrometry. Clin. Chem. 2005;51:2229-2235.
ピーク検出の精度が与える影響に関して.
1
[3] Rejtar T., et al. Increased identification of peptides by enhanced data processing of high-resolution MALDI
TOF/TOF mass spectra prior to database searching. Anal. Chem. 2004;76:6017-6028.
ピーク検出の精度が与える影響に関して.
[4] Hilario M., et al. Processing and classification of protein mass spectra. Mass Spectrom. Rev. 2006;25:409449.
小さな振幅をもつ信号に対するピーク検出が偽陽性の割合を高める問題に関して.
[5]Gentzel M., et al. Preprocessing of tandem mass spectrometric data to support automatic protein identification. Proteomics 2003;3:1597-1610.
ピークには特徴的な形やパターンがあることに関して.
[6]Gras R., et al. Improving protein identification from peptide mass fingerprinting through a parameterized
multi-level scoring algorithm and an optimized peak detection. Electrophoresis 1999;20:3535-3550.
ピーク幅を用いたピーク検出に関して.
[7]Andreev V.P., et al. A universal denoising and peak picking algorithm for LC-MS based on matched filtration
in the chromatographic time domain. Anal. Chem. 2003;75:6314-6326.
固定パターンマッチング手法に関して.
[8] Vivo-Truyols G., et al. Automatic program for peak detection and deconvolution of multi-overlapped chromatographic signals part I: peak detection. J. Chromatogr. A 2005;1096:133-145.
固定パターンマッチング手法に関して.
[9] Lio P., Vannucci M. Wavelet change-point prediction of transmembrane proteins. Bioinformatics 2000;16:376382.
提案手法の応用分野に関して.
[10]Klevecz R.R., Murray D.B. Genome wide oscillations in expression. Wavelet analysis of time series data
from yeast expression arrays uncovers the dynamic architecture of phenotype. Mol. Biol. Rep. 2001;28:73-82.
提案手法の応用分野に関して.
[11] Coombes K.R., et al. Improved peak detection and quantification of mass spectrometry data acquired from
surface-enhanced laser desorption and ionization by denoising spectra with the undecimated discrete wavelet
transform. Proteomics 2005;5:4107-4117.
ウェーブレット変換のプロテオミクスに対するノイズ処理としての応用例に関して.
[12] Randolph T.W., Yasui Y. Multiscale processing of mass spectrometry data. Biometrics 2006;62:589-597.
ウェーブレット変換のプロテオミクスに対する特徴抽出としての応用例に関して.
[13] Lange E., Gropl C., Reinert K., Kohlbacher O., Hildebrandt A. High-accuracy peak picking of proteomics
data using wavelet techniques. Proceedings of Pacific Symposium on Biocomputing 2006; Maui, Hawaii, USA.
2006. p. 243-254.
ウェーブレット変換をもちいたピーク検出とピークパラメータの推定に関して.
2