Ву Енхуи, Киао Лианг*
Департман за хемију, Универзитет Фудан, Шангај 200433, Кина
Микроорганизми су уско повезани са људским болестима и здрављем. Како разумети састав микробних заједница и њихове функције је главно питање које треба хитно проучити. Последњих година метапротеомика је постала важно техничко средство за проучавање састава и функције микроорганизама. Међутим, због сложености и високе хетерогености узорака микробне заједнице, обрада узорака, прикупљање података масеном спектрометријом и анализа података постали су три главна изазова са којима се тренутно суочава метапротеомика. У метапротеомичкој анализи, често је потребно оптимизовати предтретман различитих типова узорака и усвојити различите шеме микробног одвајања, обогаћивања, екстракције и лизе. Слично протеому једне врсте, начини прикупљања података масене спектрометрије у метапротеомици укључују начин аквизиције зависне од података (ДДА) и режим аквизиције независне од података (ДИА). ДИА режим прикупљања података може у потпуности да прикупи информације о пептидима узорка и има велики развојни потенцијал. Међутим, због сложености метапротеомских узорака, његова анализа података ДИА постала је велики проблем који омета дубоку покривеност метапротеомике. У погледу анализе података, најважнији корак је изградња базе података секвенци протеина. Величина и комплетност базе података не само да имају велики утицај на број идентификација, већ утичу и на анализу на врстама и функционалним нивоима. Тренутно, златни стандард за изградњу метапротеомске базе података је база података секвенци протеина заснована на метагеному. У исто време, метода филтрирања јавних база података заснована на итеративном претраживању такође је доказано да има јаку практичну вредност. Из перспективе специфичних стратегија анализе података, методе анализе података ДИА са центром на пептиде су заузеле апсолутну мејнстрим. Са развојем дубоког учења и вештачке интелигенције, то ће у великој мери промовисати тачност, покривеност и брзину анализе макропротеомске анализе података. У погледу низводне биоинформатичке анализе, последњих година развијен је низ алата за анотацију, који могу да обављају бележење врста на нивоу протеина, пептида и гена како би се добио састав микробних заједница. У поређењу са другим методама омике, функционална анализа микробних заједница је јединствена карактеристика макропротеомике. Макропротеомика је постала важан део мулти-омичке анализе микробних заједница, и још увек има велики развојни потенцијал у смислу дубине покривености, осетљивости детекције и потпуности анализе података.
01 Предтретман узорка
Тренутно се технологија метапротеомике широко користи у истраживању људског микробиома, земљишта, хране, океана, активног муља и другим пољима. У поређењу са анализом протеома једне врсте, предтретман метапротеома сложених узорака се суочава са више изазова. Микробни састав у стварним узорцима је сложен, динамички опсег обиља је велики, структура ћелијског зида различитих типова микроорганизама је веома различита, а узорци често садрже велику количину протеина домаћина и других нечистоћа. Због тога је у анализи метапротеома често потребно оптимизовати различите типове узорака и усвојити различите шеме микробног одвајања, обогаћивања, екстракције и лизе.
Екстракција микробних метапротеома из различитих узорака има одређене сличности као и неке разлике, али тренутно постоји недостатак јединственог процеса претходне обраде за различите типове узорака метапротеома.
02Прикупљање података масеном спектрометријом
У анализи протеома сачмарицама, мешавина пептида након претходног третмана се прво одваја у хроматографској колони, а затим улази у масени спектрометар за прикупљање података након јонизације. Слично анализи протеома појединачних врста, начини прикупљања података масене спектрометрије у анализи макропротеома укључују ДДА режим и ДИА режим.
Уз континуирану итерацију и ажурирање инструмената масене спектрометрије, инструменти масене спектрометрије са већом осетљивошћу и резолуцијом се примењују на метапротеом, а дубина покривености метапротеомске анализе се такође континуирано побољшава. Дуго времена, серија инструмената масене спектрометрије високе резолуције на челу са Орбитрапом се широко користи у метапротеому.
Табела 1 оригиналног текста приказује неке репрезентативне студије о метапротеомици од 2011. до данас у смислу типа узорка, стратегије анализе, инструмента масене спектрометрије, методе аквизиције, софтвера за анализу и броја идентификација.
03 Анализа података масене спектрометрије
3.1 Стратегија анализе података ДДА
3.1.1 Претрага базе података
3.1.2де новостратегија секвенцирања
3.2 Стратегија анализе података ДИА
04Класификација врста и функционална напомена
Састав микробних заједница на различитим таксономским нивоима је једно од кључних истраживачких области у истраживању микробиома. Последњих година развијен је низ алата за означавање врста на нивоу протеина, пептида и гена како би се добио састав микробних заједница.
Суштина функционалне белешке је да се упореди секвенца циљног протеина са базом података секвенци функционалних протеина. Користећи базе података о функцијама гена као што су ГО, ЦОГ, КЕГГ, еггНОГ, итд., могу се извршити различите анализе функционалних анотација на протеинима идентификованим помоћу макропротеома. Алати за напомене укључују Бласт2ГО, ДАВИД, КОБАС итд.
05 Резиме и Оутлоок
Микроорганизми играју важну улогу у људском здрављу и болести. Последњих година, метапротеомика је постала важно техничко средство за проучавање функције микробних заједница. Аналитички процес метапротеомике је сличан оном код протеомике једне врсте, али због сложености истраживачког објекта метапротеомике, у сваком кораку анализе потребно је усвојити специфичне стратегије истраживања, од претходног третмана узорка, прикупљања података до анализе података. Тренутно, захваљујући побољшању метода претходног третмана, континуираној иновацији технологије масене спектрометрије и брзом развоју биоинформатике, метапротеомика је постигла велики напредак у дубини идентификације и обиму примене.
У процесу претходног третмана узорака макропротеома, прво се мора узети у обзир природа узорка. Како одвојити микроорганизме од ћелија и протеина животне средине је један од кључних изазова са којима се суочавају макропротеоми, а равнотежа између ефикасности раздвајања и губитка микроба је хитан проблем који треба решити. Друго, екстракција протеина микроорганизама мора узети у обзир разлике узроковане структурном хетерогеношћу различитих бактерија. Узорци макропротеома у опсегу трагова такође захтевају специфичне методе претходног третмана.
Што се тиче инструмената масене спектрометрије, главни инструменти масене спектрометрије су прошли транзицију са масених спектрометара заснованих на анализаторима масе Орбитрап као што су ЛТК-Орбитрап и К Екацтиве на масене спектрометре засноване на масажним анализаторима времена проласка који су повезани са мобилношћу јона, као што је тимсТОФ Про . ТимсТОФ серија инструмената са информацијама о димензијама покретљивости јона има високу тачност детекције, ниску границу детекције и добру поновљивост. Они су постепено постали важни инструменти у различитим истраживачким областима које захтевају детекцију масеном спектрометријом, као што су протеом, метапротеом и метаболом једне врсте. Вреди напоменути да је дуго времена динамички опсег инструмената масене спектрометрије ограничавао дубину покривености протеинима истраживања метапротеома. У будућности, инструменти масене спектрометрије са већим динамичким опсегом могу побољшати осетљивост и тачност идентификације протеина у метапротеомима.
За прикупљање података масеном спектрометријом, иако је начин прикупљања података ДИА широко прихваћен у протеому једне врсте, већина актуелних анализа макропротеома и даље користи ДДА начин прикупљања података. ДИА режим аквизиције података може у потпуности да добије информације о фрагментима јона узорка, а у поређењу са режимом прикупљања података ДДА, има потенцијал да у потпуности добије информације о пептидима узорка макропротеома. Међутим, због велике сложености података ДИА, анализа података ДИА макропротеома и даље се суочава са великим потешкоћама. Очекује се да ће развој вештачке интелигенције и дубоког учења побољшати тачност и потпуност анализе података ДИА.
У анализи података метапротеомике, један од кључних корака је изградња базе података секвенци протеина. За популарне области истраживања као што је цревна флора, могу се користити базе података цревних микроба као што су ИГЦ и ХМП и постигнути су добри резултати идентификације. За већину других метапротеомичких анализа, најефикаснија стратегија изградње базе података је и даље успостављање базе података о секвенци протеина специфичне за узорак на основу података о метагеномском секвенцирању. За узорке микробне заједнице са високом сложеношћу и великим динамичким опсегом, неопходно је повећати дубину секвенцирања како би се повећала идентификација врста са ниским обиљем, чиме се побољшава покривеност базе података секвенци протеина. Када недостају подаци о секвенцирању, може се користити итеративни метод претраге за оптимизацију јавне базе података. Међутим, итеративно претраживање може утицати на контролу квалитета ФДР-а, тако да резултате претраге треба пажљиво проверити. Поред тога, још увек вреди истражити применљивост традиционалних модела контроле квалитета ФДР-а у анализи метапротеомике. У смислу стратегије претраживања, стратегија хибридне спектралне библиотеке може побољшати дубину покривености ДИА метапротеомике. Последњих година, предвиђена спектрална библиотека генерисана на основу дубоког учења показала је супериорне перформансе у ДИА протеомици. Међутим, метапротеомске базе података често садрже милионе уноса протеина, што резултира великом скалом предвиђених спектралних библиотека, троши много рачунарских ресурса и резултира великим простором за претрагу. Поред тога, сличност између протеинских секвенци у метапротеомима увелико варира, што отежава осигуравање тачности модела предвиђања спектралне библиотеке, тако да се предвиђене спектралне библиотеке нису широко користиле у метапротеомици. Поред тога, потребно је развити нове стратегије закључивања и класификације протеина да би се примениле на метапротеомичку анализу протеина веома сличних секвенци.
Укратко, као нова технологија истраживања микробиома, технологија метапротеомике је постигла значајне резултате истраживања и такође има огроман развојни потенцијал.
Време поста: 30.08.2024