Архив рубрики: биоинформатика

Кто может назвать себя биоинформатиком?

Мой добрый приятель, тёзка того самого литературного персонажа, к которому именно так обращалось солнце русской поэзии в своём романе, скинул интересную статью 2015 года во Frontiers in Genetics с заголовком Who qualifies to be a bioinformatician?

Статья хоть и небольшая, но весьма интересна точка зрения авторов, которые стараются разграничить биологов, биоинформатиков и IT-специалистов. Приведу несколько цитат:

Bioinformaticians are scientists who develop and conduct research based on a bioinformatics approach, they do not just use the tools to better understand a biological problem.

Consequently, in our opinion a biologist who only uses bioinformatics tools to perform analyses but does not contribute at the conception of such tools or not fits in the curator definition provided above is not a bioinformatician.

Many university departments, including ours, now give mandatory bioinformatics courses to students enrolled in biology, biochemistry, and microbiology programs, among others. … However, it is also important for students to realize that a 45-h bioinformatics course will not make them experts in the field or qualify them as bioinformaticians.

Antony T. Vincent, Steve J. Charette. 2015

Разумеется лучше ознакомиться с полным текстом, однако эти выдержки показывают, что жать просто кнопки и получать картинки для биоинформатика недостаточно. Я во многом согласен с авторами. Пожалуй всё-таки разработка ПО, баз данных и конечно же поиск фундаментальных закономерностей, которые в дальнейшем воплотятся в тех или иных инструментах, это и есть труд биоинформатика.

Но всё-таки какой объём работы или её значимость позволяют считать творение биоинформатическим инструментом? Вряд ли однострочник для фильтрации VCF можно назвать биоинформатическим инструментом, хотя важность таких простых средств трудно переоценить. А как вы думаете, кого можно считать биоинформатиком и что он должен делать?

Свежие препринты: биоинформатика [2021-1]

Представляю обзор препринтов (ещё неопубликованных статей, которые представлены для раннего ознакомления) с bioRxiv.org с начала 2021 года по 10 января в категории биоинформатика (и 2 из категории геномика). Из этого материала вы узнаете про долгожительство летучих мышей, кластеризацию при помощи выравнивания и филогенетических деревьев, филогенетический анализ без выравниваний и просто крутейший инструмент метагеномного анализа, который я в первый же рабочий день буду ставить на рабочую станцию.

Читать далее

Игры в обзоры препринтов (1)

Привет, читатели! Вдохновился трудами Сергея Попова по обзору препринтов в области астрофизики — http://xray.sai.msu.ru/~polar/sci_rev/current.html и захотел провести схожее изыскание в области, которой занимаюсь, — в биоинформатике. К сожалению, моя квалификация весьма низкая, но надеюсь полезную информацию вы сможете почерпнуть.

Изначально я хотел взять неделю с 30 марта по 5 апреля целиком, но обнаружил, что только один день — 30 марта занял очень много времени. В связи с этим я пока предоставлю вам пробу пера по разбору статей из категории биоинформатика сервера предпечатных версий статей, или же препринтов/манускриптов — biorxiv.org. Читать далее

Разбор задач №1. GFF из аннотаций Prodigal

Сложно писать что-нибудь полезное в отрыве от реальности, поэтому при подходящем случае буду делиться вариантами решения тех или иных задач.

Недавно необходимо было мне предоставить GFF файл с указанием генов, найденных в метагеноме. Всё бы хорошо, fasta-файлы с аминокислотными и нуклеотидными последовательностями сохранились, а вот ни GFF, ни GBK не сохранилось. К счастью, Prodigal в процессе поиска ORF сохраняет много данных в заголовках мультифасты, выглядит это примерно так:

>Contig_name_1_1 # 3 # 215 # -1 # ID=1_1;partial=10;start_type=ATG;rbs_motif=AGGAG;rbs_spacer=5-10bp;gc_cont=0.629

Легко понять, что разделителем полей является группа символов “ # “, при этом сами поля включают:

Читать далее