Создан язык, который вытаскивает токсины из цифрового шума
Биологи и химики получили новый инструмент для поиска скрытых загрязнителей в окружающей среде — и теперь им не нужно учиться программированию.

Этот язык запросов, разработанный в Калифорнийском университете в Риверсайде, позволяет быстро анализировать огромные массивы данных масс-спектрометрии и находить токсичные соединения, которые раньше оставались незамеченными.
Результаты опубликованы в издании Nature Methods.
Масс-спектрометрия — это
С ее помощью ученые определяют загрязнители в воде, компоненты лекарств и многое другое.
Но проблема в том, что данных слишком много, и без специальных навыков их не проанализировать.
Язык MassQL работает как поисковик для масс-спектрометрии.
Вместо сложного кода исследователи пишут простые запросы и сразу видят нужные закономерности.
Например, с его помощью уже нашли фосфорорганические соединения в водоемах — это компоненты антипиренов, которые могут вредить здоровью.
Мы хотели дать биологам и химикам возможность работать с данными без долгого обучения программированию, — говорит Минсюнь Ван, создатель MassQL.
Постдок Нин Чжао, которая сейчас работает в UCSD, использовала язык, чтобы проанализировать все доступные данные по масс-спектрометрии воды. Она искала эфиры фосфорной кислоты — их добавляют в антипирены.
В этих данных — миллиарды измерений. Вручную их не перебрать, — объясняет Ван.
Но MassQL действует как фильтр: он выявил тысячи соединений, в том числе ранее неизвестные.
Некоторые из этих веществ со временем распадаются, образуя новые токсичные соединения. Они могут влиять на эндокринную систему, репродуктивное здоровье и даже вызывать сердечно-сосудистые заболевания.
Как это работает
- Ученые вводят запрос, например: «Найти все молекулы с определенной массой».
- Система анализирует базы данных и выдает результаты.
- Можно искать не только известные вещества, но и новые, еще не описанные в науке.
Раньше для таких задач требовались сложные алгоритмы. Теперь исследователи тратят минуты вместо месяцев.
Теперь я могу искать любые химические соединения — в воде, почве, воздухе и даже в организме человека, — говорит Чжао.
При разработке MassQL ученые столкнулись с неожиданной сложностью: химики и программисты по-разному описывают одни и те же процессы. Чтобы язык был понятен всем, в его создании участвовали около 70 специалистов.
Уже сейчас MassQL используют в десятках проектов:
- поиск маркеров отравления алкоголем,
- обнаружение «вечных химикатов» на детских площадках,
- изучение сигнальных молекул бактерий.
Раньше ко мне постоянно обращались с просьбами написать отдельную программу для каждого случая, — говорит Ван.
Теперь у нас есть один универсальный инструмент. Интересно, какие еще открытия он поможет сделать.
Этот инструмент меняет правила игры в экологическом мониторинге и медицине. Раньше анализ масс-спектрометрии требовал либо ручной обработки (что невозможно при больших данных), либо сложного программирования. Теперь ученые могут быстро находить опасные вещества, даже если те еще не внесены в базы. Это особенно важно для:
- Экологии — оперативное выявление новых загрязнителей.
- Медицины — поиск токсинов в организме.
- Фармакологии — ускорение разработки лекарств.
Ранее ученые разработали многоцелевой масс-спектрометр, пригодный для работы в космосе.