Мы от лица Open Longevity совместно с Международным Альянсом Долголетия (ILA) написали письмо в ВОЗ о необходимости открытых анонимизированных медицинских данных пациентов c COVID-19 и риск-факторов, связанных со старением. Если ВОЗ прислушается, то это ускорит разработку терапии против коронавирусов, ускорить разработку терапии против риск-факторов и поможет бороться с будущими эпидемиями. Письмо подписали ученый из США, Европы, Израиля и России, а также активисты долголетия.
Мы уверены, что ВОЗ сейчас получает множество обращений, и наша письмо потеряется в информационном шуме, если не предпринимать дополнительных усилий по его продвижению. Поэтому мы подготовили петицию, которую может подписать любой желающий, согласный с нашей позицией.
Перевод на русский язык мы также разместили на нашем сайте.
Если аргументы, приведенные в петиции, вам кажутся обоснованными, подпишите её. Сделайте репост, разошлите друзьям. Это поможет борьбе с коронавирусом.
Какие же данные мы просим от ВОЗ? Медицинские: анамнез, анализы крови, рентген и т.п. (например). И ситуация такова, что ВОЗ не хочет ими делиться! Что они сами пишут:
“В соответствии со статьей 11, пункт 4 IHR (International Health Regulations) от 2005 г., ВОЗ не будет раскрывать анонимные данные COVID-19 другим государствам-участникам до тех пор, пока не будут выполнены какие-либо условия, изложенные в пункте 2 статьи 11 и пока ВОЗ не проконсультируется с вовлечёнными странами.
В соответствии с той же статьей 11 ВОЗ не будет предоставлять анонимизированные данные COVID-19 для общественности, если только и до тех пор, пока анонимизированные COVID-19 данные не будут раскрыты для государств-участников и при условии, что другая информация об эпидемии COVID-19 уже стала общедоступной, и существует необходимость в распространении авторитетной и независимой информации».
Тем не менее, открытые медицинские данные, попросту говоря, истории болезней (естественно, анонимизированные, без имен и фамилий), нужны:
- Для предсказания тяжести течения заболевания. Если будет предоставлен анамнез, будут указаны анализы крови, возраст, ответы анкетирований и т.п., это поможет прогнозировать развитие заболевания;
Для более качественного машинного обучения. Предсказательная сила моделей очень сильно зависит от количества образцов, на которых они тренируются. Особенно это актуально для омиксных данных, где требования к минимальному количеству образцов гораздо выше из-за большого количества параметров в моделях.
Всё это причины, по которым медицинские данные пригодятся уже сегодня. Но есть и ряд других причин. Они связаны с будущими исследованиями, с превентивными мерами. Медицинские данные также нужны для:
- Решения проблемы влияния факторов старения на риски в будущих эпидемиях;
Существующие национальные системы здравоохранения не справляются с текущей ситуацией. С медицинскими данными проблемы такие:
На данный момент многие страны привлекают волонтеров для помощи врачам для лечения пациентов с COVID-19.
Однако огромное количество биоинформатиков и специалистов в области IT могут быть не менее полезны в данной ситуации. В текущей обстановке создание прототипической общемировой базы пациентов и локальное привлечение одного-двух IT специалистов на больницу могут помочь быстро, эффективно и относительно недорого (с привлечением волонтеров) собрать данные в стандартизированном формате для последующего анализа лучшими учеными и алгоритмами искусственного интеллекта по всему миру.
Разрешая доступ ко всем типам анонимизированных или деидентифицируемых данных сейчас на примере данных пациентов с COVID-19, ВОЗ может существенно ускорить разработки вакцин и протоколов лечения. Кроме того, текущая ситуация может служить грандиозным толчком для оптимизации всей системы работы с медицинскими данными, позволяя отработать алгоритм обмена и стандартизации данных в международном масштабе.
Какие еще типы данных важны для борьбы с коронавирусом?
Геномные данные (например вот, вот и вот), прежде всего, геномы и филогенетические деревья вируса. Здесь дела с открытостью обстоят гораздо лучше.
Они нужны, чтобы отслеживать, как отличаются штаммы вируса в разных популяциях/странах, чтобы понять, насколько универсальными будут терапии и диагностические тесты. Также можно выделять самые эволюционно-консервативные регионы вирусного РНК, чтобы действовать именно на них — потенциально, это могут быть самыми эффективными терапиями.
Транскриптомные данные (например) (прежде всего sc-RNA-Seq иммунных клеток)
Тут вот какое дело. В иммунных клетках происходит гипермутация и VDJ рекомбинация генов, ответственных за кодирование антител и T-клеточных рецепторов. То есть геномы в иммунных клетках разные. Совокупность известных последовательностей (клонотипов) антител и Т-рецепторов называют репертуар. Поскольку это кодирующие участки, чаще всего репертуар узнают на основе single-cell секвенирования РНК иммунных клеток.
Такие данные нужны, чтобы cравнивать переболевших людей с не заразившимися. Ещё можно сравнить репертуар иммунных клеток разных переболевших людей (с разной тяжестью, разным характером протекания заболевания). В итоге всё это поможет проводить диагностику, разрабатывать вакцину.
И, кстати, этих данных явный дефицит, Antibodies Society даже кинула клич:
“… AIRR-C настоящим призывает своих членов и более широкое исследовательское сообщество делиться опытом, ресурсами, образцами и данными как можно более открыто и свободно, а также работать в рамках своих соответствующих систем, чтобы преодолеть барьеры для достижения этой цели, в условиях всеобъемлющих директивах об уважении, неприкосновенности частной жизни и защите пациентов и всех людей. Мы здесь в одной лодке”.
Информация о тестовых китах и диагностике.
Многие тесты не успевают сертифицировать, клиники и некоторые страны боятся их использовать; это касается не только тестовых китов, но и ПЦР-машин, и прочего оборудования.
Данные о распространении вируса (например вот и вот) и прогнозировании. Ситуация нормализуется, но так как история с диагностикой всё ещё далека от идеальной, это вносит свои коррективы в эпидемиологические данные.
Общеобразовательная информация. Тут ВОЗ нормально справляется.
Данные о публикациях и клинических исследованиях.
Ленты новостей с новыми статьями по теме.
Существующие инициативы, включая Kaggle Challenges, не решают задачу сбора и формирования медицинских COVID-19 датасетов и сфокусированы на других направлениях (тренировка систем обработки естественного языка на текстах про коронавирус, разбор геномов, прогнозирование распространения вируса и т.п.).
В целом, идея в том, чтобы найти способы многократно снизить летальность от COVID-19, воздействуя на риск-факторы. В качестве примера, можем привести IL-6, как перспективную мишень воздействия на фактор риска.
Подпишите петицию! Всемирная Организация Здравоохранения обязана как поделиться существующими у них медицинскими данными, так и наладить работу по получению новых качественных данных. Внесите вклад в наше общее дело, борьбы со смертью.