Открытое письмо и петиция в ВОЗ о необходимости открытых медицинских данных пациентов с COVID-19
Мы от лица Open Longevity совместно с Международным Альянсом Долголетия (ILA) написали письмо в ВОЗ о необходимости открытых анонимизированных медицинских данных пациентов c COVID-19 и риск-факторов, связанных со старением. Если ВОЗ прислушается, то это ускорит разработку терапии против коронавирусов, ускорить разработку терапии против риск-факторов и поможет бороться с будущими эпидемиями. Письмо подписали ученый из США, Европы, Израиля и России, а также активисты долголетия.
Мы уверены, что ВОЗ сейчас получает множество обращений, и наша письмо потеряется в информационном шуме, если не предпринимать дополнительных усилий по его продвижению. Поэтому мы подготовили петицию, которую может подписать любой желающий, согласный с нашей позицией.
Перевод на русский язык мы также разместили на нашем сайте.
Если аргументы, приведенные в петиции, вам кажутся обоснованными, подпишите её. Сделайте репост, разошлите друзьям. Это поможет борьбе с коронавирусом.
Какие же данные мы просим от ВОЗ? Медицинские: анамнез, анализы крови, рентген и т.п. (например). И ситуация такова, что ВОЗ не хочет ими делиться! Что они сами пишут:
“В соответствии со статьей 11, пункт 4 IHR (International Health Regulations) от 2005 г., ВОЗ не будет раскрывать анонимные данные COVID-19 другим государствам-участникам до тех пор, пока не будут выполнены какие-либо условия, изложенные в пункте 2 статьи 11 и пока ВОЗ не проконсультируется с вовлечёнными странами.
В соответствии с той же статьей 11 ВОЗ не будет предоставлять анонимизированные данные COVID-19 для общественности, если только и до тех пор, пока анонимизированные COVID-19 данные не будут раскрыты для государств-участников и при условии, что другая информация об эпидемии COVID-19 уже стала общедоступной, и существует необходимость в распространении авторитетной и независимой информации».
Тем не менее, открытые медицинские данные, попросту говоря, истории болезней (естественно, анонимизированные, без имен и фамилий), нужны:
Для предсказания тяжести течения заболевания. Если будет предоставлен анамнез, будут указаны анализы крови, возраст, ответы анкетирований и т.п., это поможет прогнозировать развитие заболевания;
Для разработки терапий с учетом риск-факторов или непосредственно направленных на устранение факторов риска.
Для более качественного машинного обучения. Предсказательная сила моделей очень сильно зависит от количества образцов, на которых они тренируются. Особенно это актуально для омиксных данных, где требования к минимальному количеству образцов гораздо выше из-за большого количества параметров в моделях.
Всё это причины, по которым медицинские данные пригодятся уже сегодня. Но есть и ряд других причин. Они связаны с будущими исследованиями, с превентивными мерами. Медицинские данные также нужны для:
Решения проблемы влияния факторов старения на риски в будущих эпидемиях;
Решение проблемы открытости медицинских данных и аннотированности возрастных параметров пациентов.
Существующие национальные системы здравоохранения не справляются с текущей ситуацией. С медицинскими данными проблемы такие:
Локальное хранение. Каждое медицинское учреждение в худшем случае, или каждая национальная система в лучшем, хранит данные пациентов в своем собственном формате со своими собственными правилами доступа. Передача данных из больницы в больницу или из страны в страну затруднена. Протоколы тестирований тоже локальны.В доступ для других ученых выкладывается лишь часть данных по усмотрению конкретного исследователя в соответствии с рекомендациями регулирующих органов.Предпосылки для решения этих проблем существуют и давно известны: облачное хранение, технологии анонимизации и деидентификации и блокчейн для безопасного и контролируемого доступа. А вот сложности в стандартизации форматов как раз могут быть эффективно решены сейчас, когда многие люди готовы вовлекаться в деятельность, способствующую быстрому выходу из критической ситуации.
На данный момент многие страны привлекают волонтеров для помощи врачам для лечения пациентов с COVID-19.
Однако огромное количество биоинформатиков и специалистов в области IT могут быть не менее полезны в данной ситуации. В текущей обстановке создание прототипической общемировой базы пациентов и локальное привлечение одного-двух IT специалистов на больницу могут помочь быстро, эффективно и относительно недорого (с привлечением волонтеров) собрать данные в стандартизированном формате для последующего анализа лучшими учеными и алгоритмами искусственного интеллекта по всему миру.
Разрешая доступ ко всем типам анонимизированных или деидентифицируемых данных сейчас на примере данных пациентов с COVID-19, ВОЗ может существенно ускорить разработки вакцин и протоколов лечения. Кроме того, текущая ситуация может служить грандиозным толчком для оптимизации всей системы работы с медицинскими данными, позволяя отработать алгоритм обмена и стандартизации данных в международном масштабе.
Какие еще типы данных важны для борьбы с коронавирусом?
Геномные данные (например вот, вот и вот), прежде всего, геномы и филогенетические деревья вируса. Здесь дела с открытостью обстоят гораздо лучше.
Они нужны, чтобы отслеживать, как отличаются штаммы вируса в разных популяциях/странах, чтобы понять, насколько универсальными будут терапии и диагностические тесты. Также можно выделять самые эволюционно-консервативные регионы вирусного РНК, чтобы действовать именно на них — потенциально, это могут быть самыми эффективными терапиями.
Транскриптомные данные (например) (прежде всего sc-RNA-Seq иммунных клеток)
Тут вот какое дело. В иммунных клетках происходит гипермутация и VDJ рекомбинация генов, ответственных за кодирование антител и T-клеточных рецепторов. То есть геномы в иммунных клетках разные. Совокупность известных последовательностей (клонотипов) антител и Т-рецепторов называют репертуар. Поскольку это кодирующие участки, чаще всего репертуар узнают на основе single-cell секвенирования РНК иммунных клеток.
Такие данные нужны, чтобы cравнивать переболевших людей с не заразившимися. Ещё можно сравнить репертуар иммунных клеток разных переболевших людей (с разной тяжестью, разным характером протекания заболевания). В итоге всё это поможет проводить диагностику, разрабатывать вакцину.
И, кстати, этих данных явный дефицит, Antibodies Society даже кинула клич:
“… AIRR-C настоящим призывает своих членов и более широкое исследовательское сообщество делиться опытом, ресурсами, образцами и данными как можно более открыто и свободно, а также работать в рамках своих соответствующих систем, чтобы преодолеть барьеры для достижения этой цели, в условиях всеобъемлющих директивах об уважении, неприкосновенности частной жизни и защите пациентов и всех людей. Мы здесь в одной лодке”.
Многие тесты не успевают сертифицировать, клиники и некоторые страны боятся их использовать; это касается не только тестовых китов, но и ПЦР-машин, и прочего оборудования.
Данные о распространении вируса (например вот и вот) и прогнозировании. Ситуация нормализуется, но так как история с диагностикой всё ещё далека от идеальной, это вносит свои коррективы в эпидемиологические данные.
Общеобразовательная информация. Тут ВОЗ нормально справляется.
Существующие инициативы, включая Kaggle Challenges, не решают задачу сбора и формирования медицинских COVID-19 датасетов и сфокусированы на других направлениях (тренировка систем обработки естественного языка на текстах про коронавирус, разбор геномов, прогнозирование распространения вируса и т.п.).
В целом, идея в том, чтобы найти способы многократно снизить летальность от COVID-19, воздействуя на риск-факторы. В качестве примера, можем привести IL-6, как перспективную мишень воздействия на фактор риска.
Подпишите петицию! Всемирная Организация Здравоохранения обязана как поделиться существующими у них медицинскими данными, так и наладить работу по получению новых качественных данных. Внесите вклад в наше общее дело, борьбы со смертью.