ПРОЕКТ
СТРАТЕГИЧЕСКОГО ПЛАНА РАЗВИТИЯ
ГНМБ МЗ РУз
2023-2028
МЕДИЦИНА И ЗДОРОВЬЕ, ОСНОВАННЫЕ НА ДАННЫХ
Проект стратегического плана развития ГНМБ МЗ РУз
по акселерации научных исследований и информационному обеспечению
медицинской отрасли на основе открытых данных
Введение
Цифровые технологии все шире проникают в разные отрасли, обостряя проблему управления большими данными, требуя оптимизации методов и подходов к обработке данных, а также эффективных способов сбора данных и их обмена с учетом, в частности, наблюдаемых сегодня социальных, экономических и политических изменений в обществе. Несмотря на то что термин «большие данные» чаще связывают с социальными сетями, финансовой индустрией и ретейлом, изначально большие данные генерировались в рамках широкомасштабных научных проектов — в частности, проекта Большого адронного коллайдера, потребовавшего создания принципиально новых средств и методов обработки экстремально больших объемов сведений, получаемых в ходе экспериментов. Сегодня подходы к управлению большими данными, предложенные научным сообществом, внедряются повсеместно, и именно способностью организовать эффективный доступ к информации о различных группах пользователей объясняется успех Amazon, Alphabet и Facebook. Проблема управления данными актуальна и для систем искусственного интеллекта и комплексов кибербезопасности. Например агентство DARPA, традиционно занимающееся проблемами «стыковки» фундаментальных научных работ с прикладными решениями, поддерживает десятки программ по искусственному интеллекту и около сотни проектов, связанных с кибербезопасностью. Один из них — Automating Scientific Knowledge Extraction — направлен на автоматизацию процессов извлечения научных знаний с определением местонахождения новых информационных ресурсов, а также их анализа с целью получения новых знаний и генерации новых моделей.
На решение подобных проблем нацелена инициатива Go FAIR (Findable, Accessible, Interoperable, Reusable), содержащая базовые принципы улучшения возможностей поиска, обеспечения доступа к данным, их совместимости и, что особенно важно, повторного использования. В 2016 году был представлен «Руководящий принцип FAIR управления научными данными» (см. The FAIR Guiding Principles for scientific data management and stewardship. URL: https://www.nature.com/articles/sdata201618). Согласно FAIR, функции поиска, извлечения и представления данных реализуют не пользователи, а информационная система. При этом речь идет не только о самих данных и метаданных, но и об алгоритмах и инструментах управления ими. Кроме того, к разработке подходов к управлению научными данными привлекаются все заинтересованные стороны: научно-исследовательские организации и отдельные ученые; операторы баз данных и издания, публикующие научные статьи и результаты экспериментов; финансирующие организации; производители программного обеспечения и инструментов обработки данных; компании, предоставляющие услуги по анализу и интерпретации данных. Важно, что в круг заинтересованных сторон также включаются сами вычислительные системы (алгоритмы обработки данных) как самостоятельный объект — в зависимости от их рейтинга принимается решение о включении численного метода в конфигурацию. На рисунке приведен перечень руководящих принципов FAIR.
Руководящие принципы FAIR
Руководящие принципы FAIR не предполагают какой‑либо стандартизации или конкретной технологии их поддержки. Принципы выступают в качестве руководства для «издателей» данных по оценке их технологий реализации облаков данных (хранилищ данных), по степени функциональности поисковых возможностей, доступности, совместимости и повторного использования данных.
В целом FAIR подобен open data, но имеется ключевое отличие. Открытые данные доступны каждому без каких‑либо лицензионных ограничений, соглашений, авторских прав или патентов, а FAIR предполагает возможность доступа к данным (метаданным) в определенное время и на определенных условиях. Иначе говоря, FAIR-данные могут быть как открытыми, так и частными, если они доступны лишь определенной группе пользователей. Такой подход является более гибким и позволяет характеризовать данные на каждом этапе их жизненного цикла. Например, в процессе физического эксперимента данные доступны только группе экспериментаторов, затем — научному сообществу в целях их интерпретации, а после обработки выложены в общий доступ (open data) как результат эксперимента. На практике научные данные неоднократно переходят через такие стадии «открытости». В подавляющем большинстве случаев персональные и коммерческие данные не могут быть общедоступными, что противоречит идеям open data, но допустимо в FAIR.
Сегодня множество европейских исследовательских инфраструктур (DTU Library, International Neuroinformatics Coordinating Facility, TU Dublin, Biobanking and Biomolecular Resources Research Infrastructure of Czech Republic, Radboud University и др.) используют концепцию FAIR при предоставлении доступа к своим научным данным. Созданы и развиваются методические рекомендации и инструкции по представлению данных в соответствии с FAIR. Было установлено, что использование подхода FAIR к управлению данными позволяет ЕС сэкономить более 10 млрд. евро в год.
Большие объемы генерируемых в ходе научных исследований данных делают актуальной задачу повышения качества управления ими — ключевой сегодня становится не проблема сбора, публикации и хранения информации, а обеспечение эффективного поиска, анализа и повторного использования данных, в том числе и на других инфраструктурах.
На данный момент отсутствует единая форма представления научных данных, полученных на различных тематических научно-исследовательских инфраструктурах, что не позволяет в полной мере извлекать выгоды от инвестиций — отсутствует трансфер научных результатов в формате, понятном инвесторам, чиновникам и обществу. В этой связи принципы FAIR в управлении данными можно рассматривать как один из шагов по формированию цифровой инфраструктуры, позволяющей контролировать рост объемов информации, исключая создание больших данных из больших данных. Унификация представления данных в FAIR расширяет доступ бизнеса, общества и государственных структур к научным результатам. Принципы и подходы FAIR целесообразно учитывать при разработке правил организации управления большими данными в любой сфере, что может существенно расширить круг компаний и организаций, заинтересованных в повышении исследовательского и инновационного потенциала Республики Узбекистан.
В связи с этим нами ставится вопрос о полноценном и глубоком обеспечении медицинских и научных кадров новейшей информацией соответвующей вышеизложенным принципам, а также содействие в акселерации научных исследований, организации быстрой доступности информации и ее широкому использованию в научных исследованиях.
Существующая на сегодняшний день инфраструктура библиотеки во многом использует устаревшие подходы и программное обеспечение к обработке и хранению биомедицинских данных и не позволяет во многом обеспечивать все возрастающие потребности медицинской отрасли в систематизированных цифровых форматах данных, основаннах на многомерном представлении информации. На сегодняшний день информация — это не только книги, статьи или журналы, но и другие источники, поучаемые с различного медицинского оборудования, систем диагностики и параметрической визуализации данных.
Это:
- Открытые данные о человеке;
- Фото-видеоданные;
- Записи электронных медицинских карт;
- Данные с носимых устройств;
- Данные лабораторных исследований;
- Данные инструментальных исследований;
- Генетические данные и др.
По мере распространения таких технологий, как секвенирование генома одной клетки (SCseq), улучшенная биомедицинская визуализация и медицинские устройства "интернета вещей (IoT)", ключевые открытия о здоровье человека все чаще обнаруживаются в обширных массивах сложных данных наук о жизни и здоровье.
Но сделать осмысленные выводы на основе этих данных — сложная задача, которая может включать в себя объединение различных типов данных и манипулирование огромными наборами данных в ответ на различные научные запросы. Проблема касается не только информатики, но и других областей науки.
В разработке данного стратегического плана развития нам помогали сотрудники различных институтов по смежным дициплинам, специалисты по информатике, ученые-медики, специалисты по данным, клиницисты, специалисты в области общественного здравоохранения и другие заинтересованные стороны. С учетом этого, мы рассматриваем свое перспективное развитие следующим образом:
— Первое и самое главное — это акселерация научных открытий путем расширения систематической поддержки медицинской отрасли структурированными данными и улучшения их доступности. Для того чтобы открыть дверь к новым перспективам улучшения здоровья населения, необходимы сложные библиотечные и информационные науки, а также информатика и наука о данных (Data Science), которые позволят находить ученым и медицинским работникам новые идеи и решения.
— Во-вторых, согласно опыту ведущих мировых систем здравоохранения, клиническая помощь быстро перемещается из больниц в локальную экологическую среду обитания человека. Это требует пересмотра имеющейся архитектуры организации научных знаний и требует концепции опережающего равития, что ставит перед ГНМБ задачу по обеспечению информационной составляющей в тех местах, где формируется здоровье, а не только в местах оказания медицинской помощи, которые являются менее формализованными и менее контролируемыми.
— В-третьих, открытость и диверсификация науки, которая крайне необходима для акселерации развития медицинской отрасли должна интенсифицировать открытия в этой области. Для этого необходимо объединение усилий правительственных и научных учреждений в соответствии с концептуальными изменениями в науке, ее тенденциям к мультидисциплинарности, что приведет к ускорению инноваций в этой области, при условии, если данные будут широко доступны и свободно распространяться. Результаты исследований, финансируемых из различных источников, должны быть открыты для общества, широко освещаться в средствах СМИ, что несомненно приведет к усилению связи между учеными, гражданами нашей страны и производственным сектором экономики, принося социальные выгоды.
— В-четвертых, должна измениться сама природа библиотек. Библиотеки продолжают оставаться важнейшими местами для хранения знаний и традиционным культурным местом для получения необходимой информации, однако появление возможности самостоятельного поиска, электронных публикаций и консолидация библиотечных услуг на местах ставит библиотекарей и библиотеки перед необходимостью разработки новых инновационных услуг и решений в этой области. Данный стратегический план при условии его всесторонней поддержки позволит библиотеке перейти на качественно новый уровень развития положив фундамент в решении существующих и возникающих проблем в области акселерации биомедицинских исследований и в сфере здравоохранения. Мы можем достичь этого путем глубокой реорганизации инфраструктуры, кадрового потенциала и путем широкого привлечения различных специалистов из смежных отраслей улучшив таким образом развитие наших основных функций по приобретению, сбору и распространению национальной и мировой биомедицинской и другой литературы; расширение нами этих и развитие новых навыков, сделает данные доступными для поиска, доступа, взаимодействия и повторного использования (принципы FAIR).
ЦЕЛИ СТРАТЕГИЧЕСКОГО ПЛАНА РАЗВИТИЯ
Цель 1.
Цель 1.1: Объединить ресурсы всех имеющихся региональных подразделений библиотек, ресурсных центров медицинских институтов, НИИ, медицинских центров и учреждений на базе единой цифровой исследовательской платформы по предоставлению данных.
Это предусматривает:
- Полный перенос всего фонда научной медицинской литературы в цифровой формат и создание стандартизированной платформы для доступа к биомедицинским данным.
- Создание Национального центра биотехнологической информации при ГНМБ.
- Создание конструктора медицинских сервисов по предоставлению данных и интерфейсов взаимодейставия врач-врач, врач-пациент, основанных на принципах FAIR.
- Привлечение специалистов различого профиля к обработке данных в том числе специалистов Data-Science и поднятие квалификации собственных сотрудников до уровня аналитиков данных.
Это будет включать разработку новых методов автоматизированного индексирования и инновационные подходы к представлению информации, для обеспечения оперативной совместимости между ресурсами и, что важно, упростит связь с ресурсами, не размещенными в ГНМБ. Мы будет содейстовать и участвовать в разработке новых коллекций биомедицинских данных, чтобы отображать научный прогресс и удовлетворить новые научные потребности. Создавая единую платформу для доступа к данным, ГНМБ будет стремится предлагать широкому кругу ученых ресурсы, полезные для развития фундаментальных, прикладных и трансляционных исследований в области здравоохранения.
Цель 1.2: Акселерация исследований и разработок в области биомедицинской информатики и науки о данных.
Современные исследования в области биомедицины говорят о будущих концепциях, согласно которым сама пища станет лекарством, где понимание контекста здоровья выйдет далеко за пределы внутриклеточной молекулярной организации и распространится на окружающую экологическую инфраструктуру домов и городов, где потоки данных, необходимые для операционной характеристики явлений здоровья, будут слишком плотными, чтобы их могли охватить стандартные базы данных. Мы планируем в тесном партнерстве с биомедицинскими и клиническими исследовательскими организациями создавать необходимые ресурсы и инструменты для ускорения исследований в области предоставления знаний, создавая условия для лучшего использований возможностей и достижений этих дисциплин.
Первым среди этих ресурсов и инструментов будет разработка централизованной системы цифровых исследовательских объектов — статей, наборов данных, вычислительных алгоритмов, аналитических моделей, инструментов визуализации, стандартов ссылок и т. п., каждый из которых будет иметь уникальный идентификатор и могут быть объединены в новые способы хранения и доступа к ним для акселерации открытий в широком спектре междисциплинарных исследований. Мы планируем создать новые форматы данных для созданий более эффективных механизмов хранения и распространения информации в том числе и в виде распределенных вычислений и нейросетевой памяти.
Объединение коллекций цифровых объектов таким образом, при котором целое будет больше, чем сумма его частей, ставит большие вычислительные и научные задачи. Для преодоления этих проблем потребуются исследования и разработки в области науки о данных и информатики, включая инновации в области аналитики, визуализации, моделирования, генерации знаний и подходов к синтезу данных нового поколения. Эти инновации, в свою очередь, зависят от достижений в науке и математике, лежащих в основе таких подходов. Эта программа исследований потребует увеличения инвестиций и поддержку государства в данных исследованиях и привлечения инвестиций, что значительно ускорит эти процессы.
Поскольку наука и здравоохранение производят все больше цифровых данных, будь то данные, полученные в ходе исследований, электронные медицинские записи или вычислительные модели — их информационная значимость может быть повышена за счет глубокой нейросетевой переработки. Ключевой областью данных исследований является вопрос о том, каким образом можно осуществить масштабное преобразование огромных объемов таких данных таким образом, чтобы это можно было сделать широко применимыми в биомедицине, общественном здравоохранении. Автоматические, автономные стратегии математической обработки данных позволят повысить эффективность работы, а также ускорить скорость научных открытий и инноваций.
Аналитика со статистической обработкой, представление данных без визуализации и "извлечение информации с использованием смысла" в гетерогенных источниках данных — важные области для развития Data Science. Исследования и разработка искусственного интеллекта в его многочисленных формах, включая обработку естественного языка и глубокое обучение, требуют масштабирования, визуализации, тестирования и глубокой перерабоки.
— Вычислимые биомедицинские данные — это такие диагностические, прогностические и аналитические модели, модели принятия решений или практические рекомендации, представленные в виде закодированных цифровых объектов — становятся все более важным дополнением к человеческим знаниям, представленным в книгах и журналах.
— Разработка функциональных алгоритмов "исполняемых статей", которые образуют интерактивную библиотеку, где ресурсы "интерактивно взаимодействуют друг с другом" и позволят переходить не только от данных к знаниям, но и от знаний к действиям.
— Богатый набор ресурсов данных предоставит возможности для проведения фундаментальных исследований в области медицинских наук на основе данных. Мы будет стремиться сотрудничать с учеными из других научно-исследовательских, региональных и зарубежных институтов для решения исследовательских вопросов и принятия ценных решений.
Цель 1.3: Содействие политике и практике открытой науки (принципы FAIR).
FAIR-данные — это данные, соответствующие принципам Findability, Accessibility, Interoperability, Reusability — находимости, доступности, совместимости и переиспользования. Принципы FAIR фокусируются на возможностях автоматической обработки — то есть способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека, или с минимальным его участием — это необходимо в связи с постоянным ростом объёма, сложности и скорости возникновения информации.
Мы является сторонниками открытой науки и тем самым мы считаем своей основной целью — это обеспечение доступа к продуктам и процессам научных исследований — то есть сделаеть их широко доступными. Для этого мы предусматриваем разработку инструментов, поддерживающих открытую науку, включая информационные системы и системы данных, которые создадут инфраструктуру для хранения публикаций, данных и других результатов исследований, создавая тем самым их доступность для самой широкой аудитории.
ЦЕЛЬ 2:
Охватить большее количество людей с помощью расширения путей распространения и сбора информации
В данном изложении мы исходим из представления о том какие конечные цели и потребности мы должны удовлетворять, а именно: потребности ученых, клиницистов и общественности.
Будущее здравоохранения на основе данных будет построено на новых моделях взаимодействия с данными инновационными способами, которые могут ускорить акселерацию научных открытий и привести к знаниям, которые могут обосновывать решения и действия.
Любое продвижение науки и улучшение здоровья связаны с тем, что потенциальные пользователи должны быть осведомлены о наличии наших ресурсов, а также должны иметь широкий доступ к ним и понимать как их использовать. Мы постоянно стремимся понять потребности пользователей в том, как они меняются со временем и среди различных категорий, а также создавать новые и улучшенные способы предоставления нужной информации, на нужном уровне сложности и в нужное время.
Используемая нами в настоящее время методология продвижения информации среди социальных сетей, в частности создание канала в Telegram, создание поисковой системы на сайте (uzmedlib.uz) привлекла много пользователей и позволила нам хоть частично обеспечить их потребности в цифровой медицинской литературе, однако технологическая платформа мессенджера и имеющая инфраструктура серверов не позволяет в полной мере реализовать нам принципы FAIR.
При разработке своих инициатив по распространению информации мы будем стремится к разработке инновационных и информационно-просветительских подходов, при которых доступ к информации может уменьшить неравенство в области здравоохранения и поддержать недостаточно обслуживаемые слои общества, несущие непропорционально тяжелое бремя заболеваний.
Цель 2.1: Изучать запросы пользователей наших ресурсов и вовлекать их в постоянную работу с ними.
Поскольку новые ресурсы и услуги приводят к появлению новых пользователей с новыми информационными потребностями, нам необходимо будет создать пути для предоставления им соответствующей информации в то время, когда эта информация необходима. Пользователи будут варьироваться от библиотекарей до исследователей, от клиницистов до родителей, от фармацевтов до лабораторий общественного здравоохранения. Для каждой из этих групп пользователей потребуются уникальные модели взаимодействия. Вовлечение пользователей включает в себя повышение осведомленности об информационных ресурсах, понимание информационных потребностей, облегчение доступа и обеспечение способности использовать информационные ресурсы.
Мы разработаем стратегии для повышения узнаваемости своей деятельности среди целевых аудиторий на глобальном и национальном уровнях. Признавая, что люди живут в сообществах, мы будет использовать стратегии дизайна, ориентированные на человека и на сообщество. Это требует инвестиций в исследования для лучшего понимания потребностей в медицинской информации и способов их удовлетворения. Приоритетом будет повышение осведомленности о наших услугах среди сообществ с низкими ресурсами или низким уровнем грамотности и среди недопредставленных групп, в соответствии с обязательством использовать информационные вмешательства для сокращения неравенства в области здравоохранения.
ГНМБ будет использовать подходы к разработке и предоставлению услуг быстрого цикла, которые отражают знание как того, что пользователь ищет в его ресурсах, так и того, зачем они это ищут. Также важно понимать потребности пользователей в текущий момент. Подходы к распространению информации должны отражать различные мотивы поиска информации, а также различия в уровне здоровья и грамотности в области данных среди пользователей ГНМБ.
Социальные сети остаются важными средством доставки информации и будут использоваться для расширения охвата по всей территории Узбекистана.
Цель 2.2: Укрепление отличительных особенностей ГНМБ как надежного, заслуживающего доверия источника медицинской информации и биомедицинских данных.
Информация и данные, предоставляемые нами являются важными для биомедицинских открытий и современного здравоохранения и одновременно будут становятся все более незаметными, поскольку они будут встраиваются в процессы и продукты наших пользователей. Это необходимо органам здравоохранения, которые ежедневно обращаются к банкам геномных данных для определения природы возбудителя пищевых заболеваний; необходимо больницам для демонстрации качества обслуживания с помощью встроенной связи Avicenna Connect с клиническими системами для предоставления пациентам индивидуальных, надежных медицинских инструкций; необходимо более чем четырем 8 тыс пользователей, которые ежедневно обращаются к нашим литературным базам данных. Новые устройства, Интернета вещей (IoT), открывают совершенно новые возможности для распространения ресурсов ГНМБ. Поскольку они (ресурсы) становятся встроенными в поисковые системы и информационные инструкции, мы сможем найти способы продвигать цепи доверия к медицинской информации. Те, кто узнает бренд ГНМБ — библиотеки, ученые-исследователи, специалисты в области здравоохранения и обычная публика — будут знать и доверять нашим информационным ресурсам.
Цель 2.3: Поддержка исследований в области методов доступа к биомедицинской информации и стратегий распространения информации.
ГНМБ будет оказывать поддержку программам исследований в таких областях, как обработка информации быстрого цикла, и проводить исследования, чтобы предлагать новые информационные продукты своим пользователям. В центре внимания будет понимание того, как инициируется поиск, как используется информация и как задаются вопросы.
Библиотека обеспечит сведениями о важных достижениях в предоставлении руководств к действию или принятию решений и обеспечит это понимание посредством передовой визуализации сложных данных. ГНМБ продолжит поддерживать и проводить исследования в области информатики и науки о данных для разработки передовых интерфейсов и систем запросов, которые облегчают доступ к информационным системам новыми способами таким образом соответствуя информационным потребностям клиентов. Некоторые примеры областей исследований, способствующих инновациям в области доступа к информации и ее предоставления, включают взаимодействие человека и компьютера, обработку естественных языков, виртуальную и дополненную реальность для взаимодействия систем, механизмы вероятностного вывода для осмысления визуализации данных и предиктивную аналитику. Чтобы удовлетворить потребности разнообразной аудитории в информационных услугах, мы также будем проводить исследования для решения вопросов грамотности, умения интерпретировать и делать информацию применимой в текущий момент.
Цель 2.4: Улучшение качества предоставления информации.
ГНМБ будет предоставлять доступ к информации на различных платформах доставки и через различные форматы интерфейсов, ориентированные на пользователя, включая способы, которые сильно отличаются от сегодняшних форматов, в частности системы распределенных вычислений, основанных на технологиях распределенных вычислений Rosetta. В дополнение к разработке новых подходов к запросу баз данных по требованию, мы рассмотрим возможность внедрения моделей push, которые будут предвосхищать потребности пользователей, непрерывно работать для поиска новой информации и предоставлять им результаты точно в срок. С исследовательской точки зрения будут изучены новые подходы к форматам ввода и вывода информации, включая голосовую связь, звуки, изображения и приложения виртуальной реальности. Партнерство с другими смежными отраслевыми институтами, решающими проблемы предоставления информации, может привести к инновациям в предоставлении информации, а также к появлению новых платформ.
Для облегчения доступа к нашим ресурсам будут разработаны интерфейсы, более единообразные для всех платформ. Будут изучены голосовые, жестовые и поведенческие интерфейсы, при этом будут предприняты попытки обеспечить предсказуемую отдачу. Использование общего интерфейса не только улучшит доступность ресурсов, но и дополнит улучшения в области совместимости и возможности поиска соответствующих ресурсов. Благодаря экспериментам с новыми способами улучшения качества поиска и удобства использования, ГНМБ предложит пользователям лучший опыт для более быстрого поиска информации, с современным интерфейсом и улучшенной поддержкой мобильных устройств.
Учитывая спектр использования наших ресурсов мы продолжим предлагать множество платформ доставки, включая интерфейсы прикладного программирования (API), мобильные, социальные сети, веб-приложения и автономные приложения, которые могут работать без доступа в Интернет. Будут изучены новые режимы представления информации, которые не требуют от пользователя чтения, но при этом позволят ему контролировать этот процесс. Основой этих усилий является признание того, что наиболее быстро растущая группа наших пользователей — это актуально цифровые устройства, которые взаимодействуют с системами автоматически.
ЦЕЛЬ 3:
Формирование кадрового потенциала для исследований и медицине основанной на данных
Чтобы обеспечить будущие открытия на основе данных и здоровья, необходимо иметь кадры в области биомедицинской информатики и науки о данных, готовые к концептуальным и методологическим достижениям в области аналитики, визуализации, извлечения данных и других методов, необходимых для их использования для практической детельности и обеспечения их взаимодействия с существующими знаниями. Также необходимо новое поколение библиотекарей, способных собирать и распространять ресурсы данных в той же степени, что и более привычные формы научных коммуникаций. Роли информатика и библиотекаря должны расшириться, чтобы поддержать текущую инфраструктуру, в которой массивные промышленные поисковые системы обеспечивают скоростной доступ к огромным массивам информации, угрожая при этом перегрузить пользователя неограниченными списками потенциально релевантных ресурсов.
Обучение должно способствовать развитию ученых, обладающих как знаниями в области биомедицинской информатики или науки о данных, так и знаниями в биомедицинской или клинической области. И то, и другое необходимо для того, чтобы разработать и внедрить удобные и полезные приложения, использующие возможности данных для развития знаний и улучшения здоровья.
Расширение трудового коллектива является краеугольным камнем нашей миссии. Инициативы по обучению, которые готовят исследователей к изменяющимся проблемам исследований, основанных на данных, дополнят обучение, которое обеспечивает быструю, своевременную и необходимую подготовку ученых и других специалистов. Существующие программы будут расширены и пересмотрены для использования научных возможностей, формирования новых партнерств, наращивания потенциала и обеспечения надежных кадров для научных открытий в ближайшие десятилетия. Новые модели обучения, от трехминутных видеороликов до иммерсивных групповых задач по решению проблем, будут способствовать развитию командных научных навыков и междисциплинарного обучения.
Цель 3.1: Расширение и совершенствование подготовки научных кадров в области биомедицинской информатики и науки о данных.
Мы ставим своей целью подготовку и обеспечение достаточного количества передовых ученых-исследователей для проведения исследований в области биомедицинской информатики и науки о данных, а также в качестве наставников и преподавателей для следующего поколения. Важные навыки для всех исследователей включают готовность к "вычислениям в контексте"; извлечению смысла и понимания из совокупности данных и созданию новых способов анализа, визуализации, извлечения и интеграции данных и информации. Необходимо подготовить специалистов для решения задачи обеспечения динамического обеспечения в режиме реального времени в масштабе и сложности, которые ожидают биомедицинские данные и информацию в будущем.
ГНМБ предусматривает своей целью поготовку нового поколения специалистов по работе с данными в дополнение к существующим программам подготовки другими ВУЗами докторов наук в области трансляционных исследований, биоинформатики, информатики здоровья населения, а также информатики клинического и общественного здравоохранения. Акцент на науку о данных и управление большими и сложными биомедицинскими данными будет расширен в существующих учебных программах на базе медцинских институтов. Это будет предполагать включение в науку о данных концепций безопасности и управления конфиденциальностью в дополнение к обеспечению распространения и аналитическим подходам нового поколения в рамках Data Science. Такой акцент позволит подготовить кадры ученых, которые смогут разработать новый набор инструментов и подходов к данным, выведя аналитику за рамки сугубо статистических выкладок, предварительное представление вне ее визуализации и многое другое. Используя разработанную внутриведомственную программу исследований в области передовой аналитики, ГНМБ будет предлагать краткосрочные и длительные тренинги с участием междисциплинарных групп ученых для разработки методологий искусственного интеллекта следующего поколения и машинного обучения. Особое внимание будет уделено разработке инновационных методов управления и распространения обширных электронных ресурсов библиотеки.
Цель 3.2: Обеспечение уровня знаний в области Data Science и Open Science.
Наука о данных (Data Science) — ускорение получения знаний из данных с помощью целенаправленных методологий — и открытая наука (Open Science)— стремление сделать все аспекты исследовательского процесса от разработки до данных доступными для ученых, специалистов и общества в целом — в совокупности создают новую парадигму обучения. Подготовка кадров для решения проблем биомедицинской науки о данных включает в себя повышение вычислительных и статистических навыков исследователей с биомедицинскими знаниями, а также обучение компьютерных специалистов возможностям применению их навыков для решения биомедицинских проблем. При разработке подходов к обучению ГНМБ будет сочетать эти две цели перекрестного обучения для поддержки развивающейся области биомедицинской науки о данных. Чтобы расширить свои инициативы по обучению, мы будет сотрудничать с другими агентствами, институтами, университетами и поставщиками услуг онлайн-образования.
Подготовить клиницистов и специалистов по биомедицинским исследованиям к использованию ресурсов данных и интерпретации результатов исследований, основанных на науке о данных. ГНМБ будет сотрудничать с Министерством Здравоохранения для разработки основной учебной программы для обучения науке о данных, включенной в учебные программы конкретных медицинских институтов. Это также поможет обеспечить, чтобы обучение по конкретным направлениям соответствовали профессиональным навыкам в области науки о данных. Работая с партнерами, мы определили стратегии содействия обучению науке о данных инновационными способами, такими как модульные подходы или самостоятельное обучение, охватывающие такие темы, как передовая аналитика, стандарты данных, управление данными, воспроизводимость и обмен данными.
Обучение управлению данными. Управление данными является основой открытой науки и должно тать фундаментальным компонентом каждого исследовательского проекта и программы. Приверженность открытой науке расширяется во всем мире, обмен данными и их повторное использование становятся нормой во многих биомедицинских исследовательских дисциплинах. Исследователям необходима помощь, чтобы гарантировать, что данные, созданные в ходе исследовательских проектов, будут доступны для поиска, доступа, взаимодействия и повторного использования (FAIR), а также будут эффективно управляться и контролироваться на протяжении всего жизненного цикла исследования.
Продвижение компетенций в области открытой науки и науки о данных для специалистов в области информатики. Поскольку библиотекари и другие специалисты в области информации удовлетворяют развивающиеся потребности научно-исследовательских сообществ, они играют особенно важную роль в развитии открытой науки, управлении данными, совместном использовании данных и создании репозиториев. Программы, позволяющие играть такую роль в продвижении данных и поддержке открытой науки, предоставляемые ГНМБ, через сети или в партнерстве с профессиональными ассоциациями, гарантируют наличие подготовленных кадров для поддержки науки о данных, повторного использования данных и ответственного управления данными. С ростом участия в гражданской науке публичные библиотекари нуждаются в особой поддержке и информацией по управлению данными и интерпретации исследований, основанных на данных!
Цель 3.3: Привлечение молодого поколения и содействие развитию грамотности в области данных.
Поколения, выросшие в насыщенном технологиями мире, привносят определенный набор навыков в науки о здоровье и биомедицинские услуги. Рост количества высокоспециализированных кадров, хорошо подготовленных к решению задач науки 21 века, по-прежнему требует инициатив по развитию энтузиазма к науке и данным в раннем возрасте. ГНМБ будет воспитывать и вдохновлять следующее поколение узбекистанских исследователей в области биомедицинской информатики, специалистов по работе с данными и профессионалов в области информации. В сотрудничестве с государственными и частными партнерами ГНМБ будет разрабатывать инициативы по пробуждению интереса учащихся к медицинской науке, технологиям Data Science и IT (STEM). Эти инициативы будут включать способы определения необходимых навыков и разработку целевых образовательных ресурсов для учащихся от начальной школы до института.
Работа с данными не ограничивается теми, кто работает в официальных исследовательских или клинических учреждениях. Обществу необходим базовый уровень научной и информационной грамотности. Наш коллектив будет работать с организациями, образовательными учреждениями и другими публичными библиотеками, чтобы внести свой вклад в повышение уровня понимания и оценки науки общественностью.