OpenAlex
OpenAlex — это открытая наукометрическая платформа и сервис поиска научной литературы, бесплатная и общедоступная база данных исследований.
OpenAlex - это открытая наукометрическая платформа и сервис поиска научной литературы, бесплатная и общедоступная база данных исследований.
Проект создан организацией OurResearch, известной также по сервисам ImpactStory и Unpaywall.
Название OpenAlex отсылает к Александрийской библиотеке. Платформа стала преемником Microsoft Academic Graph (MAG) и начала работу в 2022 году. MAG задумывался как открытая альтернатива Google Scholar и получил широкое распространение благодаря полноценной открытой лицензии и масштабной базе метаданных научных работ. После неожиданного закрытия MAG корпорацией Microsoft именно открытая лицензия позволила небольшой команде OurResearch унаследовать и развить данные, создав еще более открытый продукт. Уже к 2023 году OpenAlex получила значительную популярность и стала инфраструктурой для множества сервисов и стартапов. В системе собрано свыше 250 млн записей о публикациях из приблизительно 230 тыс. источников.
В настоящее время основой исторической части базы остаются данные MAG, однако платформа активно дополняется за счет CrossRef - основной глобальной системы регистрации DOI. Это главный канал поступления новых публикаций. Дополнительно используются данные MEDLINE (PubMed), репозиториев препринтов (например, arXiv), репозиториев научных данных (например, Zenodo), а также сведения о доступности открытых полных текстов из Unpaywall. Механизмы веб-сканирования, применяемые Google Scholar, играют вспомогательную роль. В отличие от Web of Science и Scopus, прямое получение контента от издателей не используется. В сущности, OpenAlex выступает как интегратор многих открытых источников.
База включает пять типов сущностей: научные работы (works), авторов (authors), организации (institutions), издания (venues) и понятия (concepts).
Система поддерживает стандартные международные идентификаторы: DOI для публикаций, ORCID для авторов, ISSN-L для журналов, ROR для организаций, а также ряд дополнительных идентификаторов, например Scopus Author ID.
Для каждой сущности предусмотрены отдельные точки входа API, позволяющие получать как отдельные объекты, так и выборки: - для публикаций, для авторов и т.д.
OpenAlex предоставляет хорошо документированный API, для которого уже созданы удобные пакеты на языках R и Python. В дополнение к этому теперь доступен и полноценный веб-поисковик научных публикаций.
Отличительные преимущества OpenAlex:
- отдельный API для получения N-грамм из полных текстов 57 млн статей;
- доступ к данным о цитирующих публикациях;
- лицензирование по CC0;
- привязка концептов к объектам Wikidata и статьям Википедии.
API OpenAlex работает через HTTP-запросы по URL, поэтому их легко тестировать прямо в браузере. Ответы, как правило, приходят в формате JSON — структурированном, «читаемом», но объемном. Firefox поддерживает его удобное отображение по умолчанию, для Chrome потребуется расширение.
Для сохранения данных в форматах Excel или CSV обычно используют Python-библиотеки Requests (для загрузки данных) и Pandas (для их обработки и анализа).
Полезные материалы:
- Русскоязычные примеры использования API доступны в онлайн-руководстве Наукометрического центра ВШЭ;
- Подкаст «Introducing OpenAlex: an open and complete index of the global research system» с участием разработчиков (Jason Priem), июнь 2022 г.;
- Руководство по технической документации Openalex (декабрь 2025 г.);
- Репозиторий OurResearch на GitHub;
- Официальный блог OurResearch.
- Анализ полезности Openalex для выявления исследований для систематических обзоров: методы и пример из практики (pubmed).
- OpenAlex: большой шаг к открытой науке?
- Краткий видео-гид
В отличие от WoS, Scopus, Google Scholar и eLIBRARY.ru данные OpenAlex распространяются по максимально свободной лицензии CC0 (Public Domain), что позволяет использовать их без ограничений, включая коммерческое применение.
Адрес для работы
Какова ваша реакция?