Использование Всемирного словаря гендерных имен

30 мая 2023 г.

30 мая 2023 г. ・ 5 minutes reading time

#
Изображение: Getty Images/damircudic

Всемирный словарь гендерных имен (WGND) теперь предлагается в версии 2.0 с большим числом доступных данных по странам и территориям, а также именам физических лиц. Файлы документации и библиотеки WGND доступны в режиме онлайн, чтобы пользователи могли начать применять словари гендерных имен к любому набору данных с именами, которые сопровождаются географическими кодами.

Всемирный словарь гендерных имен был расширен благодаря недавнему исследованию и теперь включает более 26 миллионов записей, в которых указываются имена физических лиц, относящиеся к 195 различным странам и территориям. WGND 2.0 является дополненной версией WGND 1.0 и результатом компиляции более чем 50 различных новых различных источников гендерных данных и обновления первоначального списка источников.

Где можно найти Всемирный словарь гендерных имен версии 2.0?

WGND  2.0 доступен онлайн на странице открытого проекта по гендерной тематике IES Gender Open Source Project. На странице представлен специальный репозиторий Github с документацией, описывающей различные наборы уникальных наблюдений за гендерными данными, привязанными к кодам стран и языков. Сопроводительная документация для версий словаря 1.0 и 2.0 доступна на сайте Harvard Dataverse.

Как пользоваться Всемирным словарем гендерных имен версии 2.0?

Первый шаг: подготовьте набор данных с именами физических лиц и кодами стран. Как только набор данных готов, следующим шагом будет выполнение следующих четырех проверочных процедур для очистки данных:

  • Удалите фамилии или патронимические имена в записях имен, чтобы в переменной «имя» остались только первые или основные имена.
  • Переведите оставшиеся записи имен в нижний регистр и удалите пробелы до и после текста имен.
  • Удалите двойные пробелы между словами, составляющими каждую окончательную запись имени.
  • Убедитесь, что коды стран и территорий, содержащиеся в наборе данных, соответствуют двухбуквенным кодам (alpha-2), указанным в стандарте ISO 3166-1. Полный список доступных двузначных кодов стандарта доступен в режиме онлайн на платформе ISO Online Browsing Platformили по ссылке: io.

После этого следует воспользоваться инструментом Gender-it на ресурсе GitHub для применения библиотек Всемирного словаря гендерных имен к полученному очищенному набору данных. Gender-it содержит библиотеки WGND версии 2.0, ими можно воспользоваться с помощью Stata или Python (ознакомьтесь с видеоуроком ниже). Библиотеки в этих вариантах программного обеспечения содержат подробные инструкции и примеры загрузки необходимых файлов документации, функций и пакетов для сопоставления очищенной базы данных пользователя с разновидностями словарей гендерных имен, доступных в WGND версии 2.0. Для начала работы пользователям Stata следует открыть файл tutorial_genderit.do а пользователям Python – файл introduction to gender-it.ipynb file.

Видеоурок

Видеоурок разделен на четыре раздела, которые призваны помочь пользователям научиться использованию библиотек Всемирного словаря гендерных имен версии 2.0; перейти к нужному разделу вы можете с помощью функции перемотки.

  • Введение - 00:00 мин.
  • STATA - 06:48 мин.
  • Python - 24:36 мин.
  • Советы и рекомендации 32:40 мин.
Технический семинар по использованию Всемирного словаря гендерных имен ВОИС

Материалы по теме

Расширение Всемирного гендерного словаря имен: WGND 2.0

Руководство по проведению гендерного анализа на основе данных об инновациях и ИС

 

Disclaimer: The short posts and articles included in the Innovation Economics Themes Series typically report on research in progress and are circulated in a timely manner for discussion and comment. The views expressed in them are those of the authors and do not necessarily reflect those of WIPO or its Member States. ​​​​​​​

Related stories

Rethinking Innovation: How Economic Complexity Theory Reveals New Pathways to Growth

Harvard economist Ricardo Hausmann explains why traditional economic models miss the mark on innovation policy – and offers a framework that could transform how countries build competitive advantages in the global knowledge economy.

Unlocking Women’s STEM Potential for Inclusive Innovation

Dr. Delgado began by outlining that only 9% of all patents globally can be attributed to women. Though this share is increasing, the pace is very slow.

Digital Access to Knowledge Helps Reduce the Gender Gap in Scientific Research

A new study by the World Intellectual Property Organization (WIPO) finds that access to scientific literature through the Research4Life initiative is helping to reduce the gender gap in research, especially in low- and middle-income countries. Together with other sister UN agencies, WIPO runs the Research4Life initiative. Institutions that gained access to the program’s resources saw up to a 30% increase in publications with at least one female author and up to a 9% rise in the overall share of credited women authors.

Преобразование знаний в технологии: отслеживание прогресса экосистем инноваций

Эффективные экосистемы инноваций позволяют создавать технологии, стимулирующие экономический рост, благодаря связи между научными исследованиями и промышленным производством. Но как измерить эффективность взаимодействия этих двух сфер?