Использование Всемирного словаря гендерных имен

30 мая 2023 г.

30 мая 2023 г. ・ 5 minutes reading time

#
Изображение: Getty Images/damircudic

Всемирный словарь гендерных имен (WGND) теперь предлагается в версии 2.0 с большим числом доступных данных по странам и территориям, а также именам физических лиц. Файлы документации и библиотеки WGND доступны в режиме онлайн, чтобы пользователи могли начать применять словари гендерных имен к любому набору данных с именами, которые сопровождаются географическими кодами.

Всемирный словарь гендерных имен был расширен благодаря недавнему исследованию и теперь включает более 26 миллионов записей, в которых указываются имена физических лиц, относящиеся к 195 различным странам и территориям. WGND 2.0 является дополненной версией WGND 1.0 и результатом компиляции более чем 50 различных новых различных источников гендерных данных и обновления первоначального списка источников.

Где можно найти Всемирный словарь гендерных имен версии 2.0?

WGND  2.0 доступен онлайн на странице открытого проекта по гендерной тематике IES Gender Open Source Project. На странице представлен специальный репозиторий Github с документацией, описывающей различные наборы уникальных наблюдений за гендерными данными, привязанными к кодам стран и языков. Сопроводительная документация для версий словаря 1.0 и 2.0 доступна на сайте Harvard Dataverse.

Как пользоваться Всемирным словарем гендерных имен версии 2.0?

Первый шаг: подготовьте набор данных с именами физических лиц и кодами стран. Как только набор данных готов, следующим шагом будет выполнение следующих четырех проверочных процедур для очистки данных:

  • Удалите фамилии или патронимические имена в записях имен, чтобы в переменной «имя» остались только первые или основные имена.
  • Переведите оставшиеся записи имен в нижний регистр и удалите пробелы до и после текста имен.
  • Удалите двойные пробелы между словами, составляющими каждую окончательную запись имени.
  • Убедитесь, что коды стран и территорий, содержащиеся в наборе данных, соответствуют двухбуквенным кодам (alpha-2), указанным в стандарте ISO 3166-1. Полный список доступных двузначных кодов стандарта доступен в режиме онлайн на платформе ISO Online Browsing Platformили по ссылке: io.

После этого следует воспользоваться инструментом Gender-it на ресурсе GitHub для применения библиотек Всемирного словаря гендерных имен к полученному очищенному набору данных. Gender-it содержит библиотеки WGND версии 2.0, ими можно воспользоваться с помощью Stata или Python (ознакомьтесь с видеоуроком ниже). Библиотеки в этих вариантах программного обеспечения содержат подробные инструкции и примеры загрузки необходимых файлов документации, функций и пакетов для сопоставления очищенной базы данных пользователя с разновидностями словарей гендерных имен, доступных в WGND версии 2.0. Для начала работы пользователям Stata следует открыть файл tutorial_genderit.do а пользователям Python – файл introduction to gender-it.ipynb file.

Видеоурок

Видеоурок разделен на четыре раздела, которые призваны помочь пользователям научиться использованию библиотек Всемирного словаря гендерных имен версии 2.0; перейти к нужному разделу вы можете с помощью функции перемотки.

  • Введение - 00:00 мин.
  • STATA - 06:48 мин.
  • Python - 24:36 мин.
  • Советы и рекомендации 32:40 мин.
Технический семинар по использованию Всемирного словаря гендерных имен ВОИС

Материалы по теме

Расширение Всемирного гендерного словаря имен: WGND 2.0

Руководство по проведению гендерного анализа на основе данных об инновациях и ИС

 

Disclaimer: The short posts and articles included in the Innovation Economics Themes Series typically report on research in progress and are circulated in a timely manner for discussion and comment. The views expressed in them are those of the authors and do not necessarily reflect those of WIPO or its Member States. ​​​​​​​

Related stories

Finding Marie Curies: Steps Towards a More Inclusive Innovation and IP ecosystem

Insights from Prof. Myriam Mariani’s keynote lecture

Build Your Own Innovation Capabilities Studies

Researchers worldwide can now conduct their own in-depth innovation studies using the data behind the Innovation Capabilities Outlook enabling custom economy and industry analysis that was previously difficult to access.

Understanding Women’s Participation in Innovation and IP

Over the past decade, women's participation in inventing activities has been increasing, though at a gradual pace.

Most Economies Are Missing Hundreds of Thousands of Innovation Opportunities

While global innovation capacity reaches unprecedented levels, most economies struggle to harness their potential, missing massive opportunities for local innovations.