Utilizar el Diccionario mundial de nombres de hombres y mujeres
30 de mayo de 2023
30 de mayo de 2023 ・ 5 minutes reading time

Ya existe la versión 2.0 del Diccionario mundial de nombres de hombres y mujeres (WGND, por sus siglas en inglés), con mayor disponibilidad de registros de países y territorios y de nombres de personas físicas. Sus archivos y bibliotecas de documentación están disponibles en línea para que los usuarios comiencen a aplicar los diccionarios de nombres de hombres y mujeres a cualquier conjunto de datos con nombres vinculados a códigos geográficos.
Las investigaciones recientes han permitido hacer nuevas aportaciones para expandir el WGND, que incluye ahora más de 26 millones de registros que vinculan los nombres de personas físicas y 195 países y territorios. El WGND 2.0 representa la actualización de su antecesor, el WGND 1.0, y surge de la compilación de más de 50 nuevas fuentes de datos relativos al género, actualizando la lista original de fuentes.
¿Dónde encontrar el WGND 2.0?
El WGND 2.0 está disponible en línea, en el proyecto IES Gender Open Source Project. Cuenta con un repositorio Github específico, con documentación que describe los varios conjuntos de observaciones características sobre los datos relativos al género vinculados a códigos de país e idioma. La documentación de respaldo de las versiones WGND 1.0 y 2.0 también puede consultarse en Harvard Dataverse.
¿Cómo utilizar el WGND 2.0?
El primer paso es preparar un conjunto de datos con nombres de personas físicas y códigos de países. Una vez preparado el conjunto de datos, el segundo paso será realizar cuatro controles de depuración de datos, según se indica a continuación:
- Eliminar los apellidos, en los registros, de manera que solo quede el nombre de pila en la variable correspondiente al nombre.
- Poner en minúsculas los registros restantes de nombres y eliminar los espacios en blanco antes y después del texto del nombre.
- Eliminar los espacios dobles entre las palabras que constituyen cada uno de los registros de nombres finales.
- Verificar que los códigos de países y territorios que figuran en los conjuntos de datos estén constituidos por los códigos alfa de dos dígitos, definidos en la norma ISO 3166-1. En la Plataforma de navegación en línea de la ISO,o en io, figura una lista completa de los códigos de dos dígitos de la ISO que pueden utilizarse.
A partir de ahí, los usuarios pueden acceder a la herramienta Gender-it en GitHub, para aplicar las bibliotecas del WGND 2.0 al conjunto de datos depurados. Gender-it contiene la bibliotecas del WGND 2.0 que pueden ser recuperadas mediante el uso de Stata o Python (vea el tutorial en video, más abajo). Las bibliotecas en esas opciones de software contienen instrucciones y ejemplos detallados para descargar los archivos de documentación, las funciones y los paquetes necesarios para cotejar la base de datos depurada del usuario con las variedades de diccionarios de nombres de hombres y mujeres disponibles en el WGND 2.0. Para comenzar, los usuarios de Stata pueden ejecutar el archivo tutorial_genderit.do mientras que los usuarios de Python pueden ejecutar el archivo de introducción a gender-it.ipynb.
Tutorial en video
El tutorial en video se divide en cuatro secciones y orienta a los usuarios para trabajar con las bibliotecas del WGND 2.0; avance el video hasta los minutos indicados, para ver la sección de su interés.
- Introducción - 00:00 min.
- STATA - 06:48 min.
- Python - 24:36 min.
- Consejos y trucos - 32:40 min.
Recursos relacionados
Expandir el Diccionario mundial de nombres de hombres y mujeres: WGND 2.0
Guía para elaborar análisis de género a partir de datos sobre innovación y PI






