Modes de publication (partie 1)
Billet précédent dans cette série.
Pourquoi les modes de publication sont-elles pertinents pour comprendre les inégalités femmes-hommes dans les sciences ?
Une carrière universitaire réussie est fortement liée à un dossier de publications bien fourni. Les publications scientifiques ne sont pas seulement le principal moyen de communication scientifique, elles sont aussi considérées comme un indicateur de compétence scientifique d’un chercheur ou d’une chercheuse et jouent un rôle clé dans la réalisation et le maintien d’une carrière universitaire réussie.
Les décisions relatives à la titularisation et aux autres promotions universitaires sont principalement fondées sur des évaluations du dossier de recherche de la candidate ou du candidat, qui accordent une attention particulière aux publications de recherche telles que les articles de journaux, les contrats de recherche, les présentations à des conférences, ainsi qu’à la visibilité ou à la renommée de la chercheuse ou du chercheur. Ainsi, la compréhension des pratiques de publication dans diverses disciplines, obtenue grâce à des données mesurables sur les résultats de la recherche, est d’un grand intérêt pour les institutions universitaires, les décisions de politique scientifique et les chercheur·ses.
En outre, l’examen de sources de données exhaustives donne une image complète de la situation et offre la possibilité d’entreprendre des études longitudinales.
Quelles disciplines avez-vous étudiées dans les analyses des publications et quelles sources de données avez-vous utilisées ?
Le choix des disciplines est limité par la disponibilité de sources de données appropriées, qui doivent être accessibles (de préférence via des données ouvertes ou au moins gérées par une institution scientifique), représenter une discipline de manière exhaustive et fournir des données de qualité suffisante. Grâce à une coopération bien établie, nous avons eu accès aux bases de données représentatives de haute qualité, zbMATH pour les publications en mathématiques et ADS (Astronomy Data System) pour la littérature en astronomie et en astrophysique. En outre, nous avons utilisé les données des archives électroniques en libre accès arXiv pour étudier les modalités de publication en physique théorique.
Afin de mieux explorer la participation des femmes parmi les auteurs dans des revues connues, nous avons enrichi les données arXiv avec la base de données CrossRef. En outre, nous avons récupéré les données de CrossRef pour certaines revues de chimie renommées, car nous n’avions pas accès à une source de données complète pour la chimie.
Quelles méthodes avez-vous utilisées pour identifier les femmes ?
Les métadonnées bibliographiques n’incluent pas le sexe des auteurs. Il a donc fallu déduire cette information. Habituellement, le prénom d’une personne est la seule information qui peut fournir une indication sur son sexe.
Pour les présentes données, nous avons combiné les réponses de différents services d’attribution de sexe que nous avions évalués dans le cadre du projet. Suite à la procédure d’attribution du sexe, tous les noms d’auteurs sont étiquetés comme « féminin », « masculin » ou « inconnu ».
De nombreux problèmes se posent en rapport avec la reconnaissance automatique du sexe (AGR pour Automatic Gender Recognition). Les prénoms ne sont pas toujours « uniquement » associés à un sexe, ce qui entraîne un parti pris en faveur de certains pays. Par exemple, les auteurs d’origine chinoise se voient plus souvent attribuer des étiquettes inconnues en raison de la perte du « marquage du sexe » lors de la transcription alphabétique.
En outre, toutes les approches AGR, fondées sur les prénoms ou d’autres caractéristiques physiologiques, telles que les visages ou la voix, ne permettent qu’une définition binaire du sexe, ce qui exclut fondamentalement les individus qui ne se conforment pas à ce concept sociétal. Malgré ces problèmes, nous avons procédé à une reconnaissance du sexe fondée sur le prénom, car les différences entre les femmes et les hommes peuvent être observées dans divers aspects de la vie universitaire et doivent être expliquées.
Combien de références avez-vous analysées dans le cadre de la tâche « Modalités de publication » ?
Nous avons analysé des millions de références. Pour prendre un exemple, l’ensemble de données zbMATH que nous avons utilisées pour étudier les modèles de publication en mathématiques comprend 3 083 185 documents correspondant à 5 273 035 auteurs ou autrices.
Marie-Françoise Roy et Colette Guillopé