Жінки перевершили чоловіків у редагуванні коду

     Вчені з Університету Північної Кароліни виявили, що жінки, зареєстровані на GitHub, краще справляються з редагуванням коду, ніж чоловіки. При цьому жінки, які не приховували свою стать, показували гірші результати. Препринт статті опубліковано на сайті peerj.com.


     Автори дослідження скористалися даними, отриманими через GHTorrent в квітні 2015 року та містять інформацію про користувачів,в проектах і запитах на внесення змін в код. Дослідники також вивчили веб-сторінки ресурсу на предмет статусу запитів, опису та коментарів.


     Для визначення статі розробників вчені застосували кілька підходів. По-перше, вони через пошукові системи за email-адресами знаходили профілі користувачів в соціальних мережах, звідки за допомогою спеціальних програм витягували дані про гендерної приналежності. По-друге, автори використовували програму, що визначає стать людини по його імені, зазначеному у відповідному полі в профілі. Дослідникам вдалося встановити стать 35 відсотків користувачів платформи, що відповідає приблизно півтора мільйонам чоловіків.


     Як показник успішності дослідники використовували частку отриманих запитів на внесення змін - тобто схвалених правок в код - від загального числа запитів у кожної статі, і виявили, що у жінок ця частка становить 78,6 відсотків, тоді як у чоловіків дещо менше - 74 , 6 відсотків. Оцінивши, яка частка успішних запитів у кожної жінки окремо, автори виявили, що користувачі жіночої статі поділяються на дві основні групи: ті, у кого менше 10 відсотків прийнятих змін, і ті, у кого більше 90 відсотків.


     Вчені розглянули кілька можливих теорій, що пояснюють такий розподіл. Спочатку вони припустили, що перші невдачі, яких у недавно зареєстрованих жінок могло бути більше, ніж у чоловіків, негативно позначаються на подальшій активності користувача на GitHub. Ті ж, хто залишався, схильні покращувати результати своєї праці, вкладаючи в це більше сил, ніж чоловіки. У цьому випадку частка отриманих запитів у недавніх учасників повинна була бути нижче для жінок, ніж для чоловіків-новачків. Вчені перевірили частку схвалених змін для різних періодів часу, і виявили, що жінки, показують результати кращі, ніж чоловіки, незалежно від дати реєстрації.


     Дослідники також припустили, що жінки беруть участь в більш важливих проектах, для яких частка схвалених змін могла бути вище або жінки-розробники могли робити легкі і численні правки. Для першого випадку вчені перевірили число запитів, в описі яких були дані посилання на проект - це могло служити ознакою, що робота мала важливе значення. Однак частка таких у жінок виявилася нижче. У другому випадку дослідники оцінювали число додаються рядків в коді, яке у жінок виявлялося більше, ніж у чоловіків.


     Ще одне можливе пояснення результатів полягала в тому, що мало значення, в який саме код вносилися правки. Наприклад, зміни в HTML мають велику ймовірність бути прийнятими, ніж правки в С-код. Згрупувавши запити по мовам, дослідники виявили, що жінки в тій чи іншій мірі перевершують чоловіків з усіх мов програмування.


     Нарешті, вчені припустили, що на розподіл жінок-програмістів за кількістю прийнятих правок може впливати явно видима на ім'я гендерна приналежність. Дослідники порівняли частку отриманих запитів між тими користувачами, які вибрали нейтральне ім'я, і ​​тими, чию стать можна було визначити по імені. Результати показали, що провокує жінок, стать яких можна визначити по імені, відхилялися частіше, ніж зміни, які вносили чоловіки.


     Автори дослідження підкреслюють, що останній результат може бути свідченням того, що «жінки-програмісти є жертвами дискримінації, незважаючи на те, що вони є більш успішними розробниками, ніж чоловіки». При цьому вчені не відкинули інших можливих пояснень, наприклад, що жінки, зареєстровані в GitHub, мають велику ймовірність бути професіоналами в IT-сфері, ніж любителями.


     GitHub - веб-сервіс для хостингу проектів в області інформаційних технологій і їх спільної розробки зареєстрованими користувачами. Автори проекту розміщують відкритий код в спеціальних сховищах - репозиторіях. Користувачі можуть редагувати код, посилаючи запити на внесення змін, які можуть бути прийняті або відкинуті. Крім роботи над кодом, учасники можуть спілкуватися і коментувати правки один одного. На даний момент в GitHub зареєстровано 12 мільйонів користувачів.