Wikipedie:Žádost o komentář/Články o ženách na české Wikipedii

Pokračování diskuse z Wikipedie:Diskuse o smazání/Wikipedie:WikiProjekt Ženy o osudu tohoto na korektním místě. Podle @Jan Spousta: „wikiprojekt“ je ve skutečnosti pracovní aktivitou zaměstnanců WM ČR, porušuje pravidlo Wikipedie:Co Wikipedie není a jím připravovaná soutěž nebyla přes daný slib upravena tak, aby byla transparentní a neideologická. OJJ, Diskuse 10. 2. 2025, 07:17 (CET) [odpovědět]

Vzhledem k diskusi se pokusím doplnit předmět této ŽoK. Založil jsem ji primárně pro diskusi na místě k tomu určeném, která probíhala v poněkud nešťastně zvoleném DoSu. První otázka, kterou má komunita řešit, je podoba stránky Wikipedie:WikiProjekt Ženy, kde uživatel Bazi uvádí formulace, které frakce komunity považuje za nešťastné. Druhým problémem je potenciální problém s netransparentností soutěže, což je ale věc WMČR. Případná upřesnění nechť poskytne navrhovatel i oponenti, dole jsem je proto pingoval. OJJ, Diskuse 11. 2. 2025, 07:57 (CET) [odpovědět]

Zdá se mi, že předmět této ŽOK se spontánně stočil k otázce tzv. gender gapu na Wikipedii, tzn. jak vypadá poměr mužských a ženských biografií a kdo může za to, že ženských je méně. Doporučil bych to tak ponechat, ať se to nerozmělňuje dalšími tématy zdrojové DoS. Pro ta pak případně založit jiné ŽOK, pokud někdo bude mít zájem.--Jan Spousta (diskuse) 11. 2. 2025, 11:48 (CET)[odpovědět]

Takže téma ŽOKu se posunulo k analýze důvodů počtu článků o ženách na české Wikipedii. OJJ, Diskuse 14. 2. 2025, 09:18 (CET)[odpovědět]

Komentáře

editovat

@Jan Spousta, Bazi, TFerenczy, KPX8:@Robins7, Lovec pávů, Matěj Suchánek, Krabiczka:@Chalupa, Chrz, Zagothal, Draceane:@KKDAII, Martin Urbanec: Z diskuse (snad všichni [důležití] a z obou stran spektra). OJJ, Diskuse 10. 2. 2025, 07:17 (CET)[odpovědět]

Za mě platí, co jsem řekl tam:

  1. Pokud jde o soutěž, tak její pravidla a výsledky mají být jednoznačně transparentní (počet článků, počet bajtů etc.), neměla by existovat cena poroty, která může vyvolávat pochybnosti, že byl vybrán článek podle chuti organizátorů nebo sponzorů.
  2. refaktorizováno Tvrzení, jako původní Do února 2024 bylo na české Wikipedii popsáno přes 120 tisíc mužů a jen 26 tisíc žen. Z biografických článků tak jen zhruba 18 % pojednává o ženách. Česká Wikipedie, stejně jako Wikipedie v dalších jazycích, podléhá genderové nevyváženosti, což je forma systémové podjatosti zapříčiněné skutečností, že většina lidí editujících Wikipedii jsou muži. nebo novější Na české Wikipedii zároveň pravidelně přispívá mnohem méně žen než mužů, což vytváří genderovou nevyváženost, jednu z forem systémovových nerovností, která může souviset i s genderovou digitální propastí. V prostředí Wikipedie je navíc posílena převahou mužských editorů, kteří, vědomky či nevědomky, pracují spíše na článcích o mužích nebo o tématech, která muže zajímají, případně na ně pohlížejí ze svého úhlu pohledu. To je logické a pochopitelné, ženská témata však proto mohou zůstávat často nedotčená či málo zpracovaná. je už kvůli tomu úpornému protlačování refaktorizováno nevhodné k mužským editorům. Na rozdíl od WP:SePW (kde je, jak nyní vidím, v krotší podobě opět zmíněno, že česká Wikipedie není vyvážená, poněvadž by to chtělo víc lidí z toho či onoho věkového či genderového spektra; bez korelačních studií, že spolu vyváženost Wikipedie a gender/věk souvisejí a studií, že je Wikipedie skutečně nevyvážená) navíc není možnost se z mužské škatulky dostat. Zejména mi však vadí, že zatímco mužská/ženská/seniorská témata lze ještě pokládat za vágní floskuli, poměr encyklopedicky významných žen oproti mužům může být pouhým historickým artefaktem, což tak nemá být mužským editorům vytýkáno (poněvadž to nemohou ovlivnit). Bohužel Bazi stále vrací, že muži mohou za počet článků v Kategorie:Ženy, ačkoli to nemá podloženo. Osobně bych byl pro to, aby z ŽoKu vyplynulo, že podobný styl propagace není košér.
  3. Padl názor i celý WikiProjekt Ženy smazat, což nevnímám jako konstruktivní. Jde mi jen o dva body výše uvedené. OJJ, Diskuse 10. 2. 2025, 07:17 (CET)[odpovědět]
    • @OJJ Tak současné Z biografických článků tak jen zhruba 18 % pojednává o ženách. Na české Wikipedii zároveň pravidelně přispívá mnohem méně žen než mužů, což přináší genderovou nevyváženost. Projekt Ženy má ambici obě tyto nevyváženosti pozitivním způsobem dorovnávat. je, myslím, kompromisní. Už se nijak nesnaží nikoho z nevyváženosti vinit. (Což byl problém původní formulace.) A ta zjevně existuje. Zagothal (diskuse) 11. 2. 2025, 13:24 (CET)[odpovědět]
@Zagothal: To jsem taky napsal osobně, protože ty fenomény uznávám a myslím, že projekt je obecně dobrý nápad (tolik k tomu, jaký jsem sexista a aktivista za staré pořádky a chci to zatajit před světem :-)). --OJJ, Diskuse 11. 2. 2025, 13:27 (CET)[odpovědět]
@Zagothal Re dorovnávat 18 %. Taková formulace bez kontextu vyvolává předpoklad, že to chceme zarovnat na 50 %. Ale nic takového se obecně ani podařit nemůže, takže uvést že to chceme pro současné ženy srovnat nebo za celou historii dotáhnout na realistických 25 %. --Chrz (diskuse) 11. 2. 2025, 13:35 (CET)[odpovědět]
Je tam nedokonavý vid, tedy pokračování bez jistého cíle. Naopak jasný cíl by vypadal nedobře. Zagothal (diskuse) 11. 2. 2025, 14:03 (CET)[odpovědět]
Takže nevíme co je dobře, nakonec je možná správně současný stav, ale budeme to hrát na nespravedlnost. --Chrz (diskuse) 11. 2. 2025, 14:20 (CET)[odpovědět]
Ano, jistě, velmi se teď oslavovalo, kdy poměr ženských článku na EN Wikipedii přesáhl 20%. Vést dikci k motivování k účasti je nicméně věřím přijatelné. Jde o popis výzva a soutěže nikoli o encyklopedický článek. --Klára Joklová (WMCZ) (diskuse) 12. 2. 2025, 12:18 (CET)[odpovědět]
Celkové statistiky celkem přehledně zde: https://humaniki.wmcloud.org/ --Klára Joklová (WMCZ) (diskuse) 12. 2. 2025, 12:21 (CET)[odpovědět]
Nicméně pro WMČR je stěžejní pouze bod 1. a tím je, zda naše aktivity propojovat či nepropojovat s WikiProjekty. To, že to tak děláme, nyní už ve všech výzvách, je odpovědí na výzvy komunity a praxi v přispívání ke konkrétnímu tématu. Např. WikiProjekt Československo byl s tímto cílem založen. Vždy jsme následovali přání komunity a smysl věci.
Není možné překrývat pravidla a principy Wikipedie s činností WMČR. Wikipedie má svá pravidla, WMČR taktéž - pro nás jsou stěžejní stanovy, strategický plán a pravidla realizovaných projektů. Podporovat pestrost komunity je jedním z cílů a budeme to dělat každopádně. Dosud bylo cílem protnout se s existující strukturou Wikipedie, protože je to oboustranně výhodné. Propagací Měsíce žen na Wikipedii (výzvy WMČR) se propagoval WikiProjekt Ženy. A přestože ten je otevřen stále, vrcholil spolkovou výroční výzvou. Na které pak logiky pracují zaměstnanci. Tohle bylo vždy při výzvě naprosto jasně řečeno: jde o výzvu spolku WMČR.
Stejně tak soutěž v rámci výzvy nikdy neměla za cíl hodnotit kvalitu článků na Wikipedii. Opět: Wikipedie má svá pravidla hodnocení kvality, výzva šla v soutěži vždy svým směrem.
Souhlasím s tím, že tohle mělo být pravděpodobně jasněji vysvětleno, ale nikdy předtím k mýlce v tomto smyslu nedošlo, vždy byly informace, že jde o aktivitu spolkovou jasné. --Klára Joklová (WMCZ) (diskuse) 12. 2. 2025, 12:34 (CET)[odpovědět]

Stručná data k tomuto z https://petscan.wmcloud.org/, hloubka 10 pro @Bazi, Chrz:, račte si přepočítat, dělal jsem to rychle:

Pokročilejší statistická analýza pro jednotlivé roky, včetně p-hodnoty atd., by byla jistě zajímavá, ale nemám technické schopnosti na extrakci dat z Wikipedie. Každopádně se zdá, že čím blíže přítomnosti, tím se gap v minulém století snižuje, při vynechání „mužských“ sportů se v současném století zcela vyrovnává. Tudíž bych byl s obviňováním mužských editorů velmi opatrný, jak píše @Jan Spousta:. Že vypadala ženská práva v minulosti jinak, a proto je žen v encyklopedii méně, vnímám spíš jako historický artefakt. Nezapomeňte, že v Evropě ženy nemohly na začátku minulého století ani volit! Není to správně, ale jako muž žijící více než sto let poté si za to sypat popel na hlavu nebudu. refaktorizováno OJJ, Diskuse 10. 2. 2025, 09:46 (CET)[odpovědět]

Obávám se, že jsme svědky určitého podlehnutí svodům správcovské moci. Cokoliv z toho by se dalo napsat slušně, přátelsky, nekonfliktně. Významnou součástí správcovských schopností by mělo být umění deeskalovat a hledat konsensus. Chápu, že je to těžké, když má člověk pocit, že ho něco zraňuje na osobní úrovni nebo narušuje jeho pocit sebehodnoty, ale tvrzení jako refaktorizováno nebo refaktorizováno mi, upřímně řečeno, připadají jako parodie na politické úderníky. Tím spíše ze strany lidí, kteří by sklouzávání do takových hlubin měli v prvé řadě svým příkladem a komunikací zabraňovat. Stejně dobře by se dalo vymyslet tažení proti Asijskému měsíci, protože sama jeho existence obviňuje neasijské wikipedisty z toho, že se nedostatečně zajímají o Asii. Třeba k tomu v této atmosféře časem dojde. V předchozí diskusi jsem naznačil, že mě ženská soutěž motivovala k tomu, napsat něco o ženách, i když jsem obvykle psával spíše o mužích – na mne to tedy zafungovalo a byl z toho čistý zisk, opravdu to nebylo na úkor utlačovaných, haněných a diskriminovaných mužů. Pokud to na někoho nezabralo, nic se přece nestalo, povinnost účasti, pokud vím, nebyla. Ale jestliže někoho vysvětlení, proč může být fajn doplňovat a rozšiřovat ženské články nejen nemotivuje, ale spíše se cítí napaden, diskriminován a rozvzteklí se do běla, pak by se měl možná zamyslet, zda by nebylo lepší nebrat věci tak vážně a dát si odstup.
Celá situace mě bohužel nutí k tomu, aby se vzdal další činnosti a zrušil naplánované projekty se studenty – opravdu mě to mrzí, ale z morálního hlediska bohužel do takového prostředí plného toxicity, manipulace, osočování a snah o ideologickou očistu nemohu nikoho posílat. Už v minulosti jsem měl několikrát potíže s tím, jakým způsobem se (zejména k dívkám) zdejší komunita zachovala, ale snažil jsem se to přecházet jako dílčí přešlapy a něco, co jde proti ideálům projektu; zklamaným jedincům jsem se to snažil vysvětlit a rozmluvit. Nyní je to příliš i na mě. --Lovec pávů (diskuse) 10. 2. 2025, 13:32 (CET)[odpovědět]
@Lovec pávů: Kolego, velmi by mne mrzelo, kdyby někdo tak zkušený jako Vy ukončil činnost. Samozřejmě můžete považovat za své morální vítězství opustit projekt, nicméně dovoluji si podotknout, že jste se do celého sporu zapojoval jenom okrajově a mám o Vás jen dobré mínění. Možná marně tedy opět upřesňuji, že se bavíme čistě o skutečnosti, že stránka tvrdila, že mužští editoři mohou za to, že je na Wikipedii procentuálně nízký poměr článků o ženách (tj. v Kategorie:Ženy) oproti článkům o mužích. Což jeden kolega stále zatvrzele v různých podobách vracel, ačkoli může jít o historický artefakt. A pokud to není doložené (a analýzy jako ty níže ukazují, že kolega pravdu mít nemusí), jde o ideologické tvrzení.
Že považuji za nevhodný celý projekt, psaní článků o ženách či dokonce, že nemám úctu k ženám je velká mýlka, mně vadila čistě ta jedna věta. :-) A tady jsme na interní diskusi, nikoli na diskusi s nováčky, tak si zde můžeme dovolit i trochu peprnější slovník. Se správcovskými právy to pak už nemá nic společného, ta užita nebyla a ani nebudou. Jakým způsobem se (zejména k dívkám) zdejší komunita zachovala, nevím; můžete mi to napsat a můžeme s tím něco udělat.
Ale ano, obecně by to chtělo uklidnění z obou stran. Já z těchto diskusí žádnou velkou radost nemám, takže když to oba zkusíme znovu a jinak, myslím, že by to mohlo fungovat. Já ruku na uzavření "smíru" tímto podávám (byť se mi nezdá, že by mělo jít o obří konflikt, sám jsem zažil i větší a s tímto nesouvisející). --OJJ, Diskuse 10. 2. 2025, 14:11 (CET)[odpovědět]
@OJJ: Samozřejmě v tom může být i nějaké nedorozumění nebo přecitlivělost, že Lovec pávů v diskusi vnímá podtóny, které nebyly zamýšleny. Ale reálné selhání vás správců bych viděl v tom, že trpíte Bazimu porušovat WP:Žádné osobní útoky a fantazírovat tam o psychologických motivacích účastníků diskuse a předpokládat jejich zlou vůli. Tím se právě diskuse dostávají na zcestí a místo řešení věcných problémů se v nich lidé zraňují a naštvávají.--Jan Spousta (diskuse) 10. 2. 2025, 14:23 (CET)[odpovědět]
@Jan Spousta, Lovec pávů: Kdybych měl tak velké mužské ego a ta věta mne tak zraňovala na osobní úrovni nebo narušila můj pocit sebehodnoty, tak bych sám nenapsal prakticky totéž, akorát korektně. Zraňuje mě, když někdo potenciálně dezinterpretuje data, která následně využívá k veřejné propagaci čehokoli v ideologickém hávu (refaktorizováno). Blokovat oponenta ve sporu je věc ošemetná, takže to (by) měl udělat někdo jiný... Mně to v jiných případech problém nedělá. --OJJ, Diskuse 10. 2. 2025, 14:29 (CET)[odpovědět]
@OJJ: To sem nemyslel jenom na tebe. Bylo vás tam správců víc. A taky nepožaduju blokování. Lidi uchylující se k argumentaci ad hominem je potřeba především informovat o platných etických zásadách wikimediánského hnutí a nevhodné výroky refaktorizovat. Blokování je až poslední prostředek, pokud si dotyčný nenechá říct po dobrém.--Jan Spousta (diskuse) 10. 2. 2025, 15:48 (CET)[odpovědět]
@OJJDěkuji za perfektní analýzu! @Jan SpoustaDěkujeme za skvělý a opuzlíkovaný článek týdne, který byl jen tak mimochodem napsán v minulém ročníku soutěže Wikigap:Ženy na Wikipedii. @Lovec pávů kolego/kolegyně budeme rádi pokud budete na Wiki pokračovat. Ano, společnost se stává citlivější, saze ale bouchají nejen v kamnech, ale i téměř v každém větším kolektivu (více než 8 lidí, u žen v podstatně menších skupinách) i v offline světě. Zkusme se všichni z téhle situace poučit a myslet v širším kontextu. Děkuji těm z vás, co máte konstruktivní a koncenzuální přínos, zejména databased. --KKDAII (diskuse) 11. 2. 2025, 23:27 (CET)[odpovědět]

@Bazi, Chrz, Matěj Suchánek, Jan Spousta: Vygeneroval jsem tento soubor dat:

rok 1900 (muži 485 results, ženy 74 results) rok 1910 (muži 586 results, ženy 98 results) rok 1920 (muži 722 results, ženy 145 results) rok 1930 (muži 805 results, ženy 165 results) rok 1940 (muži 852 results, ženy 153 results) rok 1950 (muži 957 results, ženy 211 results) rok 1960 (muži 994 results, ženy 212 results) rok 1970 (muži 863 results, ženy 273 results) rok 1980 (muži 892 results, ženy 351 results) rok 1990 (muži 919 results, ženy 364 results) rok 2000 (muži 312 results, ženy 90 results)

Předem upozorňuji, že se statistikou pracuji málo, takže by to měl ověřit spíš kolega Spousta nebo někdo další. Každopádně testujeme hypotézu, že poměr ženy/muži v průběhu 20. století signifikantně roste. Obě proměnné jsou spojité, takže jsem zvolil lineární regresi a hodil to do R. No a p-hodnota se rovnala 0.001163 (<0.05), takže výsledky jsou statisticky významné, pokud jsou dobře ta data a ten výstup :-) (koeficient determinace je ~ 0.71, grafickém zobrazení na https://ctrlv.cz/QWlZ). Samozřejmě se to dá zpřesnit tím, že bychom to vzali po jednotlivých letech, ale to už dělat nebudu. OJJ, Diskuse 10. 2. 2025, 10:53 (CET)[odpovědět]

Pro zajímavost jsem udělal ještě rychlou analýzu z jiného pohledu. Pokud by probíhala nějaká genderová diskriminace v tom smyslu, že jedno pohlaví neprávem opomíjíme, ale přitom bychom o obou pohlavích zakládali články zhruba v pořadí významu osobností od nejdůležitějších k méně důležitým, tak by to znamenalo, že u diskriminovaného pohlaví jsme se ještě nedostali k tak důležitým jedincům jako u pohlaví preferovaného. (Představte si to tak, že kdybychom např. silně diskriminovali muže, tak bychom v kategorii žen v nějakém okamžiku měli už založenou Irmu Geisslovou, ale u mužů bychom se ještě nedostali ani ke Karlu Hynku Máchovi.) Důležitost můžeme přibližně měřit sledovaností, takže diskriminace by znamenala, že čtenost nově zakládaných článků osobností diskriminovaného pohlaví je zřetelně větší než čtenost nových článků preferovaného pohlaví (protože u něj jsme už ty významné články dávno založili). Vyjel jsem si proto PetScanem články o ženách a mužích založené v listopadu 2024 a pomocí Pageviews měřil jejich sledovanost v posledních 4 týdnech: muži a ženy. Průměrná čtenost mužského článku vyšla 3,32 / den, ženského 1,92 /den, což by nasvědčovalo diskriminaci mužů. Ale u tak vychýlených dat je průměr velmi nespolehlivým měřítkem střední hodnoty, takže je lépe použít medián, a ten v obou případech vychází stejně - 12 zobrazení za dobu měření. Závěr tedy je, že existuje mírné podezření na diskriminaci mužů ve smyslu, že wikipedisté raději píší články o ženách (a aby ne, když většinu wikipedistů tvoří chlapi </žert>), ale rozhodně tu žádné dramatické rozdíly ve smyslu pokrytí obou pohlaví nemáme. Z toho plyne, že dramatický rozdíl v počtu článků o mužích a ženách je způsobený prostě tím, že kvalitními prameny podložených (a tedy encyklopedicky významných) žen je méně, a to je způsobeno faktory, které jsou dobře známé a které na Wikipedii nemůžeme ovlivnit, a tedy nemá smysl kolem nich tady dělat drama.--Jan Spousta (diskuse) 10. 2. 2025, 11:06 (CET)[odpovědět]
Ještě jsem stejnou metodologií zkusil otestovat další hypotézu, a sice zda na Wikipedii nemáme podreprezentovaná témata, která ženy tradičně zajímají. Je samozřejmě obtížné dokázat, že se zrovna o takové téma jedná, ale snad se z tradičních genderových rolí naší kultury dá odečíst, že ženy mívají větší zájem o umění a vaření, takže jsem vzal kategorie Umění a Pokrmy s jejich podkategoriemi do určité hloubky a opět počítal mediány. Výsledek byl zajímavý: Umění má medián 18 zobrazení za dobu měření a Pokrmy dokonce 90 zobrazení za dobu měření (ve srovnání s 12 u biografií). Což mi i dává smysl, protože souhlasím, že kapr na modro je čtyřikrát zajímavější než průměrný muž nebo žena, který/která tu na Wikipedii v současnosti dostane svůj článek. Není mi známo, o kolik přesně víc se ženy o tyto kategorie zajímají víc než muži, ani o kolik častěji je tu píší, ale připadá mi možné, že tento jev souvisí s tím, že jsou mezi námi wikipedisty menšinou. Znamená to zároveň, že kdyby se tu nějaký wikiprojekt opravdu staral o zvýšení účasti a zlepšení čtenářské spokojenosti žen, tak by místo biografií asi měl soutěžit nad takovýmito tématy, protože ta jsou podle tohoto měření výrazně méně pokrytá, než životopisy mužů i žen.--Jan Spousta (diskuse) 10. 2. 2025, 13:55 (CET)[odpovědět]
Na úplné závěry si počkám, jestli někdo nezpochybní metodiku a přijde tedy s nějakou jinou. Ale pokud by se potvrdilo, co se zde podařilo vyzkoumat, tak je to fantastické: za menší počet ženských biografií může historie, fotbal a hokej. Zkrátka a dobře není možné lepšího výsledku dosáhnout, encyklopedická významnost v obyvatelstvu je takto rozložena. Jeden cíl wikiprojektu by tímto byl splněn, tak jedině přivádět víc editorek (podobně jako jsou projekty pro seniory), ono to možná i ty diskuze zkulturní, a pak ještě vymyslet jak spočítat, že jsou EV ženská témata podreprezentovaná. Pokud to bude vyvráceno, může se projekt přejmenovat na "Ženy píší Wikipedii". A pokud se zjistí, že nějaká "typicky" ženská témata opravdu jsou nespravedlivě opomíjena, tak se to nasype do seznamu požadovaných článků a on se toho ujme někdo, kdo rád tvoří právě články co udělají nejvíc radosti (na rozdíl od těch, co rádi píšou striktně jen o tom, co je baví). --Chrz (diskuse) 10. 2. 2025, 11:09 (CET)[odpovědět]

Podle mě se nehneme, dokud někdo nedodá "podíl mužských a ženských biografií na Wikipedii podle roku narození dané osoby". Tím se dozvíme, jestli ten značný nepoměr je způsoben historicky (a tím pádem oprávněně), nebo jestli i u současných osob panuje takové rozložení. U současných osob už by to těžko vyplývalo ze zdrojů (sportovkyně, zpěvačky, herečky... tady už by měly být poměry vyrovnané s muži) a dalo by se mluvit o nějakých podpůrných způsobech na dorovnání. Ale nemusí to nezbytně doplňovat ženy a nemusí se nikdo z daného stavu vinit. --Chrz (diskuse) 10. 2. 2025, 08:38 (CET)[odpovědět]

@Matěj Suchánek: Zajistíš, prosím? A ideálně i s hokejisty/fotbalisty a bez, ti to budou dost vychylovat. Díky moc! --OJJ, Diskuse 10. 2. 2025, 08:51 (CET)[odpovědět]
Vidím, že ses výše už o něco pokusil. Mezitím jsem to zkusil přes Wikidata (předpokládá se úplnost a čistota dat).
Tady je základní dotaz: [1]. Na začátku je zakomentované vynucení muž/žena, na konci minus hokej/fotbal.
Je to jen tabulka, další zpracování (graf, podle dekád/století atd.) je nutné dodělat offline/lokálně, už takhle ten dotaz spotřebuje docela dost prostředků.
Zatím teda takto, aby se to mohlo aspoň trochu hnout. --Matěj Suchánek (diskuse) 10. 2. 2025, 10:08 (CET)[odpovědět]

Chalupa

editovat

Celá ta diskuze o tom, že mužští editoři na Wikipedii jsou nějací mužští šovinisté je naprosto nesmyslná. Wikipedie je svobodná encyklopedie, kterou může editovat každý podle svého uvážení. Jestli chce někdo psát články o mužích a jiný zase o ženách je naprosto dobrovolné a nidko to nemůže nijak vynucovat. I ty statistiky jsou naprosto bezpředmětné. I kdyby se zjistilo, že to malé množství článků o ženách není historický artefakt, tak co se s tím bude dělat. Zavedeme podpůrné způsoby na dorovnání? Já si žádný takový prostředek nedovedu představit. Že bychom třeba zavedli kvóty, že se už nebude moci napsat článek o mužích pokud se neobjeví článek o ženách? Nebo bychom to řídili procenty (pokud nebude dosaženo předepsaného procenta článků o ženách, žádný článek o mužích prostě nebude moci vzniknout)?

Ženy a dívky na Wikipedii málo píší, ačkoliv jim v tom nikdo nebrání a mohou psát i o ženách i o mužích. Žádný prapodivný projekt je k tomu ale nepřitáhne, protože je to většinou nebaví. Původního DOSu se nezúčastnila ani jediná z existujících Wikipedistek (pokud se nepletu), takže je jim osud projektu zřejmě naprosto ukradený.

Co se týče samotného projektu, o jeho neprůhlednosti mě přesvědčila otázka, kterou položil kolega @Juandev: 4.11.2024 na výši odměn odměn porotců soutěže Měsíc žen (už jenom ten název zavání ve skutečnosti diskriminací, protože čí jsou pak ty ostaní měsíce), která zůstala bez odpovědi - viz Wikipedie:Pod lípou (Wikimedia ČR)/Archiv 6#Výše odměn porotců soutěže Měsíc žen. To mně připadá naprosto příznačné a projekt bych proto zrušil. Je zbytečný (naprosto k ničemu) a neprůhledný a práce porotců není po kontrolou (bůh ví, prodle čeho rozhodují). --Chalupa (diskuse) 10. 2. 2025, 14:01 (CET)[odpovědět]

Odkaz s kotvou upřesnil Matěj Suchánek (diskuse) 10. 2. 2025, 14:31 (CET)[odpovědět]
Dobrý den,
@Chalupa, dovoluji si zde stručně zareagovat k tématu odměn jakožto radní Wikimedia ČR pověřený mj. oblastí financí. Předně bych rád zdůraznil, že hospodaření spolku Wikimedia ČR je naopak zcela transparentní a průhledné. Veškeré informace týkající se příjmů i výdajů jsou transparentně k dispozici na našich webových stránkách; stačí si jen rozkliknout informace, které Vás zrovna zajímají. Tato transparentnost se týká i zmiňované soutěže. Jak je z odkazu patrné, žádné odměny pro porotce součástí jejího rozpočtu nebyly – porota tedy svou činnost vykonávala dobrovolnicky (bez nároku na odměnu).
Věřím, že k části příspěvku nesouvisející s hospodařením (tj. užitečnosti projektu a jeho výsledcích, příp. práci poroty) se vyjádří @Aktron, radní Wikimedia ČR pro komunitní programy, pod které Měsíc žen na Wikipedii spadá.
Chybějící odpověď neznamená nedostatek transparentnosti nebo dokonce pokus o skrývání něčeho. Bývalo by se stačilo připomenout, a odpověď by samozřejmě byla doplněna.
S pozdravem,
--Martin Urbanec (diskuse), místopředseda a radní pro finance, Wikimedia ČR, 10. 2. 2025, 15:53 (CET)[odpovědět]
:@Martin Urbanec Kolego, odpověď chyběla. Pokud to nebyla netransparentnsost, tak mmě to připadá buď jako "co bychom se obtěžovali" nebo jako nedostatek soudnosti. Já osobně bych na takovouto otázku odpověděl, a to velmi rychle a bez připomínání. --Chalupa (diskuse) 10. 2. 2025, 22:26 (CET)[odpovědět]
Transparentnost skutečně neznamená požadavek na zodpovězení jakékoli otázky kdykoli je položena. Jak se píše na Wikipedii, transparentnost označuje "požadavek na průhledné a veřejně přístupné a kontrolovatelné jednání". Jak ilustrují výše uvedené odkazy, průhledné a veřejně kontrolovatelné hospodaření Wikimedia ČR skutečně je. --Martin Urbanec (diskuse) 10. 2. 2025, 22:57 (CET)[odpovědět]
@Martin Urbanec Kolego, jsou otázky a otázky. Tak, jak jste zde uvedl všechny ty odkazy, tak mělo být odpovězeno již před 3 měsíci, protože otázka je podle mne opravdu důležitá a její nezdodpovězení vyvolává velice špatný dojem. Překvapujete mě snahou obhájit něco, co se obhájit nedá ani z pozice místopředsedy a radního pro finance. --Chalupa (diskuse) 10. 2. 2025, 23:21 (CET)[odpovědět]
@Chalupa: Původního DOSu Wikipedie:Diskuse o smazání/Wikipedie:WikiProjekt Ženy se už předtím zúčastnila dlouholetá editorka KKDAII a nově napsala také Lucie Schubert (WMCZ). --Marek Genius (diskuse) 10. 2. 2025, 20:59 (CET)[odpovědět]
@Marek Genius Bohužel mě to, že KKDAII je žena, uniklo a opravdu nevím, podle čeho jsem to měl poznat. Mohla mi to napsat, abych se neblamoval. Jsem rád, že se aspoň nějaká žena ozvala a že se ozvala i druhá. Moc to není, ale alespoň něco. Ale můj názor, že ženy Wikipedie příliš nezajímá, to nikterak nevyvrací. Co mně se týče, já sám jsem napsal asi 128 článků o ženských osobnostech (pokud jsem to dobře spočítal), nikterak cíleně, ale podle toho, jak spadali do okruhu mých zájmů o šachy a literaturu.--Chalupa (diskuse) 10. 2. 2025, 22:26 (CET)[odpovědět]

Zagothal

editovat

Jistě je jedním z důvodu, že je výrazně méně článku o ženách i to, že na cswiki je velmi málo žen, ale nejde o nic jako záměr mužských editorů, ale o neúmyslný důsledek toho, že píšou hlavně o tom, co je zajímá. A to je ten fotbal a hokej. Opravdu se nedá vysvětlit jennedostatkem významných, že třeba u mého roku narození je dvakrát více mužů (a i po odečtení fotbalistů a hokejistů je to 3:2). (@Matěj Suchánek, děkuji za dotaz.) Podobně je to třeba s asijskými či africkými reáliemi, a to nejen u nás, ale i třeba na enwiki. Já osobně moc biografie nepíšu, takže toto nenapravím.

A teď ještě k tomu DoSu: Považuji jeho vyvolání za provokaci. Nemyslím si, že autorovi šlo moc o tu stránku, ale o tu soutěž ano.

Zagothal (diskuse) 10. 2. 2025, 15:52 (CET)[odpovědět]

Wikipedie:WikiProjekt žádná závazná pravidla pro vytváření projektů nestanovuje, naopak WikiProjekty ze své přirozenosti sdružují wikipedisty, kteří se danému tématu chtějí věnovat, ať už chtějí psát o českých firmách, biatlonu, tramvajové sítí v Praze, Těšínsku, ruské politice, počítačových hráč, islámu či i jiných tématech. Nevidím důvod, proč v tomto wikipedistům (projekt založil kolega Bazi) bránit. Nebo snad budeme mazat Wikipedie:WikiProjekt Fotbal proto, protože už máme článků o fotbalistech moc? Ohledně spolupráce s externími subjekty doporučuju ke zhlédnutí Wikipedie:WikiProjekt Knihovna umění. Jklamo (diskuse) 13. 2. 2025, 14:08 (CET)[odpovědět]

@OJJ Myslím by bylo dobře tento ŽOK přejmenovat, protože z názvu není jasné, o čem tu diskutujeme a že to nemá mnoho společného s existencí nebo činností toho projektu.--Jan Spousta (diskuse) 13. 2. 2025, 15:27 (CET)[odpovědět]
@Jklamo: Pokud vím, nikdo nikde nezpochybňoval právo wikipedistů se sdružovat nad jakýmikoli tématy hodnými encyklopedické pozornosti, pokud přitom budou dodržovat zásady Wikipedie. Takže je skoro zbytečné o tom psát.--Jan Spousta (diskuse) 13. 2. 2025, 15:36 (CET)[odpovědět]

V obecné rovině, zdá se mi býti zřejmé, že výrazně menší počet encyklopedicky významných žen je základním důvodem, proč je na wikipedii výrazně méně článků o ženách než o mužích. Fakt, že na wikipedii je výrazná převaha mužských editorů s tím dle mého nesouvisí, a tvrzení, že ano, že "jedním z důvodu, že je výrazně méně článku o ženách i to, že na cswiki je velmi málo žen-editorů" a že mužští editoři píší přednostně o mužích, je dílem pouhá spekulace, dílem ideologický předsudek, obé ničím nepodložené. (A ač mohu rok Zagothalova narození jen odhadovat, soudím, že vyšší počet biografií mužů na wiki mezi jeho vrstevníky je zapříčiněn nízkým počtem významných žen. I v současnosti je celá řada oborů výrazně mužských (politika, ekonomika, technika..).

Co se týče WikiProjektu Ženy, tak je špatné, že se autoři stránky wikiprojektu při zdůvodňování užitečnosti a nutnosti projektu snížili k formulacím zjevně vytvářejícím - jak je nyní módní říkat - toxické prostředí, když se v odůvodnění kromě nesporných faktů (převaha mužských biografií, převaha mužských editorů) objevila či stále objevují tvrzení, že "18 % žen (z celkového počtu biografií)" je něco negativního, že je kvůli tomu wikipedie "nevyvážená", že za mohou mužští editoři, že je to forma systémové podjatosti, kterou je třeba napravit, že zvýšení zmíněného procenta je něco pozitivního atd. Kromě těch 18 % a kromě převahy mužských editorů není žádné další ze zmíněných tvrzení ničím doloženo, jsou to prázdné ideologické fráze, které na žádném wikiprojektu nemají mít místo. Co se týče diskuze výše, charakteristické (a bohužel mimo wiki obvyklé) pro tuto problematiku je, že kolega, oznamující odchod kvůli "toxickému prostředí", za toxické nemá ideologicky podložené vinění editorů z "nevyváženosti", z "negativního stavu" wikipedie, který je třeba napravovat, ale vadí mu pojmenování tohoto toxického obviňování a snaha o jeho zmírnění (imo nedostatečná; svou víru si vážení kolegové mají ventilovat mimo wikipedii).

Snaha o nějakou statistiku vypovídající o stavu wikibiografií je záslužná a správná. Do té doby, než budou k dipozici nějaké relevantní závěry, by tvrzení o nevyváženosti, nebo nežádoucnosti zmíněných 18 % měly z wikiprojektu zmizet. Je totiž reálně možné, že v ideální wikipedii, kde budou všichni významní muži i ženy, bude právě 18 % žen. Nebo 22. Nebo 15. Nebo 32. Nevíme. Prozatímně, z toho co níže kolegové spočítali, to ale vypadá, že žádný genderový gap neexistuje a 18 % je korektní podíl, který dobře odpovídá počtu encyklopedicky významných žen, čili že mužští editoři se ženám věnují stejně spravedlivě jako mužům.

No a co se týče vlastní příčiny a prvopočátku debaty - sporu kolegy Spousty s organizátory dotyčné soutěže, tak chování organizátorů je vskutku "toxické". Když vyhlásili soutěž a zveřejnili hodnotící kritéria, tak měli povinnost hodnotit dle těchto kritérií a žádných jiných. Že hodnotili podle jiných, předem nezveřejněných kritérií je zlo, které by je mělo diskvalifikovat z vedení a hodnocení dalších soutěží. Že odmítli fakticky použitá kritéria zveřejnit aspoň dodatečně, když se toho Jan Spousta opakovaně domáhal, je další zlo (které vede k přemýšlení nad otázkou proč se tak úporně brání jejich zveřejnění). Reakce kolegy (návrh na smaz projektu) mi proto přijde pochopitelná, i když projekt jako takový bezpochyby má právo na existenci. Ale jakou jinou cestu k nápravě situace měl? Organizátoři totiž zjevně vůbec nepochopili, co a proč jim Jan Spousta vytýká, když si v aktuálním návrhu obecných pravidel soutěží napsali, v podstatě, že kritéria hodnocení budou napříště soukromou záležitostí poroty: o jejich zveřejnění před, v průběhu ani po soutěži účastníkům soutěže není zmínky a zjevně se s ním nepočítá. Ale pozitivní je, že tam také není zmínky o matení účastníků soutěže kritérii falešnými. --Jann (diskuse) 13. 2. 2025, 17:14 (CET)[odpovědět]

1. Souhlasím s názorem, že by neměla existovat cena poroty.

2. Souhlasím s tím, že jakákoliv diskriminace (i ta pozitivní) je špatná.

Na druhou stranu. Wikipedie je především dobrovolnický projekt. Pokud bude někdo psát tematické články jen proto, že dostal nějakou tematickou kvótu, nemyslím, že do toho dá svůj um a své srdce naplno. Uživatelé většinou píší tradičně o tom, co je zajímá, případně o lidech, kteří je oslovili.

V okamžiku vyčerpání témat, což je stav, ke kterému téměř všechny projekty statisticky jednoznačně směřují, nastane v budoucnu situace, že se budou vyhledávat okrajovější témata. Řekněme, že se časem na všechny dostane. Chce to pouze čas.--Fion31 (diskuse) 15. 2. 2025, 18:18 (CET)[odpovědět]

Analýzy

editovat

Grafy: podíl ženských biografií podle roku narození

editovat

@Jan Spousta, Matěj Suchánek, Chrz: Z toho, co vygeneroval Matěj Suchánek, jsem udělal tři grafy pro jednotlivé roky. Opakuji, že se ptáme, jestli poměr žen/mužů v průběhu času signifikantně roste, anebo nikoli:

 

Tento graf znázorňuje roční poměry od roku 1700 do 2000; p-hodnota ukazuje na vysokou signifikanci (p-value: < 2.2e-16), koeficient determinace ale jenom 37 %.

 

Což se nám změní od roku 1800, kdy koeficient determinace činí asi 75 %

 

Od roku 1900 je pak koeficient determinace asi 78 %

Samozřejmě, že ta data nemusí být korektní a co jsem viděl podle PetScan, tak Matějova data uvádí víc hesel než průnik z Pet (ale asi to bude z WD přesnější). Také nevylučuju chyby (obecně toto dělám minoritně, jestli je tam chyba, tak to samozřejmě okamžitě uznám), takže jakožto věc pro cswiki důležitou doporučuji podobné práce udělat ještě jednou a oficiálně a s pořádnými objemy dat. Ve všech třech případech ale ukazují statistické testy extrémně vysokou signifikanci poměru ženy/muži v závislosti na roku narození (p: < 2.2e-16), zhruba od 19. století i slušný koeficient determinace. Data nebyla odfiltrována od fotbalistů ani jiných sportovců (při vynechání fotbalistů koeficient determinace stoupne asi na 0,8, to už nemá cenu sem vkládat). Tedy suma sumárum, poměr článků o ženách silně koreluje s rokem jejich narození. OJJ, Diskuse 10. 2. 2025, 16:28 (CET)[odpovědět]

To je zajímavé, dík za graf. Z pohledu statistické teorie jsou data očividně nelineární, takže se na ně lineární regrese tak úplně nehodí, ale při zahrnutí této nelinearity a časovosti to vypadá ještě optimističtěji pro ženské biografie. Protože ten nárůst podílu žen je v posledním období (narození kolem roku 1970 a dál) obzvlášť rapidní. V podstatě se to dá číst tak, že holky, které se narodí dnes, mají zhruba stejnou šanci se dostat do Wikipedie jako jejich vrstevníci kluci. Akorát jim to bude trvat o trochu déle, než se tam dostanou (protože fotbalisti se prosadí k encyklopedické významnosti už v mladém věku, zatímco umělkyně a političky si musejí počkat). Je dokonce možné, že kdybychom fotbalisty a hokejisty odečetli, tak už teď v té generaci 1980-1990 budou jasně převládat ženské biografie.--Jan Spousta (diskuse) 10. 2. 2025, 16:44 (CET)[odpovědět]
Nebudou, zkoušel jsem to tím dotazem z WD. Po odečtení hokejistů a fotbalistů je to v moji generaci asi 3:2 v prospěch mužů. --Zagothal (diskuse) 10. 2. 2025, 18:16 (CET)[odpovědět]
Díky výzkumníkům za data a grafy a sláva mně za bezvadný nápad, který diskuzi posouvá od osobních výpadů k trvrdým datům. Když koukám na ty obrázky, skoro se nechce věřit, že to suma sumárum dá pro ženy jen těch uváděných 18 procent za celou historii.
Takže ten náhlý pokles před rokem 2000 je způsoben mladými fotbalisty a hokejisty? Tohle by stálo za to prozkoumat a zkusit to tedy nakreslit ještě jednou bez nich, na jaký poměr to pak vyskočí. --Chrz (diskuse) 10. 2. 2025, 17:06 (CET)[odpovědět]
Myslím, že to hodně táhne dolů první polovina dvacátého století. Jsou tam mraky biografií, a mezi nimi poměrně málo žen.--Jan Spousta (diskuse) 10. 2. 2025, 17:53 (CET)[odpovědět]
Pokud bych chtěl tvoje výsledky rozbít, poukázal bych:
  • Na předpoklad linearity dat (podmiňující použití lineárního modelu), který je pohledem do grafu... odvážný. Data jsou spíš po částech lineární.
  • Na to, že všechny samply mají stejnou váhu. Je rozdíl, pokud je hodnota 0,2 spočítána jako 1/5 nebo 100/500.
I bez lineárního modelu je z dat evidentní, že existuje netriviální závislost na datu narození. 1800–1950 stejnoměrný nárůst, 1950–1970 rapidní nárůst, 1970–2000 rapidní pokles.
Ale pořád se nemůžu zbavit dojmu, že jsme si sice „doma udělali pořádek“, ale tak nějak jsme tím nic nepotvrdili ani nevyvrátili... --Matěj Suchánek (diskuse) 10. 2. 2025, 18:30 (CET)[odpovědět]
@Jan Spousta, Chrz, Matěj Suchánek: Jak říkám, úpravy vítám (můžeme to udělat bez té zmiňované lineární regrese). Zkusit to můžete i sami, Jan Spousta nebo Matěj jsou k tomu kompetentní. ;-) Můžeme to taky okleštit třeba o ty fotbalisty, hokejisty, vojáky (WWII) atd. Akorát je poměrně pracné prohrabat se těmi tabulkami atd. Do pátku na to nebudu mít čas...
Teoreticky jsme prokázali, že poměr článků může záviset i na jiných proměnných, takže Bazi si nemá prosazovat ten svůj text. Prakticky mě Bazi dotáhl do těch svých diskusních mlýnků, ranilo to plodného editora (kterému napíšu), já ztratil čas, pár lidí včetně mě si udělalo antireklamu ... takže spíš lose-lose situace. OJJ, Diskuse 10. 2. 2025, 18:40 (CET)[odpovědět]
Českocentricky můžeme zkusit ještě jak vyjde graf pro Čechy a Češky (opět hokej fotbal i bez). Můžeme zkusit podobné grafy pro cizí wikipedie, které tou nevyrovnaností údajně taky trpí. Pracovní teorie je jasná: ženských biografií je málo, protože ženských biografií ani reálně víc být nemůže. Který graf to dokáže říct? --Chrz (diskuse) 10. 2. 2025, 18:53 (CET)[odpovědět]
Nemůže to dokázat žádný. Stejně jako Baziho premisu. Museli bychom znát ideální stav. Bez toho lze jedině porovnávat relativně. --Zagothal (diskuse) 10. 2. 2025, 19:01 (CET)[odpovědět]
@OJJ, Chrz, Matěj Suchánek, Zagothal: "Ideální stav" právě zkoumá ta moje analýza výše, která se ptá, jak by měl vypadat ideální poměr mezi biografiemi mužů a žen, pokud by se psaly v obou případech medailonky stejně významných lidí. A dochází k závěru, že tu prakticky žádný rozdíl mezi pohlavími není. Pokud jde o váhy bodů, tak je jasné, že body mají rozdílnou váhu, ale pokud za kadým bodem stojí "hodně" biografií, jakože stojí, tak to až tak nevadí. Pokud jich je v jednom ročníku/bodě řádově aspoň tisíc (což většinou je, snad s výjimkou nejmladších ročníků), tak poloha toho bodu je zatížena statistickou chybou méně než asi sqrt(1/1000) na 95% hladině významnosti, což dělá něco kolem tří procent (0.03), přičemž tady řešíme diference v řádu deseti procent (0,1). Čili data jsou k našemu účelu vhodná i přes různé počty pozorování v jednotlivých ročnících. A co se týče nelinearity, tak jak jsem psal: není naším cílem vytvořit co nejlepší regresní model, ale pouze posoudit tendenci v datech, a to lze udělat prostým okem: od 19. století podíl ženských biografií roste až po rok zhruba 1980, pak zase klesá, ale to má zřejmě příčinu v tom že fotbalisté a hokejisté se proslaví brzy v životě, zatímco typické ženské cesty ke slávě trvají déle. Tento detail by se ještě mohl ověřit, ale v každém případě to ve spojení s mou analýzou výše dává závěr, že
  • i přes převažující mužské pohlaví pisatelů Wikipedie se nezdá, že by zde celkově bylo menší pokrytí ženských biografií než mužských, a
  • menší počet ženských biografií než mužských se vysvětluje tím, že Wikipedie popisuje i doby, kdy ženy měly následkem uspořádání společnosti menší šanci se prosadit, a také často popisuje sport, kde se dodnes díky větší fyzické síle prosazují častěji muži než ženy a také se sportovci stávají slavnými v nižším věku, než se proslaví průměrná encyklopedicky významná žena.
Z toho plyne, že mluvit o nějakých genderových problémech Wikipedie v tomto duchu je napřesné. A že to škodí Wikipedii a wikipedistkám v tom, že když se pozornost zaměří na neexistující problém, tak se tím zároveň odvede od problému skutečného, jakým je například slušné a vstřícné chování wikipedistů, na což jsou ženy dost citlivé. Protože tahle analýza vůbec neříká, že Wikipedie žádný genderový problém nemá - říká jenom, že ho usilovně hledá na špatném místě.--Jan Spousta (diskuse) 10. 2. 2025, 19:11 (CET)[odpovědět]
Já v tom takový závěr nevidím. A důvod je, že nevíme jaký je ten poměr významných můžů a žen je. Můžeme to jen velmi hrubě odhadovat. A je nesmysl, že je málo žen, které by se proslavily před dvacátým rokem (sportovkyně, modelky, umělkyně). Ono i u žen bude většina z těchto kategorií. --Zagothal (diskuse) 10. 2. 2025, 19:27 (CET)[odpovědět]
@Zagothal: Ta moje analýza uvedená výše na tento problém jde nepřímo, takže se obejde bez přesné znalosti počtů významných žen a mužů. Vychází z toho, že kdyby jejich poměr výrazně neodpovídal poměru biografií mužů a žen na Wikipedii, tak by nové články o mužích měly v průměru jinou čtenost než nové články o ženách. To plyne z toho, že by se z preferovaného pohlaví už vyčerpalo mnohem více těch nejvýznamnějších osobností, zatímco u diskriminovaného pohlaví by stále ještě byly k dispozici napopsané významné osobnosti s vysokou čteností. To se však nepotvrdilo - nové články o ženách mají mediánovou čtenost stejnou jako články o mužích. Z toho jde odvodit, že poměr je v pořádku. (Je to podobná metoda, jako když jedete autem a měříte svou okamžitou rychlost. Správně byste měl změřit svou rychlost vůči souřadné soustavě stálic, pak rychlost bodů na silnici vůči souřadné soustavě stálic, a obě rychlosti pak vektorově odečíst. To je ale prakticky velmi obtížné a obě zmíněné rychlosti jsou navíc díky rotaci Země kolem Slunce a kolem své osy velmi vysoké. Takže to děláte mnohem praktičtěji a přesněji tak, že měříte jen rozdíl své rychlosti vůči povrchu vozovky, který pro tento účel považujete za nehybný, i když možná víte, že ve skutečnosti letí velmi rycbhle vesmírem po poměrně zakřivené dráze. Tato skutečná rychlost však vás ani policajty nezajímá, důležitá je jenom relativní rychlost vůči povrchu zemskému, takže není potřeba měřit rychlost v absolutním smyslu. Stejně tak mě tady nezajímá skutečný absolutní počet významných mužů a žen, který se navíc neustále mění, ale jde mi jenom o to, jak rychle se ženy pohybují vůči mužům, jak rychle přibývají jejich biografie ve srovnání s mužskými.)--Jan Spousta (diskuse) 10. 2. 2025, 20:00 (CET)[odpovědět]
Budu hnidopich: Ta metoda má jednu zásadní vadu, směšuje významnost a být objektem zájmu. Vsadil bych se, že mnohá herečka bude mít vyšší čtenost než většina Nobelistů. --Zagothal (diskuse) 10. 2. 2025, 20:04 (CET)[odpovědět]
Určitě byste sázku vyhrál, ale pak to znamená, že daná herečka je pro běžného smrtelníka kolem nás významnější než většina nobelistů, protože činnost nobelistů nejsou schopni pochopit, zatímco činnost té herečky ano. Významnost v absolutním smyslu není definovaná, podobně jako třeba krása v absolutním smyslu. Žádní dva lidé by se neshodli na tom, jak ji stanovit. A čtenost neměří přesně vzato ani "být objektem zájmu", ale spíš něco jako užitečnost pro běžné čtenáře Wikipedie. To je ale v zásadě to, co chceme: abychom psali články, které naši čtenáři považují za užitečné pro sebe.--Jan Spousta (diskuse) 10. 2. 2025, 20:53 (CET)[odpovědět]

Grafy jsou to hezké a děkuji autorovi za tu práci, kterou s nimi měl. Ale co z nich plyne pro předmět této ŽOK? --Chalupa (diskuse) 10. 2. 2025, 23:25 (CET)[odpovědět]

@Chalupa: Snažím se hůře či lépe ukázat, že poměr článků o ženách/mužích může záviset na jiných proměnných než je poměr pohlaví editorů, takže to stránka WikiProjektu nemá uvádět. OJJ, Diskuse 11. 2. 2025, 07:57 (CET)[odpovědět]
@OJJ: Ahá, to jsem nepochopil, takže se omlouvám za své pochybnosti o smyslu těch grafů. Mě připadalo, že to musí každý chápat, že to není o pohlaví editorů, ale o všeobecném významu jednotlivých osobností, kterých je mezi ženami z mnoha příčin opravdu méně. A i kdyby to na pohlaví editorů záviselo, tak s tím onen projekt stejně nic nezmůže. --Chalupa (diskuse) 11. 2. 2025, 17:55 (CET)[odpovědět]

Regresní analýzy: logaritmické podíly ženských biografií podle roku narození

editovat

@Jan Spousta, Matěj Suchánek, Chrz: Tak jsem to pro začátek zkusil logaritmicky transformovat, aby se trochu zahladil ten „hrb“ a lépe tam seděla lineární regrese (samozřejmě se tam dá zkusit i jiný regresní model, uznávám, že hlavně ten první graf byl roztodivný; jak jsem avizoval, já s tím zase tak četně nepracuju – LR jsem vzal jako nejjednodušší věc první volby). Nahoře je to s hokejisty i fotbalisty (p = 2.87e-53, R2 = 0.9131447), dole bez nich (p = 4.840918e-54, R2 = 0.9162733). OJJ, Diskuse 11. 2. 2025, 07:57 (CET)[odpovědět]

 
 

Bylo by skvělé, kdyby se podařilo připravit model pro celou historii od starověku, ale to už by vyžadovalo netriviální korekce historické i matematické, na což si spíš netroufám. OJJ, Diskuse 11. 2. 2025, 07:57 (CET)[odpovědět]

Myslím, že starověk je zbytečný, tam máme biografií relativně málo, důležité je 20. století. A co se týče této analýzy, tak je vidět, že hrb kolem počátku tisíciletí sice odstraněním fotbalistů a hokejistů úplně nezmizel, ale zřetelně se zmenšil. Takže ho nejspíš způsobují ještě nějaké jiné sporty a populární aktivity, popřípadě možná i statistická chyba vlivem malého počtu pozorování v nejmladších ročnících. Ale očividně míříme správným směrem. Je fascinující, že v těch ročnících na vrcholu křivky se poměr biografií žen a mužů skoro přesně vyrovná. Dík za analýzu!--Jan Spousta (diskuse) 11. 2. 2025, 08:26 (CET)[odpovědět]
Jak chápete větu, která se objevila v DoSu a jaká souhrnná data (případně po vyfiltrování fotbalu a hokeje) máme pro dané období? Cituji "Zároveň se všechna čísla vždy porovnávala srovnatelné, tzn. např. také na číslech biografií lidí narozených po r. 1950". Kde se vzalo těch 18 % kterými se argumentuje u systematické genderové nevyváženosti biografií? Co ten rozsah 1950+? --Chrz (diskuse) 11. 2. 2025, 10:01 (CET)[odpovědět]
Nakolik je mi známo, tak 18 % činí podíl ženských biografií na všech biografiích na Wikipedii. A jestli někdo udělal analýzu těchto dat na ročnících 1950+, tak ve světle OJJových regresí je jasné, že mu také muselo vyjít, že žen je významně méně - vyrovnává se to až zhruba od ročníku 1985, a to ještě jen po odfiltrování fotbalistů a spol. Tak prostě lidská společnost vypadá.--Jan Spousta (diskuse) 11. 2. 2025, 11:42 (CET)[odpovědět]
@Chrz, Jan Spousta, Matěj Suchánek: Jestli chcete koláčové grafy na různé úseky 20. století s fotbalisty a bez, je možno to připravit, ale až v pátek. Ale v souvislosti s výše uvedeným už je to asi zbytečné. Můžeme se taky pro zajímavost podívat na nějaká starší století, ačkoli ten první graf s nízkým R2 ukazuje, že zajímavé to začne být až od 19. století dál (kde bude také největší statistický soubor).
Napadlo mne ještě zkusit vydolovat délky článků osobností 20. století, kdyby Matěj byl tak hodný. Můžeme testovat hypotézu, zda jsou články o ženách kratší než články o mužích (minimálně srovnat mediány). Případně třeba můžeme testovat délku řekněme 5 % nejdelších článků o mužích a ženách. Ale budou to pořádné soubory dat... Každopádně kdyby byly články o ženách kratší, to už by nasvědčovalo tomu, že se jim věnuje méně pozornosti. Je to lepší ukazatel než čtenost, protože ty texty někdo reálně napsal, zatímco pouhá otevření mohou být zkreslena ledasčím. --OJJ, Diskuse 12. 2. 2025, 09:24 (CET)[odpovědět]
Co se týče délek článků, to už jsem nezávisle předtím zkusil (pro všechny):
SELECT cl_to, COUNT(*), AVG(page_len) FROM page JOIN categorylinks ON cl_from = page_id WHERE cl_to IN ('Muži', 'Ženy') AND page_namespace = 0 AND page_is_redirect = 0 GROUP BY cl_to;
+-------+----------+---------------+
| cl_to | COUNT(*) | AVG(page_len) |
+-------+----------+---------------+
| Muži  |   126512 |     6452.3664 |
| Ženy  |    28422 |     6760.7244 |
+-------+----------+---------------+
Medián: 4601 (Ž) / 4554 (M). (Edit: tohle bylo předtím špatně.)
Články o ženách jsou v průměru o 300 bajtů delší než o mužích. Pokud bychom chtěli tento rozdíl prohlásit za významný, dá se použít některý t-test. Ale pozor, nejde o normální rozdělení, spíš logaritmicko-normální.
Stejně jako ty další podrobné výstupy nejdřív o víkendu. --Matěj Suchánek (diskuse) 12. 2. 2025, 09:40 (CET)[odpovědět]
@Matěj Suchánek: Skvěle. Tak jestli se přes víkend obětuješ, tak to vygeneruj celkově i pro to 20. století a hoď rovnou prosím do Rka nebo Matlabu. Vyjma celkových počtů bych se zkusil podívat i na ty extrémní hodnoty (řekněme 5 % nejdelších článků). --OJJ, Diskuse 12. 2. 2025, 09:54 (CET)[odpovědět]
@OJJ: Z délky článků toho podle mě moc neplyne, protože u méně známých osobností (a takových je většina) je limitována obsažností dostupných pramenů. Takže kratší délka mužských článků je podle mě způsobena tím, že o nějakém začínajícím fotbalistovi se toho moc víc nenapíše, než že v té a té lize dal tolik a tolik gólů. Navíc délka článku je ovlivněna individuálním rozhodnutím hrstky jednotlivců, kteří na něm pracovali, (obvykle bývá hlavní autor jeden nebo maximálně dva), zatímco čtenost aspoň nějakým způsobem reflektuje význam osobnosti pro "průměr společnosti", i když bychom se samozřejmě mohli dlouze bavit o zkresleních a nejasnostech kolem ní.--Jan Spousta (diskuse) 12. 2. 2025, 10:23 (CET)[odpovědět]
Ty sportovce budeme muset mít vždy na paměti a dělat grafy s nimi a bez nich, tím spíš mladí mužští fotbalisti a hokejisti bez haldy zdrojů. Navrhuju přejmenovat žok na něco související s gender gapem, když wikiprojekt je stále řešen v dosu. --Chrz (diskuse) 12. 2. 2025, 11:18 (CET)[odpovědět]
@Matěj Suchánek @OJJ Což zkusit udělat z nějakého vzorku, třeba narozených po roce 1950 analýzu povolání nebo zaměření - vytipovat x nejzastoupenějších povolání dle pohlaví? Třeba to pomůže odhalit ještě jiné dominantně mužské články (typicky ještě politik). Sice kvalita Wikidat zrovna v tomto ohledu má k ideálu daleko, ale snad to není až tak tragické... --JAnD (diskuse) 12. 2. 2025, 13:42 (CET)[odpovědět]

Distribuce délek biografií podle pohlaví

editovat

@Jan Spousta, Matěj Suchánek, Chrz: Takže, dal jsem si s tím práci, vzal si k ruce už i knížku a upozorňuji, že jsem si třeba při tahání dat odtud i práci s Matlabem (Rko se mi při tom mj. nějak podivně zadrhlo, takže jsem ho opustil) vypomohl Copilotem. První výsledky asi ovlivnilo jak to zadrhnutí, tak jisté zmatení myšlenek, konzultoval jsem to následně např. s Vítkem, ale s kůží na trh jdu jenom já.

Takže myšlenka je taková, že pokud je na české Wikipedii více mužů a ti chtějí psát spíše o mužích, budou články o mužích statisticky delší. Naopak pokud by byla mužům a ženám věnována stejná pozornost, bude rozložení délek vesměs podobné, akorát absolutní počet článků bude jiný (pamatujme na korelaci poměru ženy/muži s datem narození osoby). Soubory jsou na sobě nezávislé, nestejně velké a nemají gaussovské rozdělení, takže i po náhledu do literatury mi tam sedí Mannův-Whitneyův-Wilcoxonův test na testování hypotézy, že mediány článků o mužích jsou větší než mediány článků o ženách, což by měl v Matlabu zajišťovat kód [p, h, stats] = ranksum(delky_muzi, delky_zeny, 'tail', 'right');. Níže jsou grafy:

 

Při zahrnutí všech článků vychází:

  • Muži - Průměr: 6453.324179, Medián: 4554.000000, Horní kvartil: 7457.000000, Spodní kvartil: 2798.000000, Interkvartilární rozdíl: 4659.000000
  • Ženy - Průměr: 6761.176189, Medián: 4600.000000, Horní kvartil: 7787.000000, Spodní kvartil: 2853.000000, Interkvartilární rozdíl: 4934.000000
  • p-hodnota = 0,999998, velikost účinku r = -0,011601.
 

Ve druhém testu jsem totéž testoval pro 5 % nejdelších článků, poněvadž se jim věnovalo nejvíc pozornosti:

  • Muži - Průměr: 29479.663401, Medián: 23065.000000, Horní kvartil: 31123.000000, Spodní kvartil: 19279.500000, Interkvartilární rozdíl: 11843.500000
  • Ženy - Průměr: 32067.556962, Medián: 24356.000000, Horní kvartil: 33252.000000, Spodní kvartil: 20608.000000, Interkvartilární rozdíl: 12644.000000
  • p-hodnota pro mediány = 1,0, velikost účinku r = -0.090637.
 

Nakonec jsem dataset okleštil o 5 % krajních hodnot:

  • Muži - Průměr: 5466.749901, Medián: 4554.000000, Horní kvartil: 7025.000000, Spodní kvartil: 2954.000000, Interkvartilární rozdíl: 4071.000000
  • Ženy - Průměr: 5663.115037, Medián: 4600.000000, Horní kvartil: 7331.000000, Spodní kvartil: 3003.000000, Interkvartilární rozdíl: 4328.000000
  • p-hodnota pro mediány = 0,999998, velikost účinku r = -0.013822.

Z grafu a výsledků lze shrnout, že ačkoli články o mužích vykazují některé extrémní hodnoty, rozdíly mezi oběma pohlavími se nezdají být výrazné, ba články o ženách mají zkoumané hodnoty obecně vyšší. Mediány článků o mužích nejsou statisticky větší než mediány článků o ženách (při takových obřích datasetech se dá podle Vítka nějaká signifikance prakticky vždy očekávat), tento efekt je však zanedbatelný. Opět upozorňuji, že jakékoli zpochybnění dat/metodiky je vítáno.

Tj. na základě dat se z mého pohledu nedá říct, že by se na české Wikipedii psalo relativně méně o ženách než o mužích, poněvadž rozložení v obou skupinách je podobné. OJJ, Diskuse 14. 2. 2025, 09:12 (CET)[odpovědět]

Díky moc, to je velmi užitečná analýza a podobnost obou rozdělení je až nečekaná. To se v praxi moc často nestává, aby si dvě rozdělení údajně zcela odlišných :-) náhodných veličin byla tak podobná. Takže souhlasím, že je to velmi podstatný argument pro to, že se na naší wiki s biografiemi obou pohlaví zachází stejně. Ostatně vůbec celé to tvrzení, že články o ženách jsou zanedbávané, protože wiki píší muži, mi připadá ujeté, jelikož normální duševně zdravý jedinec má pozitivní vztah k lidem obou pohlaví, takže proč by se jednomu z nich vyhýbal.--Jan Spousta (diskuse) 14. 2. 2025, 09:26 (CET)[odpovědět]
Tak to tu a ani na tom projektu nikdo nenapsal. A to ani v té nejproblematičtější formulaci. --Zagothal (diskuse) 14. 2. 2025, 09:31 (CET)[odpovědět]
@Zagothal: Bylo to zaobalené do vědecké terminologie o "systémové podjatosti", ale vyznění bylo takové.--Jan Spousta (diskuse) 14. 2. 2025, 09:52 (CET)[odpovědět]
Řekl bych to přesněji Když se někdo rozhodne psát o ženě, dá tomu stejnou práci jako článku o muži. Ale je tu ještě ten nepoměr počtu článků. Proč u narozených kolem roku 1950 (Tedy dospělost kolem roku 1970, kdy už ženy nebyli tak margilizovány jak o sto let dřív.) je asi šestkrát více mužů než žen? To nebudou jen sportovci a politici. --Zagothal (diskuse) 14. 2. 2025, 09:28 (CET)[odpovědět]
@Zagothal: Zdá se, že tak prostě rozložení společnosti vypadalo/vypadá. Možná za to může třeba mateřství, obecně nějaké genderové stereotypy (jak je o tom moderní mluvit) etc. Skoro bych si tipnul, že s poklesem porodnosti v západních zemích půjde nahoru počet encyklopedicky významných žen. Ale to už jsou spekulace. Datasety tak, jak jsem je analyzoval, jsou všem dostupné, takže mohou ty analýzy zpochybnit. Ale vypadá to skutečně slibně, že se tu ženským tématům nijak nekřivdí. OJJ, Diskuse 14. 2. 2025, 09:37 (CET)[odpovědět]
@Zagothal: Je evidentní, že ženy jsou v některých dráhách vedoucích k proslavení nějakým způsobem zastoupené méně než muži až dodnes. Může za tím být jejich menší fyzická výkonnost (sporty), skleněný strop, jejich menší zájem o některé kariéry, nevím, ale prostě to tak je, a tím spíš to bylo před pár desítkami let. Když jsem byl mladý, tak se řada těch otázek ani veřejně neřešila a bralo se to jako dané.--Jan Spousta (diskuse) 14. 2. 2025, 09:52 (CET)[odpovědět]
@Zagothal: Že ženy kolem roku 1970 už nebyly marginalizovány jako o sto let dřív je pro velkou část světa pravda. Ale je to jen část světa, i když ta námi nejpokrytější. Nicméně i v té části "lepší než roku 1870" neznamená "v pořádku". Připomnělo mi to jedno vyprávění Jiřiny Šiklové na semináři k ženským právům konaném v před lety, že po roce 1968 byli němečtí úředníci v šoku z českých žen z posrpnové emigrace, které si na německých úřadech vyřizovaly dokumenty - protože normální středostavovská Němka ještě na přelomu 60. a 70. let na úřady nechodila, vše zařizoval manžel. A samozřejmě že nejde jen o sportovce a politiky, stejně na tom je celá řada dalších oborů. Typické je rovněž, že i když ženy roku 1970 si (v Československu) mohly zvolit povolání roku 1870 jim nedostupná, řekněme soudce, a soudnictví bylo v 70. a 80. letech u nás silně feminizované (protože platy soudců byly mizerné), tak pro wikipedii to nemá význam, protože wiki kouká jen na významné soudce, tj. vysoce postavené a tam už žen bylo pomálu. Stejně tak učitelé, kde převaha žen ve sborovně při mužském řediteli se stala (ve vámi uvedeném období kolem roku 1970) triviálním klišé. --Jann (diskuse) 15. 2. 2025, 19:01 (CET)[odpovědět]
Protože to už je trochu složitější matematika než dělení a procenta, takže se budu hůř hledat chyby v úsudku a metodě. Takhle by šlo za hru s čísly a grafy ukrýt i kdejaký nesmysl. Takže doufám, že případnou chybu nahlásí i ten, kdo je "spokojen" s výsledky.
Já bych k tomu laicky přistoupil tak: Článek o muži předvede pět vět a jeden zdroj. Článek o ženě předvede jedinou větu s pěti zdroji a precizněji vyplněným infoboxem. Tudíž ač jsou na bajty shodně dlouhé, mužský je delší na "skutečnou" textovou délku článku, informativnější. A teď dokažte, že nemám pravdu. Pokud ty články psaly oddělené skupiny editorů, mohlo by se tohle hravě stát. --Chrz (diskuse) 14. 2. 2025, 10:33 (CET)[odpovědět]
@Chrz: Je možno provést tutéž analýzu v závislosti na počtu slov, ovšem netuším, zda je tato možnost v Quarry možná a Copilotovi nevěřím. Ale minimálně třeba ten WAM čítač počet slov užíval, takže technicky by to možné bylo. Jestli je víc citace, anebo počet slov, může být ale také sporné, poněvadž se zase dá tvrdit, že články o mužích/ženách tu nemáme ozdrojované etc. Výše provedená analýza se ale týkala i 5 % nejdelších článků v případě obou pohlaví, v dalším případě jsem to okleštil o krajní hodnoty.
Co se týče zpochybnění metodiky, samozřejmě s tím plně souhlasím, vyzývám jak Honzu, tak kohokoli dalšího, ať to klidně rozcupuje. Opakuji, že sám se statistikou dělám minimálně. Každopádně krabicový graf nevnímám jako složitější matematickou metodu, to je prostě spíš jen vizualizace nějakých základních statistických vlastností toho souboru dat. Tam už může být chyba víceméně "pouze" v tom vygenerování toho grafu přes příslušný program (což samozřejmě také vyzývám ke zkontrolování, snad by to mělo jít i v Excelu). A už z té vizualizace plyne, že rozdíly ve většině hodnot nijak závratné nejsou. Pokud jinak někoho pro zajímavost zajímají extrémní data, tak nejdelší článek o muži je Miloš Zeman a nejdelší článek o ženě Petra Kvitová. :-)
Každopádně by se dalo říct, že datasety z Wikipedie mohou být "pokladem" pro různé měkké obory, poněvadž by se dala jistě srovnávat s lecčím (porodnost, války, sexuální revoluce etc.). OJJ, Diskuse 14. 2. 2025, 11:25 (CET)[odpovědět]
@Chrz: Je velmi subjektivní říct, zda je lepší podrobnější méně zdrojovaný článek nebo kratší lépe zdrojovaný. Různí uživatelé by asi prefererovali různé možnosti. Takže nevím, co by plynulo z toho, kdyby se něco takového prokázalo.--Jan Spousta (diskuse) 14. 2. 2025, 11:29 (CET)[odpovědět]
Já jen zkouším najít potenciální mouchy v tom přístupu porovnávat bajty, prostě bajty. Co když články o hercích obsahují krásné stati o životě a díle, zatímco články o herečkách obsahují jen sáhodlouhou tabulku s výčtem filmografie. Nikoho neubude, když přizná, z jakých předpokladů vyšel. Třeba jsou články o mužích v průměru mírně kratší jen pro ty hokejisty a fotbalisty, kdyby se vyškrtli tak uvidíme, že u jiných povolání muže popisujeme delšími články... --Chrz (diskuse) 14. 2. 2025, 12:07 (CET)[odpovědět]
@Chrz: OK, já myslím, že postup je metodologicky korektní, ale je jasné, že vypovídá jen o délce článků, ne o žádné jejich další kvalitě. Takže pokud někoho zajímá jiná kvalita než délka, například poměr souvislého textu vůči tabulkám, musel by si udělat jinou analýzu. Rozhodně délka je důležitý ukazatel a pravděpodobně silně koreluje s čtenářskou užitečností článků, takže důkaz, že tento parametr vypadá v obou skupinách velice podobně, naznačuje, že se jim wikipedisté věnují s podobným zaujetím.--Jan Spousta (diskuse) 14. 2. 2025, 12:26 (CET)[odpovědět]
Mohlo by, pravděpodobně, naznačuje, ... to už je dumání nad hodnotami a pokus o závěry. Pokud ani jedna ze stran sporu nezpochybňuje délku článku jako v průměru porovnatelný ukazatel, nebude mít samozřejmě cenu se v tom více šťourat. Ale můžeme zdůraznit, že se prostě počítal zdrojový kód článků se vším všudy, text, značkovací jazyk, zdroje, všechno dohromady. --Chrz (diskuse) 14. 2. 2025, 13:04 (CET)[odpovědět]
Jasně, ano. A statistická data nikdy nemluví s absolutní jistotou a dělat z nich závěry vždycky vyžaduje dodat k číslům kontext, který v nich samotných není. Pokud někdo čeká, že na základě práce s daty vyvoláme jakéhosi boha, který vstane a autoritativně řekne, že jedna strana sporu má pravdu, tak se hluboce mýlí. Nanejvýš lze ukázat, že data s vysokou pravděpodobností nesouhlasí s určitým modelem/teorií reality. Jakože například tady jsme už docela jasně ukázali, že velký nepoměr počtu ženských a mužských biografií není způsoben v první řadě tím, že by mužští editoři Wikipedie zanedbávali ženská témata, ale spíše tím, jak vypadá svět okolo nás a hlavně jak v minulosti vypadal. Šli jsme na to ze čtyř stran, přes podíly pohlaví podle ročníku narození, přes délku článků, přes párovnání podobných osobností a přes čtenosti nových článků, a ani jedna tato metoda nepřinesla data, která by byla snadno slučitelná se "systémovou předpojatostí" mužských editorů jakožto hlavní příčinou rozdílu v počtu nebo kvalitě mužských a ženských biografií.--Jan Spousta (diskuse) 14. 2. 2025, 13:28 (CET)[odpovědět]
No, ukázali jsme něco s vysokou pravděpodobností, ale co hlavní řečník strany "Wikipedie je systémově předpojatá" nazve že jsme si "našli hračky" a že jsme tím určitě nevyvrátili mezinárodně uznávaný a rozšířený článek o gapu. --Chrz (diskuse) 14. 2. 2025, 13:49 (CET)[odpovědět]
@Chrz: Všímám si, že se k tomu Bazi nechce vyjadřovat. Ačkoli na to jsem právě narážel, že se mluví a trochu agituje o "gapu", ale bez snahy o jeho hlubší pochopení. Zase chápu, že se pro verbování nových editorů takové úvahy moc nehodí, a proto se podle mě taktně zamlčují. Pochybuji, že by se o podobné analýzy nepokoušeli i na jiných/větších Wikipediích. OJJ, Diskuse 14. 2. 2025, 13:59 (CET)[odpovědět]
No a to je hned další námět na grafy - to co doteď, ale na enwiki, dewiki, skwiki... Třeba je jejich vzrůst počtu ženských biografií v průběhu času horší. --Chrz (diskuse) 14. 2. 2025, 14:06 (CET)[odpovědět]
@Chrz: Potenciální možnosti práce jsou nekonečné, ale jde o to, zda něco zásadně nového přinesou. Jestli třeba odhalíme, že na Wikipedii X panuje o trochu jiná úroveň "diskriminace" než na Wikipedii Y, co z toho pro nás plyne? - A jinak moje zkušenost je, že předpojaté, ideologické jedince je skoro nemožné přesvědčit. Je dobře známo, že během Velké čistky mnozí komunisté odeslaní Stalinem do lágru tam zůstali přesvědčenými komunisty a pořád věřili, že došlo k nějakému omylu nebo dokonce že oni sami něco provedli, jenom aby si nemuseli připustit, že se jednoduše přidali do špatné party a uvěřili pohádkám. Svoje analýzy dělám pro sebe, abych věcem přišel na kloub, a pro případné zájemce hledající daty podloženou odpověď na tyto otázky, ne abych přesvědčil toho, kdo má pocit, že "ví" i bez dat.--Jan Spousta (diskuse) 14. 2. 2025, 14:17 (CET)[odpovědět]
No co, zjistilo by se, jestli je mezinárodně ten gap opravdu neospravedlnitelný, zatímco my jen přejímáme mezinárodní pohoršení, ačkoliv u nás problém není. Samozřejmě chápu, že EV žen je v různých společnostech různě a přesto že popisujeme světové osoby, jejich význam je různý. Mimochodem, celé to zkoumání biografií, umí to rozlišit reálné a fiktivní lidi (postavy), a pokud ne, vadí to? --Chrz (diskuse) 14. 2. 2025, 14:28 (CET)[odpovědět]
Nevím, jak by to dopadlo s jazykovými verzemi zemí třetího světa, ale pokud jde o vyspělé země, tak bych čekal, že výsledky se nebudou dramaticky lišit od českých - mají podobný poměr ženských a mužských biografií, podobný podíl editorek a jejich společenská situace je zhruba podobná. A kdybychom náhodou dokázali, že editoři na arabské Wikipedii o trochu víc diskriminují ženy, tak by odpověď asi byla, že není divu a že je to ještě ta nejmenší nevýhoda, kterou ženy v některých arabských zemích mají. - A fiktivních postav je na Wikipedii poměrně málo ve srovnání s postavami reálnými, takže medián by neměly nijak zvlášť ovlivnit, ať už je jejich čtenost nebo délka jakákoli. Já používám kategorie Ženy a Muži, což by mělo fiktivní postavy odfiltrovat, ale každou jednu položku nekontroluji.--Jan Spousta (diskuse) 14. 2. 2025, 14:52 (CET)[odpovědět]

Distribuce délek u žen a jiných témat

editovat

@Jan Spousta, Matěj Suchánek, Chrz: Alternativně můžeme zkusit srovnat ženy s jinými daty, zkusil jsem proti ženám postavit data z kategorií ('Kriticky ohrožené taxony', 'Ohrožené taxony', 'Zranitelné taxony', 'Téměř ohrožené taxony', 'Málo dotčené taxony', 'Nedostatek údajů podle IUCN', 'Vyhynulé taxony podle IUCN'), což je dataset asi 5637 článků. Což se nám může hodit už pro podobné poměry menší/větší, protože dataset ženy/muži byl v poměru 28424/126532=0,225, toto je 5637/28424=0,198.

Opět grafy a testování hypotézy, že mediány článků o druzích jsou větší než mediány článků o ženách (korektně bychom to měli otočit a zkoumat to v případě žen, když je jich víc – ale to už je, myslím, metodologická drobnost).

 

Při zahrnutí všech článků vychází:

  • Druhy - Průměr: 7907.162675, Medián: 5130.000000, Horní kvartil: 8676.500000, Spodní kvartil: 3122.750000, Interkvartilární rozdíl: 5553.750000
  • Ženy - Průměr: 6761.176189, Medián: 4600.000000, Horní kvartil: 7787.000000, Spodní kvartil: 2853.000000, Interkvartilární rozdíl: 4934.000000
  • p-hodnota: 0.000000, velikost účinku r: 0.048868
 
  • Druhy - Průměr: 44844.558304, Medián: 35126.000000, Horní kvartil: 50566.750000, Spodní kvartil: 25840.250000, Interkvartilární rozdíl: 24726.500000
  • Ženy - Průměr: 32067.556962, Medián: 24356.000000, Horní kvartil: 33252.000000, Spodní kvartil: 20608.000000, Interkvartilární rozdíl: 12644.000000
  • p-hodnota = 0.000000, velikost účinku r = 0.278663.
 
  • Druhy (bez 5 % extrémních hodnot) - Průměr: 6210.159834, Medián: 5129.500000, Horní kvartil: 8211.000000, Spodní kvartil: 3292.000000, Interkvartilární rozdíl: 4919.000000
  • Ženy (bez 5 % extrémních hodnot) - Průměr: 5663.115037, Medián: 4600.000000, Horní kvartil: 7331.000000, Spodní kvartil: 3003.000000, Interkvartilární rozdíl: 4328.000000
  • p-hodnota = 0.000000, velikost účinku r = 0.057966.

Což taky nejsou nijak výrazné rozdíly (tentokrát v neprospěch žen), ale třeba nejdelší články o druzích hodnocených IUCN mají větší medián a tento efekt má větší velikost účinku (ale ani 0.28 není úplně vysoká hodnota). Takže by se dalo říct, že nejdelším článkům o druzích věnujeme více času než nejdelším článkům o ženách (vybrat si místo ženy muže, no prosím – ale rypouše sloního, to je už rovnou na zrušení Wikipedie :-) </žert>). Srovnával jsem to ještě s datasetem článků přeložených z dewiki, tam byly rozdíly opět minimální, ale protože může být z dewiki přeložené hodně žen a nejde o nějaké téma, po zralé úvaze jsem se to sem rozhodl nedávat. Neporadím si s Quarry co do hloubky kategorií, jinak bychom proti ženám mohli postavit třeba rostliny, města podle zemí, přidat druhy nehodnocené IUCN (i ty máme potenciálně dlouhé, jako Měchožil bublinatý) a jiné reprezentativní soubory, kde je více tisíc hesel. Jo a opět vítám korekce a kontroly, omylem jsem z matlabu vykopíroval staré hodnoty (ale při opětovné kontrole jsem to odhalil). OJJ, Diskuse 14. 2. 2025, 13:30 (CET)[odpovědět]

To je zajímavé, ale asi to moc neříká o tématu ženy vs. muži. Že jiné oblasti Wikipedie mohou tíhnout k jiné délce článků, je vysvětlitelné prostě tím, že jejich témata vyžadují jiný přístup nebo že na těch článcích pracuje odlišná skupina wikipedistů, kteří mají jiný styl psaní.--Jan Spousta (diskuse) 14. 2. 2025, 14:31 (CET)[odpovědět]
@OJJ V článcích o taxonech josu občas zahrnuty kladogramy, které medle zabírají docela velký kus zdrojového kódu. Tak jenom že by teoreticky mohly být výsledky zkreslené tímto. --JAnD (diskuse) 14. 2. 2025, 15:18 (CET)[odpovědět]
Jak tu píši další, tohl už o ničem nevypovídá. Struktura biografií a struktura článků o zvířátkách je někde jinde. --Chrz (diskuse) 14. 2. 2025, 15:21 (CET)[odpovědět]
@Jan Spousta, Chrz, JAn Dudík: Pozor, odlišný přístup jsme očekávali i u mužů a žen... :-) Toto už každopádně bylo spíš jen tak pro zajímavost. Kladogramy jsou dobrý point, byť ty největší bývají u vyšších taxonů. OJJ, Diskuse 14. 2. 2025, 15:42 (CET)[odpovědět]
@OJJ Z hlediska matemtické statistiky bych řekl, že odlišný přístup u mužů a žen byl tzv. alternativní hypotézkou, zatímco nulovou hypotézou je, že přístup k oběmy pohlavím je stejný nebo velmi podobný. Je pravda, že bys to mohl takto pojmout i tady, ale případné vyvrácení nulové hypotézy není až tak přínosné, protože se dá vysvětlit důvody, které doufám nepředstavují téma žádného sporu.--Jan Spousta (diskuse) 14. 2. 2025, 15:46 (CET)[odpovědět]

Délka článků při párovém porovnání

editovat

Ještě mě napadlo, že kdybychom chtěli porovnávat délky článků o mužích a ženách, tak by korektnější přístup byl porovnávat po dvojicích osobností, které měly přibližně stejný význam v dějinách svého oboru (např. dva ministerské předsedy stejné země vládnoucí zhruba stejně dlouhou dobu ve stejné epoše, jednoho muže a jednu ženu). Ale žádní dva lidé nejsou přesně stejní, i když formálně plní podobná kritéria, takže by bylo obtížné najít takové dvojice, aby bylo srovnání nesporné.--Jan Spousta (diskuse) 12. 2. 2025, 11:00 (CET)[odpovědět]

Například mě napadlo spárovat nedávné nositelky Nobelovy ceny za chemii s nobelisty v podobných letech a podobné pozici vyhlášení. Tady je výsledek:

  • Frances Arnoldová 20 744 bajtů x George P. Smith 3 201 bajtů
  • Emmanuelle Charpentierová 15 603 bajtů x Benjamin List 3 334 bajtů
  • Jennifer Doudnaová 17 752 bajtů x David MacMillan 2 394 bajtů
  • Carolyn R. Bertozziová 8 681 bajtů x Morten Meldal 4 700 bajtů

Což hodně silně naznačuje, že přírodovědkyně se těší větší pozornosti editorů Wikipedie než jejich podobně úspěšní mužští kolegové. Asi tím, že jich je méně, na sebe stahují víc pozornosti. A odpovídá to i zájmu čtenářů: kterákoli z těch čtyř vědkyň má na české Wikipedii vyšší čtenost než kterýkoli z napárovaných vědců.--Jan Spousta (diskuse) 12. 2. 2025, 11:14 (CET)[odpovědět]

@Jan Spousta: Hm, ono hlavně ty články byly vytipovány a rozšířeny/založeny právě v rámci Wikigapu (mají hashtag), takže zrovna tato metodologie není zrovna košer. --OJJ, Diskuse 12. 2. 2025, 11:35 (CET)[odpovědět]
Záleží, jak se na to díváme. Jestli chceme vyloučit tohle záměrné rozšiřování ženských článků, nebo jestli ho budeme považovat za integrální součást dění na Wikipedii. Ale je pravda, že pro korektní posouzení by to chtělo mnohem víc takových dvojic a z různých polí činnosti, a vždycky by to spárování bylo založeno na nějakém více či méně subjektivním odhadu, který by mohl být zpochybněn.--Jan Spousta (diskuse) 12. 2. 2025, 11:41 (CET)[odpovědět]
V některých specifických oblastech se můžeme obejít bez "subjektivních odhadů". Možná oskaroví herci a herečky, zcela jistě kosmonauti a kosmonautky, jako dobře definovaná a dobře pokrytá skupina (plně srovnatelní budou uvnitř kosmonautů členové dlouhodobých posádek Mezinárodní vesmírné stanice, letoví specialisté z letů na raketoplánech). Nebo vysocí čínští politicí/političky - ty lze relativně snadno seskupit podle dosažené funkce do srovnatelných skupin (například vicepremiéři po roce 1983, členové státní rady po roce 1983, místopředsedové parlamentu, místopředsedové politického poradního shromáždění /vše pokud je to nejvyšší dosažená funkce/). Ovšem jakýkoliv výsledek možná ukáže pouze styl psaní jednoho nebo několika málo editorů. --Jann (diskuse) 13. 2. 2025, 17:14 (CET)[odpovědět]
Ano, ale problém vidím v tom, že v některých takových případech by se mohlo stát, že žena dosáhne vysoké funkce proto "že tam prostě musíme mít taky nějakou ženskou" a vyberou takovou, která nedělá problémy, zatímco srovnatelný muž si musel svou pozici těžce vybojovat, takže je ve svém oboru mnohem těžší váha než jeho kolegyně. A tím pádem se o něm dá víc psát a jeho článek na Wikipedii je sledovanější. Neříkám, že to musí tak být vždycky, ale je těžké to detekovat a odfiltrovat, pokud by to nastávalo.--Jan Spousta (diskuse) 14. 2. 2025, 10:12 (CET)[odpovědět]
Obecně možná ano, ale v navrhovaných skupinách pochybuji. --Jann (diskuse) 15. 2. 2025, 19:01 (CET)[odpovědět]

Ještě jsem se koukal na dvojice soutěžící v Krasobruslení na Zimních olympijských hrách 2018 – sportovní dvojice. Na české wiki je jich málo založených (a máme z nich stejně mužů jako žen), a tak jsem se díval na anglickou verzi. Tam se ukázalo, že velikost článků je podle průměru i mediánu vyrovnaná, zatímco čtenost ženských sportovkyň je v průměru i mediánu o cca 10 % vyšší než čtenost jejich partnerů. Což si myslím, že je zanedbatelné, i kdyby to náhodou bylo statisticky významné. Můj závěr je, že se v tomto sportu zachází s oběma pohlavími podobně, jak odpovídá i podobnému podílu dámy a pána na sportovních úspěších dvojice.--Jan Spousta (diskuse) 13. 2. 2025, 10:34 (CET)[odpovědět]

Ano. TO je logické, oba články většinou napíše jeden autor, který se o krasobruslení zajímá. Avšak u sportů s výrazně mužským publikem (a asi budou i výrazněji než fotbal a hokej) budou převládat sportovci nad sportovkyněmi. Není to nic úmyslného, ale logický důsledek toho nepoměru u editorů. --Zagothal (diskuse) 13. 2. 2025, 10:39 (CET)[odpovědět]
Anglická wikina je velká, tam ty články často mají mnoho editorů. A tohle analyzuji právě proto, že většina sportů je genderově nevyrovnaná, takže jsem byl rád, že jsem si vybavil sport, kde je vyrovnanost jakž takž zaručena pravidly. To umožňuje odfiltrovat právě ty vlivy typu že fotbal víc hrají a sledují muži než ženy.--Jan Spousta (diskuse) 13. 2. 2025, 11:16 (CET)[odpovědět]
Běžecké a sjezdové lyžování, biatlon, rychlobruslení mně napadají. Je tam parita disciplín a i dosti parita sledovanosti (ne jak třeba u fotbalu). --Zagothal (diskuse) 13. 2. 2025, 11:27 (CET)[odpovědět]

Sledovanost nově vytvořených článků podle pohlaví (kopie z diskuse výše)

editovat

Pro zajímavost jsem udělal ještě rychlou analýzu z jiného pohledu. Pokud by probíhala nějaká genderová diskriminace v tom smyslu, že jedno pohlaví neprávem opomíjíme, ale přitom bychom o obou pohlavích zakládali články zhruba v pořadí významu osobností od nejdůležitějších k méně důležitým, tak by to znamenalo, že u diskriminovaného pohlaví jsme se ještě nedostali k tak důležitým jedincům jako u pohlaví preferovaného. (Představte si to tak, že kdybychom např. silně diskriminovali muže, tak bychom v kategorii žen v nějakém okamžiku měli už založenou Irmu Geisslovou, ale u mužů bychom se ještě nedostali ani ke Karlu Hynku Máchovi.) Důležitost můžeme přibližně měřit sledovaností, takže diskriminace by znamenala, že čtenost nově zakládaných článků osobností diskriminovaného pohlaví je zřetelně větší než čtenost nových článků preferovaného pohlaví (protože u něj jsme už ty významné články dávno založili). Vyjel jsem si proto PetScanem články o ženách a mužích založené v listopadu 2024 a pomocí Pageviews měřil jejich sledovanost v posledních 4 týdnech: muži a ženy. Průměrná čtenost mužského článku vyšla 3,32 / den, ženského 1,92 /den, což by nasvědčovalo diskriminaci mužů. Ale u tak vychýlených dat je průměr velmi nespolehlivým měřítkem střední hodnoty, takže je lépe použít medián, a ten v obou případech vychází stejně - 12 zobrazení za dobu měření. Závěr tedy je, že existuje mírné podezření na diskriminaci mužů ve smyslu, že wikipedisté raději píší články o ženách (a aby ne, když většinu wikipedistů tvoří chlapi </žert>), ale rozhodně tu žádné dramatické rozdíly ve smyslu pokrytí obou pohlaví nemáme. Z toho plyne, že dramatický rozdíl v počtu článků o mužích a ženách je způsobený prostě tím, že kvalitními prameny podložených (a tedy encyklopedicky významných) žen je méně, a to je způsobeno faktory, které jsou dobře známé a které na Wikipedii nemůžeme ovlivnit, a tedy nemá smysl kolem nich tady dělat drama.--Jan Spousta (diskuse) 10. 2. 2025, 11:06 (CET)[odpovědět]

Ještě jsem stejnou metodologií zkusil otestovat další hypotézu, a sice zda na Wikipedii nemáme podreprezentovaná témata, která ženy tradičně zajímají. Je samozřejmě obtížné dokázat, že se zrovna o takové téma jedná, ale snad se z tradičních genderových rolí naší kultury dá odečíst, že ženy mívají větší zájem o umění a vaření, takže jsem vzal kategorie Umění a Pokrmy s jejich podkategoriemi do určité hloubky a opět počítal mediány. Výsledek byl zajímavý: Umění má medián 18 zobrazení za dobu měření a Pokrmy dokonce 90 zobrazení za dobu měření (ve srovnání s 12 u biografií). Což mi i dává smysl, protože souhlasím, že kapr na modro je čtyřikrát zajímavější než průměrný muž nebo žena, který/která tu na Wikipedii v současnosti dostane svůj článek. Není mi známo, o kolik přesně víc se ženy o tyto kategorie zajímají víc než muži, ani o kolik častěji je tu píší, ale připadá mi možné, že tento jev souvisí s tím, že jsou mezi námi wikipedisty menšinou. Znamená to zároveň, že kdyby se tu nějaký wikiprojekt opravdu staral o zvýšení účasti a zlepšení čtenářské spokojenosti žen, tak by místo biografií asi měl soutěžit nad takovýmito tématy, protože ta jsou podle tohoto měření výrazně méně pokrytá, než životopisy mužů i žen.--Jan Spousta (diskuse) 10. 2. 2025, 13:55 (CET)[odpovědět]
Teď jsem to zkusil na rozsáhlejším souboru článků založených od prosince 2023 do listopadu 2024. Tam mi vyšla naopak mírná "diskriminace" žen (čtenost jejich článků má v posledních 14 dnech medián 10, zatímco medián čtenosti mužů je jenom 9, avšak na neúplných datech, protože PageViews měl problém ty muže načíst všechny najednou a nechce se mi ten soubor dělit na menší části). V každém případě je to poměrně malý rozdíl, který by odpovídal pár desítkám článků o ženách, jež by měly ročně vzniknout navíc (přičemž jich vzniká asi 1,6 tisíce), a hlavně je to zatížené statistickou chybou plus chybou těch dat o mužích.--Jan Spousta (diskuse) 14. 2. 2025, 11:37 (CET)[odpovědět]
Dodatek: výsledek, naznačující, že ženských biografií by mělo být o jedno či dvě procenta víc, kdybychom se oběma pohlavím věnovali spravedlivě v pořadí čtenářské popularity, mi připadá docela věrohodný. Myslím, že někde se nedostatek wikipedistek projevit musí, a taky to, že hlavní média věnují ženským tématům méně pozornosti. Což má za následek, že stý nejlepší český fotbalista má skoro určitě svůj článek, ale stá nejlepší česká ezoterička, autorka kuchařek nebo spisovatelka jemně erotické literatury pro dámské počtení na pláži možná nic nemá. Jelikož u toho čutálisty se sportovní tisk rozepíše o jeho gólech a kondici a někoho na Wikipedii to zaujme, zatímco o zmíněných dámách buď nikdo seriózní ani nepíše, anebo to žádného wikipedistu nezaujme, dokonce ani projekt Ženy, jak dokazuje soupis článků, které chtějí založit.--Jan Spousta (diskuse) 14. 2. 2025, 12:37 (CET)[odpovědět]

Efekt soutěže Měsíc žen na Wikipedii 2024 na tvorbu článků o ženách

editovat

Ještě mě napadlo podívat se z hlediska zakládání článků o ženách na minulý ročník soutěže Měsíc žen na Wikipedii. Můj závěr:

  • Intenzita zakládání článků o ženách se během trvání soutěže ztrojnásobila - možná by některé články byly založeny i tak, ale nezdá se, že by jich bylo moc takových. Takže z toho hlediska soutěž určitě poslouží dobrému účelu a dky ní vzniklo řádově 300 článků o ženách, které by jinak nevznikly. (Je otázka, zda by soutěžící nevěnovali čas jiné užitečné činnosti, kdyby soutěž nebyla, ale pokud se účastnili, tak je to nejspíš bavilo a mělo to pro ně nějaký význam.)
  • Články zakládané během soutěže jsou trochu méně čtené (a tedy možná méně užitečné pro "průměrného" čtenáře) než články zakládané spontánně. Pokles mediánové čtenosti za mnou sledovanou dobu 2 týdnů je z organických 11 na 8. To je sice zřetelné, ale rozhodně se nedá říct, že by se zakládaly jenom esoterické články pro malou hrstku čtenářů. Moje hypotéza je, že tento efekt je dokonce nižší než u soutěže Popiš památku, kde jsme se dostali opravdu už k měšťanským domům z 19. století a vesnickým kapličkám.
  • Článků a jiných editací vzniká v rámci soutěže tolik, že je tříčlená porota složená ze dvou newikipedistů a Janberyho nemůže pravděpodobně vůbec v rozumném čase podrobněji posoudit, a to by mohlo být jednou z příčin, proč její rozhodování moc nekoreluje s kvalitou soutěžících článků a proč si chtějí prosadit do pravidel, že budou posuzovat neveřejně a bez jasně dané metodiky. Protože pak to můžou rozhodout nějakou metodou typu "vytáhnu pár náhodných článků z klobouku" nebo "podívám se, které články napsal kámoš, a těm to dám". Jinak by tomu museli věnovat možná stovku hodin času i víc, kdyby si všichni porotci chtěli všechny soutěžní články pořádně přečíst a poctivě posoudit.

Takže ať už nějaký gender gap ve složení článků existuje nebo ne, soutěž se z hlediska doplnění Wikipedie osvědčuje, teď ještě jak ji provozovat férově.--Jan Spousta (diskuse) 14. 2. 2025, 21:43 (CET)[odpovědět]

Přejmenování a příčiny genderová nevyváženosti na Wikipedii

editovat

Klidně si ŽOK přejmenujte, ale opravdu nevím, co by se tu dalo analyzovat na genderová nevyváženosti na Wikipedii. Opravdu si myslím, že místo diskuze o smyslu prokektu se tato diskuze dostala někam, kde by vůbec neměla být, protože je to naprosto k ničemu. Příčiny genderová nevyváženosti na Wikipedii jsou tři:

  1. ) Významných ženských osobností je ve srovnání s mužskými méně.
  2. ) Muži píší hlavně o tom, co je zajímá (ostatně stejně jako ženy).
  3. ) Ženy ovšem píší na Wikipedii méně než muži.

A teď zkuste navrhnout, co by se s těmito skutečnostmi dalo dělat? Podle mne vůbec nic. --Chalupa (diskuse) 13. 2. 2025, 21:58 (CET)[odpovědět]

To je jednoduché a opakované.
1) Tento ŽoK má ambici kvantifikovat, jestli je 18 % málo nebo moc.
2) Tento bod se taky celkem daří vyvrátit. Alespoň co se týče biografií.
Bořit mýty a falešná zdůvodnění (wikiprojektů) není málo. Zatím netvrdím, že to dosavadní průběh dokázal vyčíslit či něco vyvrátit, ale jde na to podle mě chytře přes čísla v kontextu ne přes názory či ideologie. --Chrz (diskuse) 13. 2. 2025, 22:18 (CET)[odpovědět]
K vyvrácení bodu 2 jsme se ani nepřiblížili. Ve skutečnosti tvrzení "muži i ženy píší hlavně o tom co je zajímá" je tak triviální a samozřejmé, že se ho nikdo ani nepokouší vyvracet. Co se daří vyvrátit je příbuzná myšlenka - "mužští editoři dávají při psaní biografií mužům přednost před ženami". Což je tvrzení nesamozřejmé. --Jann (diskuse) 15. 2. 2025, 18:28 (CET)[odpovědět]