W związku z akcją BATUTA (Bezwzględna Akcja Troskliwego Uźródławiania Tysięcy Artykułów) tworzone są statystyki dotyczące poziomu uźródłowienia haseł na polskiej Wikipedii. Poniższe zestawienie jest jednym z takich. Autor jest świadomy niedoskonałości swojej metody badawczej, ale konsekwentnie będzie z niej korzystał dla zapewnienia jednorodności wyników i możliwości ich porównywania pomiędzy kolejnymi edycjami akcji.


Wyniki analizy

edytuj

W tabelach podane są liczby haseł zawierających i niezawierających: sekcję źródła, literatura, bibliografia lub też tagi cytowania, z podziałem na kolejne dni przeprowadzania testu.

W stosunku do poprzedniego roku przybyło w ciągu roku 86625 haseł ze źródłami i 12022 haseł bez źródeł netto (to tylko 13,9%!). Po tegorocznej może to być jeszcze lepszy wynik. O prawie 8 pkt. proc. zwiększyła się liczba uźródłowionych. Za 8 lat powinniśmy uźródłowić wszystkie :)

Źródła? Stan na 30.01.2010 Stan na 27.01.2011
  tak 178 005 (26,41%) 264 630 (34,25%)
  nie 495 935 (73,59%) 507 957 (65,75%)
Σ 673 940 (100,00%) 772 587 (100,00%)
Źródła? Stan na 30.01.2010 Stan na 14.02.2010 Stan na 23.02.2010 Stan na 02.03.2010
  tak 178 005 (26,41%) 181 863 (26,85%) 184 327 (27,11%) 186 103 (27,28%)
  nie 495 935 (73,59%) 495 462 (73,15%) 495 552 (72,89%) 496 129 (72,72%)
Σ 673 940 (100,00%) 677 325 (100,00%) 679 879 (100,00%) 682 232 (100,00%)

Kontakt

edytuj

Kwestie techniczne

edytuj
  • Do wykonania testu wykorzystywane są zrzuty bazy danych polskiej Wikipedii dostępne tutaj
  • Parametr testu: (\=.*((ź|ż)ródł(o|a)|(bibliografia|literatura))((|\:).*)\=.*\n(\*|[1-9]|\[|[A-z]|\n(\*|[1-9]|\[|[A-z]))|((\<ref\>.*\<\/ref\>|\<ref .*\/\>)))
  • Zestawienie uwzględnia wszystkie strony haseł w przestrzeni głównej oprócz stron przekierowujących

Inne skany bazy danych

edytuj
Źródła? Stan na 03.09.2011 Stan na 20.11.2011 Stan na 09.12.2011 Stan na 27.12.2011 Stan na 14.01.2012
  tak 312 487 (37,67%) 326 316 (38,50%)   330 329 (38,76%)   335 412 (39,11%)   339 045 (38,82%)  
  nie 516 984 (62,33%) 521 340 (61,50%)   521 927 (61,24%)   522 303 (60,89%)   534 406 (61,18%)  
Σ 829 471 (100,00%) 847 656 (100,00%) 852 256 (100,00%) 857 715 (100,00%) 873 451 (100,00%)

Kolorowe strzałki oznaczają wzrost lub spadek procentowego udziału danej grupy haseł w porównaniu do wcześniejszego wyniku.