Stylometria (gr. στῦλος „słup” i μέτρον „miara”) – metoda analizy dzieła sztuki dla ustalenia statystycznej charakterystyki stylu autora. Służy głównie rozstrzyganiu kwestii autorstwa dzieł anonimowych bądź chronologii przekazu. Założenia stylometrii przedstawił w roku 1890 Wincenty Lutosławski, w pracy „Principes de stylometrie”.
Historia
[edytuj | edytuj kod]W 1439 roku Lorenzo Valla udowodnił, że dokument „Donacja Konstantyna” jest falsyfikatem, opierając dowód na porównaniu łaciny tam użytej z dokumentami z epoki. Można to uznać za prapoczątek stylometrii, pierwszy udokumentowany przypadek zastosowania analizy porównawczej dla ustalenia autentyczności. Jednak prawdopodobnie współczesna stylometria bierze swój początek w sugestii Augusta de Morgana, który w 1851 r. postawił tezę, iż możliwa jest identyfikacja autorów tekstów biblijnych na podstawie analizy długości słów używanych przez poszczególnych autorów.
Początkowo stylometria stosowana była do analizy tekstów literackich. Metodę wykorzystał do analizy greckich dzieł Platona. Analiza polegała na ustaleniu liczbowych rozkładów stylemów (elementarnych jednostek językowo-stylistycznych): charakterystycznych słów, zwrotów, wyrażeń, kolokacji oraz form fleksyjnych. W ten sposób ustalono względną chronologię dzieł Platona oraz potwierdzono jego autorstwo w stosunku do jednych, a wykluczono je w stosunku do kilku innych dzieł wątpliwych. W późniejszym okresie z sukcesem wykorzystywano analogiczne metody w filologii angielskiej do badania dzieł Szekspira, w filologii klasycznej do określania autorstwa ksiąg Nowego Testamentu, przypisywanych św. Pawłowi oraz w orientalistyce – np. w indologii do badania dzieł przypisywanych Śankarze i Patańdżalemu, w arabistyce do badania tekstu Koranu, oraz w sinologii do badania rękopisów z Mawangdui, stanowiska archeologicznego w Changsha. Badania stylometryczne z użyciem komputerów pozwalają na badanie wielkich korpusów językowych oraz na uzyskanie większej pewności osiągniętych wyników.
W Instytucie Filologii Angielskiej Uniwersytetu Jagiellońskiego są prowadzone badania stylometryczne poświęcone językowi amerykańskich kazań kolonialnych[1].
Oprogramowanie
[edytuj | edytuj kod]Zastosowanie komputerów umożliwiło także zastosowanie stylometrii do badań utworów muzycznych i malarstwa. Tutaj w ustaleniu charakterystyki stylu wykorzystywane są: analiza fraktalna, analiza głównych składowych, algorytm genetyczny oraz sieci neuronowe[2]. Oprogramowanie, takie jak Signature[3] (bezpłatny system opracowany przez dr. Petera Millicana z Oxford University, JGAAP[4] (the Java Graphical Authorship Attribution Program – bezpłatny system opracowany przez dr. Patricka Juolę z Duquesne University), czy Stylene opracowany dla języka holenderskiego (system opracowany przez Waltera Daelmansa z Uniwersytetu Antwerpskego (University of Antwerp) oraz Véronique Hoste z Uniwersytetu Gandawskiego (University of Ghent) umożliwia analizę stylometryczną nawet przez osoby niebędące ekspertami w tej dziedzinie. Voyant tools[5] umożliwiają analizę tekstu ze strony sieciowej.
Program stylo[6][7], opracowany przez Macieja Edera, Jana Rybickiego oraz Mike’a Kestemonta, jest bezpłatnym systemem napisanym w języku programowania R umożliwiającym różnorodne analizy stylometryczne, łącznie z atrybucją autora tekstu. Program ten umożliwia analizę tekstu w różnych językach (także w języku polskim).
Programy do stylometrii wymagają korpusu, czyli tekstów wejściowych używanych do poszukiwania podobieństw. Przykładem programu do konwersji pomiędzy formatami jest calibre.
Przypisy
[edytuj | edytuj kod]- ↑ PAP Nauka w Polsce , Badają literacki styl jak linie papilarne | Aktualności o polskiej nauce, badaniach, wydarzeniach, polskich uczelniach i instytutach badawczych [online], naukawpolsce.pap.pl [dostęp 2017-08-03] .
- ↑ Jeremi K. Ochab: Stylometria i atrybucja autorska: co mierzy i dlaczego działa.. [w:] Praca magisterska [on-line]. 15 czerwca 2006. [dostęp 2016-01-30]. [zarchiwizowane z tego adresu (4 sierpnia 2016)]. (ang.).
- ↑ The Signature Stylometric System. PhiloComp. [dostęp 2014-01-03]. [zarchiwizowane z tego adresu]. (ang.).
- ↑ JGAAP. JGAAP, 2012-09-04. [dostęp 2012-10-15]. (ang.).
- ↑ Stéfan Sinclair i Geoffrey Rockwell: Voyant Tools, a web-based text analysis and reading environment.. [w:] strona sieciowa [on-line]. 2016. (ang.).
- ↑ stylo: R package for stylometric analyses. [dostęp 2020-12-09]. (ang.).
- ↑ Maciej Eder, Jan Rybicki, Mike Kestemont: Stylometry with R: A Package for Computational Text Analysis. [w:] The R Journal [on-line]. 2015. [dostęp 2016-01-30]. [zarchiwizowane z tego adresu (2016-02-04)]. (ang.).