Jednolity System Antyplagiatowy

Obrazek użytkownika Humpty Dumpty
Kraj

Od 1 stycznia 2019 roku wszedł do użycia na polskich uczelniach Jednolity System Antyplagiatowy.

Nie jest to jednak ostateczna wyrocznia w sprawach plagiatu.

 

Na stronie głównej systemu http://(https://jsa.opi.org.pl/home/login ) czytamy:

 

Przeznaczony dla promotorów pisemnych prac jako wsparcie w analizie tekstu pod kątem naruszeń w prawie autorskim.

 

Zresztą inaczej być nie może.

Wynika to z samej istoty działania systemu.

Jak wcześniejsze produkty tego typu JSA wyszukuje fragmenty podobne do znajdujących się w bazie danych.

Aby uniknąć stosowanych do tej pory przez studentów tricków w celu uwiarygodnienia rzekomo własnej pracy (zmiany interpunkcji, dużych liter, czasem wprowadzenie znaków pisarskich niewidocznych gołym okiem, widocznych natomiast dla komputera czy też, wzorem blogera Z. Niebieskiego kopiowanie cudzych tekstów tak co do wniosków jak i kolejności argumentów ale z użyciem własnych słów – tzw. plagiat ukryty) JSA w pierwszej kolejności pozbawia badany tekst formatowania i grafiki.

Mniej więcej przypomina on wówczas ostatnie kilkadziesiąt stron Ullisesa Jamesa Joyce’a. ;)

I wtedy dopiero następuje szukanie podobieństw w bazach porównawczych.

Te zaś JSA posiada największe w Polsce.

 

Dotychczasowe będące w użyciu na poszczególnych uczelniach programy nie miały dostępu do wszystkich napisanych w Polsce i obronionych prac licencjackich, magisterskich czy doktorskich. W najlepszym wypadku obejmowały kilka uczelni, z reguły niewielkich i prywatnych.

Trzeba w tym miejscu raz jeszcze podkreślić.

 

JSA nie jest współczesną elektroniczną wyrocznią, ale wspiera jedynie promotora.

 

Ten zaś dopiero ocenia, czy ma do czynienia z przywłaszczeniem sobie autorstwa albo wprowadzeniem w błąd co do autorstwa całości lub części cudzego utworu albo artystycznego wykonania.

W przypadku pracownika naukowego przyłapanego na zawłaszczaniu cudzej pracy intelektualnej obligatoryjnie sprawa wędruje do rzecznika dyscyplinarnego (art. 287 i n. tzw. Ustawy 2.0).

Jeśli natomiast zostanie stwierdzone, że w taki sposób postąpił absolwent rektor wydaje decyzję pozbawiającą go uzyskanego tytułu (stwierdza nieważność dyplomu).

 

A jak działały dostępne do tej pory programy?

 

Przed chwilą zakończyłem mały test. W jednym z dostępnych on line programów antyplagiatowych (nie będę lokował produktu) zbadałem preambułę naszej Konstytucji.

I co się okazało?

Otóż zdaniem programu plagiat wyniósł…. Nie, wcale nie 100%, jakby się mogło wydawać.

Program uznał, że przepisując dosłownie preambułę popełniam plagiat… jedynie w 94%.

Wygląda więc na to, że mój osobisty wkład w ustawę zasadniczą wyniósł aż 6%. ;)

Wydało się? ;)

 

To jednak nie koniec.

Otóż zgodnie z art. 4 pkt 1 ustawy o prawie autorskim i prawach pokrewnych Konstytucja nie podlega ochronie prawnej na gruncie tej ustawy.

Każdy obywatel, ba każdy człowiek na świecie może dowolnie cytować polską Konstytucję i zamieszczać jej fragmenty we własnych utworach.

Jedynie dobre obyczaje nakazywałyby oznaczać cytat.

Tymczasem system antyplagiatowy oznaczył fragment Konstytucji jako plagiat w 94%!

W tym przypadku widać jak na dłoni, że margines błędu sięgnął… tychże 94%!

 

Nic zatem dziwnego, że Ministerstwo Nauki i Szkolnictwa Wyższego postanowiło skończyć z tego rodzaju programami.

Jeszcze nie tak dawno na jednej z Politechnik (i to znajdującej się w pierwszej 4-ce uczelni technicznych w kraju) system antyplagiatowy odrzucał wszystkie prace (licencjackie i magisterskie), gdy tzw. współczynnik podobieństwa był równy co najmniej 5%.

Przy czym wliczał wszystko jak leci – cytaty oznaczone również. Dlatego prace tam powstające cechował prawie zupełny brak cytowań. Zamiast tego treść cytowana był opisywana własnymi słowami przez absolwenta. Tego ułomny system nie wyłapywał.

Spróbujcie jednak w taki sposób potraktować Pana Tadeusza i napisać go raz jeszcze swoimi słowami. ;)

 

Dlatego na uczelniach humanistycznych taki system się nie przyjął.

Przez moment zastanówmy się, jaki by był współczynnik plagiatu dla pracy dyplomowej (licencjackiej czy magisterskiej) polonisty o dźwięcznym tytule „Poezja Adama Mickiewicza jako przejaw europejskiego romantyzmu”?

Rzecz jasna prócz cytatów z wieszcza Adama musiałoby aż się roić z fragmentów wierszy Byrona, Shelleya, Keatsa, Hugo, Stendhalla, Puszkina, Lermontowa, Słowackiego, Norwida, Krasińskiego itp.

60%?

85%?

 

A student prawa, którego praca powinna być podparta cytatami orzeczeń SN czy sądów niższego szczebla?

Połowa pracy to plagiat?

 

Ale jaki to plagiat, skoro wyroki nie są objęte prawami autorskimi?

 

Poza tym

nie istnieje jakikolwiek wskaźnik dozwolonej ilości cytatów w autorskim dziele.

 

Ważne natomiast jest, by łącznie z cytatami było to odrębne dzieło.

Jeszcze wyraźniej widać to w materiałach dziennikarskich czy też blogosferze. W swoim ostatnim tekście zamieszczonym na NP pewna znana lokalnie blogera na ogółem 1640 użytych słów aż 1493 stanowiły cytat.

To aż 91,04%. Czyli od blogerki pochodzi niespełna co 11 słowo.

Czy jednak to oznacza, że mamy do czynienia z plagiatem?

Nie, albowiem cytat jest wyraźnie oznaczony i każdy nawet na pierwszy rzut oka widzi, jakie są jego granice.

 

Oczywistą oczywistością jest natomiast to, że dowolny program „antyplagiatowy” wychwyci powyższe.

Dlatego taki program, nawet najbardziej skomplikowany i wyposażony w tryliardy danych porównawczych jest tylko narzędziem mającym wspomóc człowieka (promotora).

A nie zastąpić.

 

W wywiadzie udzielonym portalowi Sztuczna Inteligencja jeden z twórców systemu dr Marek Kozłowski podkreśla, jak ważna jest ingerencja operatora:

W takim razie spójrz na to: „Miliony, miliony ton kamienia. W ciągu trzech stuleci od XI do XIV wieku wydobyto we Francji więcej tego materiału niż w starożytnym Egipcie, kraju gigantycznych budowli. Osiemdziesiąt katedr i pięćset wielkich kościołów, jakie zbudowano w tym okresie, zebrane razem tworzyłyby łańcuch górski wzniesiony ręką człowieka”.

No i?

I teraz to: „Na przestrzeni trzech stuleci, między rokiem 1050 a 1350, Francja wydobyła wiele milionów ton kamienia, aby wznieść 80 katedr, 500 wielkich kościołów i kilkadziesiąt tysięcy kościołów parafialnych. W ciągu tych trzech wieków Francja przetransportowała więcej kamienia niż starożytny Egipt w którymkolwiek okresie swej historii”.

Bardzo podobne.

Pierwszy fragment pochodzi z książki „Budowniczowie katedr” Jeana Gimpela, wydanej we Francji w 1958 r., drugi to cytat z eseju „Kamień z katedry” w zbiorze „Barbarzyńca w ogrodzie” Zbigniewa Herberta, I wydanie w 1962 r. Wasz system uznałby Herberta za plagiatora?

To zależy od parametru wrażliwości algorytmu na podobieństwo tekstów. Już wyjaśniam: do systemu wprowadziliśmy możliwość zdefiniowania przez administratora systemu w instytucji czułości algorytmu wyszukującego podobieństwa. Czy algorytm ma brać pod uwagę parafrazę? A może uznawać za plagiat tylko wierne podobieństwa? Suwak podobieństwa to miara, która może działać w skali od 0 do 100 procent. Ustawianie jego czułości na 0 procent nie miałoby jednak sensu, bo za plagiat uznawałby każdy tekst, porównując go z dowolnym innym tekstem.

Próg 100 procent oznacza podobieństwo jeden do jeden?

Co do słowa, choć szyk może być różny, jak w „Mama lubi kota”, „Mama kota lubi”. Albo u Moliera. Te 100 procent mówi nam, że zdania zawierają te same słowa, więc system uzna badany tekst za plagiat. Ale jeśli oba teksty będą się różniły choćby jednym słowem, plagiatu nie wychwyci. Jeżeli parametr wrażliwości algorytmu jest ustawiony na 100 procent, system wykrywa tylko idealne klony dokumentów.

Klony?

Klon to fragment jednego tekstu przeklejony do drugiego. Ale jeżeli ustawisz czułość na 100 procent, to znaczy, że nie uznajesz za plagiat niczego, co wiąże się z parafrazą. Natomiast jeśli ustawisz go, powiedzmy, na 30 procent, akceptujesz pewien współczynnik parafrazy.

Jak wy ustawiacie suwak?

Jako wartość domyślną dajemy 30 procent. Z przeprowadzonych badań wynika, że to wartość optymalna. Ale uczelnia może uznać, że system będzie zbyt czuły, wykrywając zbyt wiele podobieństw, które zaburzą ostateczny obraz pracy autora. I ustawia suwak na przykład na 50 albo 70 procent. Parametr może mieć inną wartość na różnych wydziałach. Dla przykładu, wydziały humanistyczne mogą być zainteresowane wynikami przy parametrze ustawionym w okolicach 30, natomiast wydziały techniczne powinny ustawić na 70 procent.

A uczelnie?

Zwykle ustawiają go na 50 procent. I to jest racjonalne.

 

Rozmawiał Robert Siewiorek

(https://www.sztucznainteligencja.org.pl/lowca-klonow-tropiciel-parafraz/?fbclid=IwAR2hq0QznxD1_srNvecYktjfVeXlGr5LEyrexlWO6TyyEhoTPk7rxGal3is )

 

Nie da się ukryć, że za moment i inne programy będą oferowały podobne możliwości.

 

Trudna sztuka kradzenia innym pomysłów pójdzie w niepamięć.

Nawet największa biegłość w podmienianiu słów i przesuwaniu kropek lub przecinków nie będzie już mogła nikogo oszukać.

 

A to wymiecie z przestrzeni publicznej tego typu „publicystów” co Z. Niebieski. Na samym hejcie długo bowiem nie pociągną.

 

25/28.09 2019

 

Ps.: JSA wszedł w życie 1 stycznia 2019 r. Wszystkie prace bronione po tym terminie będą już odpowiednio sprawdzane.

Niestety, nie da się w ten sposób wyplenić tzw. ghostwriterów, czyli osób piszących na zamówienie prace licencjackie czy magisterskie.

Czy jednak dr Marek Kozłowski i jego ekipa nie opracowują kolejnej modyfikacji systemu, która pozwoli na porównywanie np. stylów używanego języka?

Zastosowanie takiego wynalazku szybciutko pozwoli na odkrycie wszystkich nicków danej osoby.

Zamiast domysłów graniczących z pewnością uzyskamy wiedzę. ;)

 

Ps.2: Jak jednak będzie wyglądać Internet po wprowadzeniu w życie ACTA 2?

Ze względu na ogromną ilość powstających co sekundę plików może okazać się, że system zablokuje każdą wypowiedź. Bowiem nawet zwyczajne „cześć, co u Ciebie?” będzie rozpoznane jako plagiat czyjejś wypowiedzi.

Wprowadzenie czynnika ludzkiego, który by „sprawdzał po maszynie” wymagałby zatrudnienia w samej tylko Unii Europejskiej wszystkich Chińczyków wraz z ludnością Indonezji w roli cenzorów.

Pod warunkiem, że znaliby do tego europejskie języki.

A kogo zatrudnimy na drugą i trzecią zmianę? ;)

Ocena wpisu: 
4
Twoja ocena: Brak Średnio: 3.9 (głosów:7)