#młodyinnoWATor mgr inż. Szymon Muszyński

Czy dzięki naukom ścisłym obliczymy poziom inspiracji cudzym utworem? O tym, czy dane dzieło jest plagiatem czy nie, decyduje szereg czynników i wielu specjalistów. Może się jednak zdarzyć, że na posądzenie o przywłaszczenie pomysłu wpłynie subiektywna ocena badacza. Da się temu zapobiec – w ocenie oryginalności dzieł muzycznych pomoże ciekawy pomysł mgr. inż. Szymona Muszyńskiego, doktoranta z Wydziału Cybernetyki WAT.

Mierzenie oryginalności dzieła muzycznego przy wykorzystaniu sposobów inżynierskich? To jak najbardziej możliwe! Metody zautomatyzowanego porównywania muzyki oparte na wielokryterialnych metrykach podobieństwa sieci to efekt prac doktoranta Szymona Muszyńskiego prowadzonych pod opieką promotora – dr. hab. inż. Zbigniewa Tarapaty, prof. WAT, z Wydziału Cybernetyki Wojskowej Akademii Technicznej. Opracowane rozwiązanie służy nie tylko do sprawnej kontroli plagiatu, lecz także do oceny aranżacji tworzonych na podstawie oryginalnego utworu.

Praca i pasja w WAT

Doktorant WAT tematem zajął się z pasji. Muzyką interesuje się od wielu lat, a zainteresowania te rozwijał także podczas studiów informatycznych na Wydziale Cybernetyki – w Chórze Akademickim WAT. Pasję do informatyki i muzyki łączy też prof. Zbigniew Tarapata – m.in. z tego powodu Szymon Muszyński trafił pod jego skrzydła, realizując najpierw pracę magisterską, a później projekt badawczy w ramach studiów doktoranckich. „Gdy nadarzyła się sposobność połączenia rozwoju naukowo-zawodowego z pielęgnowaniem hobby, z przyjemnością to wykorzystałem” – opowiada doktorant.

Informatyka wspiera twórców muzyki

Metody i techniki pomiaru podobieństwa utworów muzycznych są kluczowe w kontroli plagiatów i ocenie aranżacji, a procesy te wciąż zależą w szczególności od wcześniejszych doświadczeń i subiektywnych odczuć estetycznych badacza. Chociaż istnieją pewne wspólne ramy porównywania utworów, to jednak posiadanie zestawu kompleksowych i czytelnych metryk pozwoliłoby uczynić je bardziej bezstronnymi. I tu z pomocą przychodzi #młodyinnoWATor.

Metryka to w uproszczeniu funkcja wyznaczająca odległość – czyli w tym wypadku podobieństwo – pomiędzy dwoma obiektami. Dla Szymona Muszyńskiego rozpatrywanymi obiektami są utwory muzyczne, a metryka pozwala mu na ocenę podobieństwa ilościowego między nimi.

„Gdy widzimy wartość kilku liczb opisujących podobieństwo utworów, od razu możemy ocenić, czy dzieła są podobne do siebie czy nie. Rozwiązuje to jeden z podstawowych problemów, z którymi borykają się tradycyjne metody badania podobieństwa muzyki, czyli nieprecyzyjność i subiektywizm. Najprościej mówiąc – utwory porównuje się przez pryzmat tego, jak wiele spośród badanych fragmentów stanowi spójne i niepowtarzalne frazy zaczerpnięte z innego dzieła. Pociąga to za sobą konieczność posiadania szerokiej wiedzy domenowej, a równocześnie jest procesem dość żmudnym. Mój pomysł odpowiada na te wyzwania” – ocenia mgr inż. Muszyński.

Co łączy nuty i grafy?

W swojej pracy młody pasjonat zbadał podobieństwa utworów muzycznych poprzez ilościową i jakościową analizę powiązań poszczególnych nut wchodzących w skład porównywanych dzieł muzycznych. Opisał metody odwzorowania ścieżki dźwiękowej za pomocą struktury grafowo-sieciowej, zaproponował sposoby badania podobieństwa tak odzwierciedlonych utworów oraz przeanalizował wyniki uzyskiwane w różnych wariantach porównań.

„Graf reprezentuje utwór muzyczny, a jego wierzchołki – poszczególne nuty utworu.
Z kolei gałęzie, czyli powiązania między wierzchołkami, opisują, które nuty sąsiadują ze sobą, występują obok siebie na partyturze. Przykładowo – jeżeli utwór składa się kolejno z nut: C‑D-C-D‑E, to ich odwzorowaniem w grafie będą trzy wierzchołki – C, D, E, i trzy gałęzie: C łącząca się z D i odwzorowująca następstwo między 1. i 2. oraz 3. i 4. nutą, D – z C, czyli następstwo między 2. i 3. nutą oraz gałąź D z E, która obrazuje następstwo między 4. i 5. nutą. W sieci dodatkowo mamy możliwość opisania liczności powiązań” – wyjaśnia #młodyinnoWATor.

Analiza nuta po nucie

Autor pokazał też sposób odwzorowania ścieżki dźwiękowej na graf lub sieć stanowiące reprezentację utworu. W zależności od tego, jak szczegółowo potraktujemy poszczególne aspekty melodii, wynikowy graf będzie zawierał od kilku do kilku tysięcy wierzchołków.

„Grafy w zwartej formie opisują relacje pomiędzy nutami utworu. W zależności od tego, jak dokładnie chcemy odwzorować nutę w utworze, możemy albo uwzględnić tylko jej nazwę, albo nazwę i oktawę, z której pochodzi, a nawet nazwę, oktawę i wartość rytmiczną. Grafowa reprezentacja tego samego utworu będzie więc różna w zależności od tego, który sposób odwzorowania wybierzemy. W przypadku tej najprostszej reprezentacji graf będzie miał tylko kilka – kilkanaście wierzchołków, dla tej bardziej rozbudowanej – nawet dwa tysiące” – podkreśla Szymon Muszyński.

Następnie tak reprezentowane utwory są porównywane przez pryzmat strukturalno-ilościowej miary podobieństwa sieci zaproponowanej oryginalnie przez prof. Zbigniewa Tarapatę. Każdy graf lub każdą sieć można opisać za pomocą kilku macierzy, m.in. macierzy sąsiedztwa wierzchołków określającej to, które wierzchołki są ze sobą połączone za pomocą gałęzi czy macierzy incydencji pokazującej powiązanie wierzchołków z danymi gałęziami.

„Te macierze, jak również macierze zawierające wartości funkcji opisanych na wierzchołkach i gałęziach, służą do określenia podobieństwa poszczególnych wierzchołków jednego grafu do wierzchołków grafu reprezentującego drugi utwór. Iteracyjnie można wyznaczyć w ten sposób podobieństwo całych grafów – a w konsekwencji również utworów przez nie opisywanych – do siebie. W ten sposób oblicza się trzy wartości podobieństwa – kryteria porównania: strukturalne, etykiet wierzchołków i etykiet gałęzi. W efekcie po sformułowaniu i rozwiązaniu zadania optymalizacji wielokryterialnej z tymi trzema kryteriami wyznaczana jest wartość podobieństwa sieci reprezentujących oba dzieła. Tym samym badaniu podlega to, jak podobne są do siebie utwory w zakresie wykorzystywanych wierzchołków i gałęzi reprezentujących odpowiednio nuty i powiązania między nimi, jak również częstość ich występowania”– tłumaczy mgr inż. Muszyński.

Twórczy pomysł, praktyczne zastosowania

Zaproponowany przez #młodegoinnoWATora sposób sprawdzania, czy porównywane utwory są do siebie podobne i w jakim stopniu mają wspólną strukturę połączeń między nutami, jest nowatorski i kompleksowy. Dzięki temu, że ta metoda dostarcza pojedynczej, liczbowej wartości podobieństwa, pozostaje „nieuprzedzona” przez wcześniejsze doświadczenia i muzyczną biegłość ludzkiego operatora. W związku z tym może być wykorzystywana w różnych obszarach: od czysto muzycznych, czyli sprawdzania, czy tworzona aranżacja jest nadal podobna do oryginalnego utworu, po prawne.

Rozwiązanie to sprawdzi się szczególnie dobrze w poszukiwaniu plagiatów, aranżacji, czy ogólniej utworów, które są do siebie podobne. Badając zarówno podobieństwo strukturalne – powiązania między nutami, jak i ilościowe – wielokrotne występowanie określonych nut i ich sekwencji w ścieżkach dźwiękowych, pozwala na wykrycie wspólnego „rdzenia muzycznego” obecnego w analizowanych dziełach.

Plagiat z innej perspektywy

Jeszcze innym sposobem, według którego Szymon Muszyński ocenia utwory, jest wykorzystanie muzycznych odpowiedników miar charakterystycznych dla porównywania wzorców tekstowych – w szczególności miary Hamminga i Levenshteina. One również pozwalają na ocenę tego, jak podobne do siebie są dwie ścieżki dźwiękowe.

„Miary Hamminga i Levenshteina oryginalnie stosuje się do porównywania tekstów, ciągów znaków, czyli napisów. Określają one, ile znaków trzeba byłoby zmienić w jednym tekście, żeby uzyskać drugi z nich. Przykładowo między słowami „parka” i „farba” odległość wynosi 2, bo trzeba zmienić pierwszą literę: „p” na „f”, i czwartą: „k” na „b”, natomiast druga, trzecia i piąta litera są takie same w obu wyrazach. To samo robię w swojej pracy – tylko zamiast liter analizuję nuty. Czyli w odróżnieniu od metod, które bazują na grafowej czy sieciowej reprezentacji utworu, w tym przypadku porównuję utwory tak, jakby były „tekstami” złożonymi z liter specyficznego, muzycznego alfabetu”.

Wyniki pracy #młodegoinnoWATora sprawdzą się we wszystkich dziedzinach, w których wymagana jest ocena oryginalności wybranej ścieżki muzycznej. Mogą to być zarówno zastosowania prawne – np. spory o przywłaszczenie własności intelektualnej, dydaktyczne – kontrola plagiatowa prac w szkołach i na uczelniach muzycznych, czy kulturalne. Metodę z WAT można też wykorzystać do porównywania różnych utworów muzycznych i ich klasyfikowania do określonego gatunku.

Rozwiązanie podsunie nam najlepsze utwory?

Rezultaty pracy #młodegoinnoWATora z powodzeniem można zaimplementować w edytorach partytur (ang. scorewriter), czyli oprogramowaniu umożliwiającym kompozytorowi pisanie, edycję lub drukowanie partytur utworów muzycznych w formacie cyfrowym, oraz szerzej: w programach typu CAC (ang. computer-aided composition, czyli komponowanie wsparte komputerowo), co umożliwiłoby także kompozytorom i aranżerom badanie innowacyjności tworzonych przez nich utworów – i to wyjątkowo szybko, bo jeszcze w trakcie procesu twórczego.

Jako inne potencjalne zastosowanie metody mgr inż. Szymon Muszyński wskazuje klasteryzację, czyli przyporządkowywanie utworów do określonych gatunków na podstawie podobieństwa ich struktur z wybranymi, uprzednio skategoryzowanymi utworami.

Klasteryzację stosuje się np. w serwisach streamingowych, aby „podpowiadać” użytkownikowi utwory podobne do tych, które już zna i lubi. Możliwy jest dobór według gatunku, ale też innych cech utworu – jak choćby tempo, charakter czy użyte instrumenty.

Klasteryzacja sprawdzi się także w przypadku nowych utworów. Gdy autor skomponuje dzieło, można łatwo je przyporządkować do określonego gatunku. „Dzieje się to właśnie dzięki temu, że mierzymy odległość nowego dzieła względem różnych znanych systemowi utworów” – podkreśla doktorant WAT.

Na kim wzorowali się Beatlesi?

Badania przeprowadzone przez Szymona Muszyńskiego wykazały, że strukturalno-ilościowa miara podobieństwa daje bardzo dobre rezultaty w zakresie wykrywania plagiatów, coverów oraz aranżacji, czyli utworów podobnych do siebie. Oczywiście umożliwia ona także badanie podobieństwa zupełnie różnych ścieżek dźwiękowych.

„Porównanie przeprowadziłem w kilku wariantach – poza plagiatami zestawiłem m.in. różne utwory zespołu The Beatles. Analiza potwierdziła chociażby, że – pomimo różnej stylistyki – są one ponadprzeciętnie podobne do siebie. Zidentyfikowałem także kilka utworów muzyki pop i rock skomponowanych przez różnych artystów i okazało się, że ich podobieństwo jest jeszcze większe! Pokusiłem się również o porównanie tak odległych dzieł jak „Dla Elizy” Ludwiga van Beethovena i „We Will Rock You” zespołu Queen. Wyniki takich badań potrafią niekiedy naprawdę zaskoczyć” – mówi mgr inż. Szymon Muszyński.

Zmiana tonacji nie pomoże naśladowcom

Artykuł, w którym #młodyinnoWATor i jego promotor opisali opracowane rozwiązanie, jest pierwszą publikacją, która podejmuje w sposób systematyczny temat metod porównywania utworów za pomocą ich reprezentacji grafowo-sieciowej. Choć sam sposób reprezentacji był już opisywany, to dotychczasowe badania skupiały się jednak albo na innym zastosowaniu, np. generowaniu aranżacji muzycznych, albo na samym modelowaniu utworów przy pomocy grafów.

Temat porównywania utworów na podstawie grafu nie był jednak wcześniej rozwijany – a jest to perspektywiczna metoda. Po pierwsze, pozwala abstrahować od szczegółów utworu nieistotnych z punktu widzenia postawionego zadania, np. tonacji, dynamiki, tempa, bo opisywane metody grafowe pozwalają na badanie podobieństwa utworów z pominięciem tych aspektów. Liczą się tylko nuty i relacje pomiędzy nimi – między innymi to, które dźwięki często występują po sobie, a które nigdy nie znajdują się blisko siebie. Dzięki temu można wykryć plagiat, nawet jeśli został on popełniony w innej tonacji lub gdy utwór został napisany w innym tempie, ale ma takie same frazy muzyczne jak oryginał.

W końcu sama metoda porównania dzieł muzycznych skutkująca uzyskaniem pojedynczej miary opisującej podobieństwo ścieżek jest wygodna w użyciu – wartość liczbowa jest łatwa w interpretacji, umożliwia również zestawianie ze sobą wielu różnych utworów. Można również bazować na porównaniu trzech wartości kryteriów: podobieństwa strukturalnego oraz ilościowego, opisanego odpowiednio na wierzchołkach i gałęziach grafu.

Akademia talentów

Efektem pracy #młodegoinnoWATora jest również przygotowana rozprawa doktorska. Obecnie Szymon Muszyński łączy rozwój naukowy z pracą zawodową – jest programistą w firmie Britenet. Karierę zawodową rozpoczął już podczas studiów i od niemal 8 lat zajmuje się rozwojem oprogramowania, głównie dla branży ubezpieczeniowej i e‑commerce. Na swój projekt naukowy, w którym połączył pasje muzyczne oraz informatyczne, ma konkretny plan prowadzący do komercjalizacji. Chciałby go rozwijać i zrealizować w Wojskowej Akademii Technicznej.

„Podczas studiów w WAT niemałym zaskoczeniem było dla mnie to, jak wielu muzyków, nie tylko amatorskich, ale również osób z wykształceniem muzycznym, zrzesza nasz – techniczny przecież – wydział. Stereotypowo wydawać by się mogło, że techniczna uczelnia wojskowa i badania dotyczące sztuk muzycznych nie mogą iść ze sobą w parze. Ja podczas edukacji miałem jednak okazję połączyć moje dwa, pozornie odległe, obszary zainteresowań. Dzięki uczelni i otwartości mojego promotora prowadziłem badania w dość nietypowej dziedzinie zastosowań informatyki. Dzięki wsparciu, jakie otrzymałem, ten projekt mógł powstać, i to w ramach studiów” – podsumowuje #młodyinnoWATor.

 

Dominika Naruszko

fot. Katarzyna Puciłowska

 

Artykuł powstał w ramach cyklu #młodziinnoWATorzy, w którym prezentujemy projekty, prace naukowe i dyplomowe, nowoczesne rozwiązania ambitnych studentów Wojskowej Akademii Technicznej, dla których 100% to za mało.