Autoportret
ryc. Maciej Szydłowski


Maciej Szydłowski







Profil naukowy


Zajmuję się rozwojem metod komputerowych, bioinformatycznych i statystystycznych na rzecz analizy danych genetycznych i genomowych. Stosuję gotowe i własne metody w celu weryfikacji hipotez biologicznych. Skupiam się na identyfikacji polimorfizmów DNA, które kształtują cechy złożone zwierząt.






Last project financed by NCN


Identification of obesity risk variants in the dog genome using whole-genome sequencing.

Identyfikacja markerów otyłości psów przy pomocy sekwencjonowania całogenomowego.

Read more / Czytaj trochę
























Materiały dla studenta



Biostatystyka - nowe materiały dla studentów


Z przyjemnością udostępniam poszerzone i poprawione materiały dydaktyczne do Biostatystyki. Materiały opracowano pierwotnie z myślą o uczestnikach kursu Experimental Design. Materiały są uzupełnieniem innych źródeł i nie obejmują wszystkich metod, które są omawiane na kierunku Weterynaria. Szereg opisanych metod zilustrowano przykładowymi obliczeniami w środowisku R. Materiały są udostępnione bez opłat.

Get PDF



Dane do próbnych obliczeń i prezentacje

Materials and data for study



Experimental Design and Bioinformatics 2022-2023


Dear Students,
It was an incredibly rewarding experience for me. I've never derived so much satisfaction from any course before. The international atmosphere of the course was truly fantastic. I will cherish your dedication and the confidence you had in me for many years to come. My hope is that I've sparked in you a genuine interest in statistics and bioinformatics, motivating you to further cultivate your knowledge and skills independently.
Best wishes,
Maciej






Ostatnie publikacje



Ponowna analiza danych wskazuje potencjale przyczyny zaburzeń rozwoju płci


Zaburzenie rozwoju płci (DSD) to rozbieżność między chromosomami płci a płcią fenotypową. Celem mojego badania była identyfikacja genów i potencjalnie szkodliwych wariantów DNA warunkujących DSD. Przeanalizowałem publicznie dostępne dane z sekwencjonowania genomów 17 osobników DSD ras French Bulldog oraz American Staffordshire Terrier.

Analiza ujawniła nieznane wcześniej i bliskie pokrewieństwo u dotkniętych schorzeniem psów. Genów odpowiedzialnych za DSD poszukiwano więc w segmentach chromosomów, które mają identyczne pochodzenie wśród bliskich krewnych. W rasie French Bulldog zidentyfikowano 19 takich regionów chromosomowych, o łącznej długości zaledwie 65,9 milionów par zasad. Filtrowanie wariantów w obrębie tych regionów wskazało na możliwy udział genów AKAP2, PIWIL1, POLR3A i SH2D4B.

Raport naukowy opublikowano w czasopiśmie Animal Genetics. Publikacja jest dowodem na to, że w danych dostępnych w publicznych repozytoriach mieści się sporo nieodkrytych informacji. Ich wydobycie jest możliwe przy wykorzystaniu dedykowanych algorytmów bioinformatycznych. Raport stanowi jeszcze jeden argument na rzecz udostępniania danych badawczych.

Szydlowski M. (2023) A clue to the etiology of disorders of sex development from identity-by-descent analysis in dogs with cryptic relatedness. Anim Genet. 2023;54(2):166-176. doi:10.1111/age.13276

PubMed record






Czy długie ciągi homozygotyczności skrywają geny sprzyjające otyłości labradorów?


W genomach niektórych psów są fragmenty, w których obserwujemy wyłącznie homozygotyczne genotypy. Są to ciągi homozygotyczności (ang. RoH - runs of homozygosity). Gdy ciąg jest długi i zawiera setki homozygotycznych genotypów, trudno mówić o przypadku. Długi RoH wskazuje, że osobnik odziedziczył ten sam fragment chromosomu zarówno od ojca, jak i matki. Najwyraźniej ojciec i matka są spokrewnieni ze sobą i oboje otrzymali ten fragment od wspólnego przodka.

Identyfikacja długich ciągów homozygotyczności ma praktyczne znaczenie, gdy poszukujemy w genomie wariantów DNA odpowiedzialnych za rzadkie recesywne choroby monogenowe. Okazuje się, najdłuższe ciągi homozygotyczności w genomie chorego osobnika niosą nieproporcjonalnie wysokie prawdopodobieństwo skrywania wadliwego DNA, większe niż wynika to tylko z ich długości. Dlaczego najdłuższe ciągi są tak szczególne? To dłuższa historia do opowiedzenia, ale ważną w niej rolę odgrywa selekcja naturalna zwalczająca szkodliwe DNA.

W nowym raporcie naukowym podjęliśmy próbę odpowiedzi na pytanie, czy identyfikowanie długich ciągów homozygotyczności u otyłych labradorów może być przydatne przy poszukiwaniu szkodliwych genów odpowiedzialnych za otyłość. Wiadomo, że powszechna u labradorów otyłość to choroba poligeniczna, w której obok środowiska ważną rolę odgrywają liczne geny, prawie w ogóle jeszcze nie poznane. W naszym badaniu uzyskano pełne sekwencje DNA pięćdziesięciu psów, co stanowi znaczący wkład do relatywnie niedużej światowej kolekcji genomów tego ważnego gatunku modelowego.

Po skrupulatnej analizie statystycznej i bioinformatycznej stwierdzono, że długie ciągi homozygotyczności skrywają szkodliwe warianty otyłości z podobnym prawdopodobieństwem jak inne regiony genomu. Ciągi homozygotyczności nie będą więc wskazówka w poszukiwaniu genów otyłości. Prawdopodobnie, wpływy pojedynczych wariantów są na tyle mało szkodliwe, że nie stanowią celu wykluczającej selekcji naturalnej. Można przypuszczać, że podobne wyniki uzyskano by dla otyłości człowieka, będącej obecnie jednym z najważniejszych problemów społecznych.

Szydlowski M, Antowiak M. (2022) No evidence that long runs of homozygosity tend to harbor risk variants for polygenic obesity in Labrador retriever dogs. Journal of Applied Genetics, 63(3):557-561, DOI 10.1007/s13353-022-00693-0.

PubMed record



Dwoch
ryc. Maciej Szydłowski





Opinie



Współczynnik oddziaływania słabo mierzy oddziaływanie


Współczynnik oddziaływania (Impact Factor) ma mierzyć znaczenie czasopisma dla światowej nauki. Aby wyliczyć IF należy znać liczbę opublikowanych artykułów i liczbę ich cytowań. Przykładowo IF2022 = Cytowania2022 / [ Publikacje2020 + Publikacje2021 ].

Termin "Impact Factor" odnosi się do obliczeń wykonanych przez Clarivate na podstawie ich bazy danych Web of Science. Publikuje je w corocznym raporcie "Journal Citation Reports". Podobne obliczenia można jednak wykonać na podstawie innych baz danych. Scimago wykonuje obliczenia na podstawie bazy Scopus. Współczynnik SJR (Scimago Journal Rank) jest jednak bardziej skomplikowany i bierze pod uwagę źródło cytowań.

Najbardziej prestiżowe czasopisma (np. Science, Nature) mają najwyższe współczynniki oddziaływania. Najsłabsze tytuły, publikujące same prace przyczynkowe, szurają po dnie. Pośrodku jest jeszcze kilka tysięcy czasopism o szerokim spektrum wartości współczynnika oddziaływania. Jednak współczynnik ten nie mówi wprost o ich faktycznym znaczeniu.

Jeśli przyjmujemy, że oddziaływanie należy mierzyć liczbą cytowań w danym okresie, to czasopismo notujące więcej cytowań powinno otrzymać wyższy IF, niż tytuł o niższej liczbie cytowań. Ponieważ IF jest tylko [współ]czynnikiem, aby zrekonstruować znaczenie tytułu musimy przemnożyć go przez wolumen czasopisma.

Przykładowo, PLOS ONE opublikował w 2020 roku 16'685 artykułów, a jego IF wynosi ledwie 3,7. Natomiast Journal of Animal Science and Biotechnology opublikowal zaledwie 114 prac, a jego IF to aż 7,0. Ogólna liczba cytowań jest jednak miażdżąco większa po stronie PLOS ONE (w przybliżeniu 61,7 tys. vs. 0,8 tys.). To właśnie olbrzymie różnice w liczbie publikacji sprawiają, że sam współczynnik oddziaływania słabo odzwierciedla znaczenie czasopism.

Współczynnik oddziaływania odzwierciedla średnie zainteresowanie pracami opublikowanymi w czasopiśmie, jeśli mierzyć je liczbą cytowań w krótszym okresie. Powszechnie utożsamia się go z jakością i prestiżem czasopisma.

Jednak z uwagi na mały wolumen niektórych czasopism, IF może być mylący. O wysokim współczynniku oddziaływania może zadecydować jeden dobrze cytowany artykuł naukowy. Artykuły przeglądowe potrafią przyciągać sporą liczbę cytowań. Natomiast trudne w odbiorze prace teoretyczne wymagają czasu do pojawienia się pierwszych cytowań.

Jestem współautorem artykułów powstałych na bazie bardzo prostego schematu eksperymentalnego. Te raporty są pod tym względem bardziej naśladownictwem niż oddziaływaniem. Ponieważ podobne schematy eksperymentalne są stosowane przez wiele innych zespołów, moje raporty doczekały się pewnej liczby cytowań. Z kolei prace bardziej zaawansowane są mniej cytowane.

Dla redakcji i wydawców IF stał się celem. Większy IF przyciąga autorów oraz pieniądze. Redaktorzy czasopism mają narzędzia wspomagające decyzje o przyjęciu/odrzuceniu manuskryptu. Jedno z nich bada, jak często są cytowane wcześniejsze prace autorów. Tak jak w moim przypadku, może to sprzyjać popularnym tematom i typom badań.

Więcej publikacji oznacza większy zysk dla wydawnictwa. Chcąc zwiększyć wolumen bez szkody dla IF, nieuczciwe wydawnictwa sugerują autorom cytowanie prac z ich podwórka. Wydawnictwo MDPI ma wskaźnik autocytowań znacznie większy od pozostałych wydawnictw na rynku. Współczynnik SJR jest znacznie bardziej odporny na "kartele cytowań" niż prosty współczynnik IF. W skrajnej sytuacji Clarivate musi usunąć czasopismo i jego współczynnik IF ze swojej listy JCR.

Ministerialny system punktacji czasopism opiera się częściowo na współczynniku oddziaływania, a częściowo na analizie eksperckiej. To dobre rozwiązanie pod warunkiem, że analiza ekspertów jest traktowana z należytą powagą.






Wskaźniki naukometryczne czasem mydlą nam oczy


Popularne parametry naukometryczne nie wychwytują oczywistego faktu, że indywidualny udział współautora w każdym zespołowym artykule naukowym jest zaledwie cząstkowy.

Lubię rogale świętomarcińskie i porównuję ich smak między cukierniami. Gdyby ktoś zaproponował oceniać smak rogala na podstawie liczby jaj w przepisie, poznaniacy by go wyśmiali. Wskaźnik naukometryczny tak ocenia naukę jak liczba jaj smak rogala.

W czasach wysoce zorganizowanych i masowych badań naukowych parametry naukometryczne są przydatne, na przykład w administracyjnej ocenie skuteczności finansowania badań. Dwa najprostsze - liczba publikacji i cytowań - są bardzo popularne.

Jednak ich zastosowanie w ocenie indywidualnych osiągnięć jest problematyczne. Żaden z nich z osobna, ani wspólnie razem nie odzwierciedlają wystarczająco dobrze faktycznego postępu naukowego i znaczenia wytworzonej wiedzy, zwłaszcza gdy dorobek indywidualny jest ściśle powiązany z dorobkiem zespołu naukowego. Skrajnie sprzyjają autorom, którzy mają dużo prac, ale w każdej śladowy wkład.

Wykonanie specjalistycznej analizy lub organizowanie pracy zespołu uzasadnia współautorstwo każdego artykułu naukowego i winduje wskaźniki naukometryczne. Niektórzy rejestrują wskaźniki nieproporcjonalnie wysokie do swoich faktycznych osiągnięć. Popularne parametry naukometryczne nie wychwytują oczywistego faktu, że indywidualny udział w każdym zespołowym artykule naukowym może być zaledwie cząstkowy.

Liczba cytowań jest powiązana z liczbą publikacji. Cytat rejestrowany jest niezależnie od jego powodu. Cytat krytyczny lub odnoszący się do aspektu, z którym współautor nie miał nic do czynienia również zwiększa cytowalność. Cytat jest miarą oddziaływania, także tego negatywnego, gdy cytowana publikacja mylnie przekonuje o zidentyfikowanym zjawisku.

Przyglądając się uważniej osobom o wysokich wskaźnikach naukometrycznych zauważymy interesującą prawidłowość. Dużo publikują osoby z dwóch biegunów nauki: z jednej strony są to badacze o bardzo wąskiej specjalizacji, a z drugiej - o bardzo rozproszonych kompetencjach.

Liczbie publikacji sprzyja wysoka kompetencja i specjalizacja w zaawansowanej technice badawczej, która jest ważna dla szerokiego spektrum tematów badawczych, lub dysponowanie danymi. Nieodpłatna usługa analityczna lub udostępnienie danych uzasadnia autorstwo w artykule naukowym. Współautor nie zawsze bierze udział w wyborze tematyki, formułowaniu hipotezy i koncepcji badań. Rzadko ma udział w końcowej interpretacji łącznych wyników.

Na drugim biegunie stoi osoba o wysokich kompetencjach społecznych i rozproszonych zainteresowaniach. Często inicjuje i organizuje koncepcyjnie proste badania, ale ich realizację, wymagającą pogłębionych umiejętności, pozostawia innym. Nie współwykonuje, ani nie kontroluje jakości poszczególnych prac molekularnych, bioinformatycznych czy statystycznych. Stąd nie można jej określić liderem badań. Tu najważniejszym celem badań jest sama publikacja. Wydaje się, że największa liczba nagłośnionych przypadków nierzetelności naukowej dotyczy właśnie tej grupy.

Krzywy obraz nauki, jaki malują wskaźniki naukometryczne stał się podstawą awansów, nagród i przydzielania funduszy badawczych.






Nie każdy autor korespondencyjny to lider


Parę lat temu odwiedził mnie pewien badacz. Przyniósł dane ekspermentalne i zarysował mglistą koncepcję badań. Zaproponował, abym był ich jedynym realizatorem. Na bazie uzyskanych wyników miałem napisać artykuł naukowy. Zastrzegł dla siebie rolę autora korespondencyjnego. Odmówiłem.

Trzy dni poźniej spotkałem się z moim przyjacielem Krzysztofem, uznanym w świecie fizykiem. Gdy opowiedziałem Krzysztofowi o mojej przygodzie, nie był zdziwiony. Jego zdaniem, zjawisko organizowania sobie dorobku publikacyjnego jest dość powszechne. Dyskutując o takich organizatorach ukuliśmy termin menadżer publikacji.

Menadżer publikacji jest szybki, skuteczny i ma jasny cel. Umie delegować zadania. Doskonale sprawdziłby się w korporacji i osiągnął wytyczone cele sprzedaży. Tu produktem jest raport naukowy, a celem - jego publikacja.

Jest ogroma różnica między liderem badań a menadżerem publikacji. Dla menadżera publikacji wskaźniki naukometryczne są celem samym w sobie.

Menadżerów publikacji pewnie nigdy nie brakowało, jednak parametryzacja nauki kusi teraz wyjątkowo mocno do sztucznego podkręcenia dorobku mierzonego wskaźnikami.

Głównym celem staje się liczba publikacji. Menadżer preferuje proste i szybkie eksperymenty. Porzuca próby sformułowania ciekawszej hipotezy, teoretycznego rozwinięcia czy koncepcji niebanalnego eksperymentu.

Praktyką staje się porcjowanie wyników. Rezultaty jednego wielowątkowego doświadczenia publikowane są w kilku raportach naukowych zamiast w jednym.

Jakość badań staje się zagrożeniem, gdyż mocno spowalnia. Niektórzy rezygnują w ogóle z doskonalenia swych kompetencji. Nie mając umiejętności wykonywania, ani kontrolowania jakości pracy laboratoryjnej, informatycznej i statystycznej, menadżer publikacji utrudnia dostęp do surowych danych.

To marne podejście do nauki tryumfuje. Szkody dla etyki są oczywiste, ale nie mierzy ich żaden parametr.






Kto jest autorem rozprawy doktorskiej?


Zmiana formy rozprawy doktorskiej otwiera kwestię jej współautorstwa i funkcji

Rozprawę doktorską przygotowałem kilkadziesiąt lat temu. Dzisiaj do niej zaglądam niechętnie, gdyż nie chcę się konfrontować z jej oczywistymi brakami. Promotor starał się mocno by było ich jak najmniej. Wskazywał w maszynopisie najgorsze fragmenty, które wymagały gruntownej poprawy. Mniejsze braki akceptował, biorąc pod uwagę mój brak doświadczenia. Mimo wielkiej pomocy Promotora, czuję się jedynym autorem mojej rozprawy. Miała formę zeszytu i, jak oceniam, prezentowała średni poziom w dyscyplinie.

W tym właśnie czasie postęp pracy naukowej zaczęto mierzyć za pomocą wskaźników naukometrycznych. Jednostki naukowe zaczęły dbać, by wyniki badań upubliczniać w jak największej liczbie krótkich artykułów naukowych. Jedyną zalecaną formą rozprawy doktorskiej stał się cykl opublikowanych raportów naukowych, w których przygotowaniu doktorant odgrywa główną rolę. Rady dyscyplin określają minimalne wskaźniki naukometryczne.

Jestem pod wrażeniem doskonałości obecnie prezentowanych prac doktorskich. Zaplanowane z rozmachem wielowątkowe eksperymenty są profesjonalnie przeprowadzone i opracowane. Odbiera mi to ostatnią ochotę nostalgicznego zajrzenia do mojego skromnego maszynopisu.

Wysoka wartość nowych rozpraw doktorskich może świadczyć o tym, że średni poziom kandydata do stopnia doktora znacząco wzrósł, a kształcenie na poziomie doktorskim jest efektywniejsze. Jednak jako statystyk amator wiem, że takie skokowe zmiany są małoprawdopodobne. Nasuwa się inna myśl, że wzrost jakości doktoratów ma związek z wymogami stawianymi dzisiaj pracom doktorskim.

Gdy rozprawa doktorska jest kompilacją zespołowych artykułów naukowych, pojawia się pytanie, czy każdy doktorant może czuć się w pełni jedynym autorem swojej rozprawy. Obawiam się, że niektórym kandydatom do stopnia doktora to oczywiste prawo jest odbierane.

Przeprowadzenie zaawansowanego eksperymentu wymaga połączenia kompetencji wielu osób, a zredagowanie profesjonalnego manuskryptu dojrzałości, która dla młodego badacza może nie być dostępna. Przeglądając oficjalne oświadczenia autorów o udziale w raportach naukowych coraz częściej czytamy, że doktorant zredagował jedynie draft, czyli pierwotną wersję pracy. Znam przypadki, kiedy wersja opublikowana nie zawiera śladu wersji pierwotnej.

Na ostateczną treść każdego artykułu mają wpływ wszyscy współautorzy. Zdarza się, że jest ich kilkunastu, a licząc cykl artykułów łącznie - kilkudziesięciu. Wśród nich jest wielu profesjonalistów, którzy nie przepuszą w manuskrypcie żadnego niedociągnięcia. Gdy chodzi o interpretację wyników, mamy ich uśredniony pogląd. Na treść artykułu mają wpływ także recenzenci i redaktorzy czasopism, którzy wymuszają zmiany i uzupełnienia.

Zmiana formy rozprawy doktorskiej, od zeszytu do cyklu publikacji, nie sprowadza się jedynie do postaci doktoratu, ale otwiera też kwestię współautorstwa. Równoczesnej zmianie ulega funkcja, jaką pełni rozprawa doktorska.

W tym miejscu zastrzegam, że nie zamierzam w żadnej mierze podważać legalności nadawanych obecnie stopni doktora. Każdy doktorant przygotowuje pracę zgodną z wymogami stawianymi przez radę dyscypliny. Chodzi mi raczej o przyjrzenie się samym wymogom i funkcji, jaką ma odgrywać rozprawa doktorska.

Rozprawa doktorska, której podstawą jest kosztowny eksperyment powstaje z reguły w ramach realizacji projektu badawczego NCN lub innego dyspozytora środków budżetowych. Doktorant dołącza do zespołu badawczego po zatwierdzeniu finansowania, gdy tematyka badań, hipotezy badawcze, metody i koncepcja eksperymentu są już dawno sformułowane. W tych fundamentalnych etapach pracy naukowej doktorant nie bierze żadnego udziału.

Współczesna rozprawa doktorska w coraz większym stopniu zaświadcza o przygotowaniu kandydata do pracy w zespole realizującym ustalony plan badawczy, a w coraz mniejszym o jego umiejętności prowadzenia samodzielnych badań. W wielu dyscyplinach praca w zespole jest kluczowa, więc doktorat staje się przydatnym świadectwem takiej umiejętności.

Jednak zgodnie z ustawą rozprawa ma świadczyć o pewnej samodzielności w rozwiązywaniu problemu naukowego. Może to być problem całkiem niewielki, cel adekwatny dla młodego badacza. Udział w przygotowaniu zespołowej publikacji naukowej o takiej samodzielności nie świadczy wystarczająco dobrze. Rozprawa doktorska zatraca więc swoją podstawową funkcję.

Z krótkiej formy, jaką jest artykuł naukowy, nie da się wyodrębnić samodzielnej części stanowiącej całościową myśl rozprawy doktorskiej. Uzupełnienie cyklu o dodatkowe opracowanie przygotowane wyłącznie przez doktoranta nie rozstrzyga jednoznacznie kwestii autorstwa.

Może warto zastanowić się nad zmianą ustawy definiującej funkcję rozprawy doktorskiej. Funkcja taka może zostać ustalona na nowo dla dyscyplin, w których wiodącą rolę odgrywają zaawansowane, wielowątkowe eksperymenty i krótkie formy publikacyjne. Innym rozwiązaniem jest powrót do tradycyjnej formy rozprawy, wytaczanie kandydatom celów adekwatnych do etapu kariery, oraz formułowanie zadań, które mogą osiągnąć samodzielnie w czasie czteroletnich studiów doktoranckich.

Mocno zalecam to drugie rozwiązanie. Powiązanie rozprawy doktorskiej z parametrami naukometrycznymi pogłębia słabość współczesnej nauki. Powszechnie stosowane wskaźniki stały się celem samym w sobie. Gwałtowny wzrost liczby zgłaszanych do publikacji manuskryptów napędza przemysł nieuczciwych czasopism. Równolegle ujawniana jest ogromna skala nierzetelności naukowej po stronie autorów. Młodzi badacze zmuszeni do utożsamiania celu naukowego z parameterm naukometrycznym nie odwrócą tego chorego trendu.






Pretensja
ryc. Maciej Szydłowski





Algorytmy



CITIUS


Citius is a linux software to apply Markov Chain Monte Carlo (MCMC) method to calculate multilocus genotype probabilities and to analyse genes shared identical by descent (IBD).

Read more