De similariteitsscore van Turnitin: wat betekenen de percentages?
Wat is de Turnitin similariteitsscore?
Turnitin is een online tool die door veel scholen wordt gebruikt om ingeleverde papers en scripties te vergelijken met een enorme database aan teksten. Wanneer jij je document uploadt, checkt Turnitin of stukken tekst overeenkomen met eerder gepubliceerde bronnen, websites of ingediende studentenopdrachten. Elke overlap wordt gemarkeerd in een Similarity Report. Het percentage overlap, de similariteitsscore dus, is eigenlijk gewoon het deel van jouw tekst dat ook in andere bronnen voorkomt.
Belangrijk: Turnitin detecteert op zichzelf geen “plagiaat”, maar alleen overeenkomende tekst. Dat betekent dat het programma niet kan onderscheiden waarom iets overeenkomt. Ook correct gebruik van bronvermelding en citaten levert een match op. Turnitin markeert bijvoorbeeld letterlijk overgenomen citaten (zelfs met aanhalingstekens en bronvermelding) als overeenkomst. Dit is op zich normaal en geen probleem, zolang duidelijk is dat je citeert. De docent of examencommissie moet uiteindelijk beoordelen of de overeenkomsten gerechtvaardigd zijn of op plagiaat duiden.
Lees ook: Plagiaat omzeilen? Met deze tips hoef je niet bang te zijn voor de plagiaatcontrole
Hoe wordt de Turnitin simliariteitsscore berekend?
Een score van bijvoorbeeld 12% betekent dat 12% van jouw tekst terugkomt in de Turnitin-database. Die database is gigantisch. Van websites (actueel en gearchiveerd) tot ingeleverde scripties en tijdschriftartikelen. Dat jouw werk enige overlap vertoont met zo’n brede databank is heel normaal. Sterker nog, Turnitin zelf geeft aan dat het volkomen gebruikelijk is dat een inzending deels overeenkomt met de database. Denk aan standaardformuleringen, definities of veelgebruikte vaktermen; die zullen bij anderen ook voorkomen.
Wat betekenen de kleuren en percentages in Turnitin?
Turnitin geeft de similariteitsscore niet alleen als percentage, maar ook met een gekleurd indicatoricoontje. De kleur correspondeert met een bepaald percentagebereik van overeenkomsten.
Blauw: 0% overeenkomende tekst (er is niets in jouw tekst gevonden dat overeenkomt met andere bronnen. Dit is vrij zeldzaam).
Groen: 1% – 24% overeenkomende tekst (een laag percentage overlap, meestal een paar woorden of korte zinsneden hier en daar).
Geel: 25% – 49% overeenkomende tekst (matig wat overlap: een redelijk groot deel van je tekst komt ergens anders voor).
Oranje: 50% – 74% overeenkomende tekst (hoog percentage overeenkomsten. Meer dan de helft van je tekst matcht met andere bronnen).
Rood: 75% – 100% overeenkomende tekst (zeer hoog: drie kwart of meer van je tekst komt overeen met andere bronnen).
Deze scores lopen dus van 0% tot 100%. In de praktijk zul je meestal een groene of gele score zien. Blauw (0%) is, zoals gezegd, vrijwel ongebruikelijk. Bijna elke tekst bevat wel íets dat al eens eerder zo is geschreven (denk aan een definitie of bekende uitdrukking). Een rode score (75%+) is zeer hoog: dan bestaat het merendeel van je tekst uit content die ook ergens anders is gevonden. Maar zelfs dan hoeft het niet per se frauduleus te zijn.
Let op: de kleuren in Turnitin zijn alleen een indicatie.
Ze vertellen niets over de kwaliteit van de overeenkomsten. Een groene 20% en een gele 40% zeggen op zichzelf nog niks over of je wel of niet plagiaat hebt gepleegd. Het gaat erom wát er overeenkomt. Je moet dus altijd in het rapport zelf kijken waar die overeenkomsten zitten en wat voor tekst het is. Lees ook: Hoeveel procent plagiaat mag je hebben?
Betekent een hoge Turnitin-score dat je hebt geplagieerd?
Nee. Een hoge Turnitin-score betekent niet automatisch dat je plagiaat hebt gepleegd. Dit is ontzettend belangrijk om te beseffen, zowel voor studenten als voor docenten. De similariteitsscore is een ruwe aanwijzing. Een computeralgoritme dat textuele overeenkomsten telt. Het kan niet beoordelen waarom die tekst overeenkomt. Elk percentage boven 0% moet dus met gezond verstand bekeken worden.
→ Voorbeeld: Stel, jouw essay geeft een score van 30% geel. Dat klinkt hoog, want bijna een derde van je tekst komt ergens anders voor. Maar alsje goed kijkt, bestaat die 30% voornamelijk uit je literatuurlijst, een aantal citaten van onderzoekers (keurig tussen aanhalingstekens) en wat standaardzinnen uit de vraagstelling die je hebt herhaald. Niets van dat alles is plagiaat. Je hebt gewoon netjes bronnen vermeld en de opdrachttekst verwerkt. Turnitin markeert het toch, want ja, die stukken tekst staan ook ergens anders. Bijvoorbeeld in boeken, artikelen of in de opdrachtomschrijving. In zo’n geval is 30% totaal onschuldig.
Hoe gaan scholen hiermee om?
Veel Nederlandse scholen hanteren een grens, bijvoorbeeld 15%. Alles daarboven bekijken ze extra. Maar let op:
Ook onder de 15% kan plagiaat zitten
Ook boven de 15% kan alles correct zijn
Soms kijken scholen alleen naar het percentage, zonder de inhoud te controleren. Als je een plagiaatbeschuldiging krijgt puur omdat "Turnitin zegt 40%", dan mag je uitleg vragen en je situatie toelichten. Je hebt daar het volste recht toe. Er moet altijd met gezond verstand naar de inhoud gekeken worden.
Twijfel je? De Studentenadvocaat helpt je graag.
Waarom kan een onschuldige tekst toch een hoge score geven?
Er zijn meerdere situaties waarin je een forse similariteitsscore kunt krijgen, zelfs als je eigenlijk niks verkeerd hebt gedaan. Laten we een paar scenario’s op een rij zetten:
Je hebt veel bronnen geciteerd.
Stel je onderzoeksrapport bevat tientallen citaten en een lange literatuurlijst. Dat is op zichzelf prima. Je moet nu eenmaal bronnen citeren in academisch werk. Maar Turnitin zal al die geciteerde zinnen én de titels/auteurs in je bronnenlijst herkennen, want die staan logischerwijs ook in de oorspronkelijke bronnen of andere studentenverslagen. Gevolg: het percentage schiet omhoog.
Op de website van Turnitin staat dat deze situatie voorkomen had kunnen worden door citaten en de bibliografie uit te sluiten van de check. Docenten kunnen namelijk in Turnitin instellen dat bijvoorbeeld alles tussen aanhalingstekens, of de laatste pagina’s met referenties, niet meegeteld worden om dit effect te verminderen. Lees ook: Hoe wordt er gecontroleerd op plagiaat?
Je hergebruikt (delen van) eigen werk.
Heb je eerder een essay of conceptversie via Turnitin ingeleverd en lever je later (al dan niet per ongeluk) dezelfde tekst nogmaals in? Dan kun je een 100% match krijgen; jouw hele tekst komt immers overeen met je eerdere inzending. Zo’n hoge score lijkt dramatisch, maar hier is duidelijk geen diefstal van andermans werk: het is jouw eigen tekst. Toch kan de scanner het in eerste instantie als volledige overlap zien. Zelfplagiaat (eigen werk hergebruiken) kan overigens door een school ook als overtreding gezien worde Dus wees hier toch voorzichtig mee of overleg met je docent.
Toevallige overeenkomsten / veelvoorkomende zinnen.
Turnitin kan korte stukjes tekst markeren die eigenlijk onbelangrijk zijn. Bijvoorbeeld de vraagstelling uit je opdracht zal bij iedereen als overeenkomst verschijnen. Of algemenere zinnen als “In dit verslag zal worden onderzocht…”: zulke standaardformuleringen zie je overal. Meestal filtert Turnitin hele korte overeenkomsten er wel uit, maar niet altijd alles. Het systeem ziet enkel dat de woordenreeks voorkomt in bron X, niet dat het een generieke zin is. Dit kan bijdragen aan je percentage. Gelukkig hechten de meesten hier weinig waarde aan; het is duidelijk dat je niet kunt verzinnen dat “In dit verslag” anders verwoord moet worden.
Je naam of veel gebruikte termen.
Zelfs je eigen naam kan soms een match opleveren. Als bijvoorbeeld je naam eerder ergens online staat (bijv. een eerdere scriptie in de database), herkent Turnitin die als overlap. In de Turnitin-handleiding wordt genoemd dat als een student eerder iets indiende met zijn naam erop, de naam bij latere inzendingen gemarkeerd kon worden. Dat is natuurlijk geen plagiaat, jij bent nu eenmaal de auteur. Dit soort onzinnige matches kun je negeren of de docent kan instellen dat kleine overeenkomsten (bijv. tot 10 woorden) worden uitgesloten, zodat namen niet steeds opduiken.
Samenwerking
Heb je samen met iemand anders samengewerkt terwijl dat niet mocht, of heeft een studiegenoot jouw werk ingezien? Turnitin kan onderling overeenkomende studentteksten ook signaleren. Bijvoorbeeld: student Jan levert stiekem het paper van klasgenoot Piet in als het zijne. Jan krijgt 25% omdat delen van Piet’s werk al ergens (bij Piet zelf) bekend waren. Wanneer Piet even later zijn échte versie inlevert, krijgt hij 100%, want haar hele tekst stond al in Turnitin (via Jan).
Turnitin voert na de deadline vaak een laatste vergelijking tussen alle ingeleverde papers om dit soort onderlinge kopieeracties aan het licht te brengen. Voor jou als eerlijke student is dit minder relevant, maar het verklaart wel dat je score omhoog kan gaan als iemand anders ongeoorloofd jouw tekst heeft gebruikt. In dat geval ben jíj natuurlijk het slachtoffer, en zul je moeten uitleggen dat jouw werk is misbruikt (dat is weer een heel ander verhaal).
Een hoge score moet dus altijd in context worden gezien. Een goede docent kijkt niet alleen naar het percentage, maar ook naar wat er is gemarkeerd:
Vooral citaten en bronnen? → Waarschijnlijk geen probleem
Een groot stuk tekst zonder bronvermelding? → Dat is wél zorgelijk
Welk Turnitin-percentage is “normaal” of acceptabel?
Deze vraag leeft bij veel studenten: hoeveel overlap mag ik hebben zonder in de problemen te komen? Officieel is het antwoord: 0%. Plagiaat is immers per definitie niet toegestaan, dus in theorie zou je werk helemaal uniek moeten zijn. Maar in de praktijk is een beetje overlap onvermijdelijk en vaak onschuldig. Scholen beseffen dat meestal ook.
Veel hogescholen en universiteiten hanteren daarom informele streefwaarden of drempels.
De meeste onderwijs instellingen beschouwen een overeenkomstpercentage ergens tussen 5% en 8% als “normaal”. Dat wil zeggen: zo’n score wekt geen argwaan en zal doorgaans zonder gedoe worden geaccepteerd.
Scoor je hoger, bijvoorbeeld richting de 10-15%, dan gaan ze vaak even met een scherper oog kijken.
Bij een overeenkomstpercentage van 15% of meer zal hoogstwaarschijnlijk een onderzoek plaatsvinden naar die overeenkomsten. Dat betekent niet direct een straf; het betekent dat je docent of de examencommissie gaat uitpluizen waarom het zo hoog is. Ze bekijken de gemarkeerde stukken en beoordelen of dat gerechtvaardigd gebruik van bronnen is of mogelijk plagiaat.
Onze vuistregel bij de similariteitsscore van Turnitin:
Probeer je werk zo origineel mogelijk te houden, maar raak niet in paniek van een beetje groen of geel in Turnitin. Als jij netjes citeert en parafraseert, zou een iets hoger percentage geen probleem mogen zijn. Een enkel cijfer zegt niet alles. Zelfs Scribbr benadrukt dat niet alle gemarkeerde overeenkomsten echt plagiaat zijn. Vaak worden ook correcte citaten, referentielijsten of standaardzinnen gemarkeerd. Het komt erop neer dat jíj en de docent moeten nagaan of de overeenkomsten geoorloofd zijn. Eén ding is zeker: heb je daadwerkelijke plagiaatfragmenten in je tekst (stukken gekopieerd zonder bron), dan wil je die hoe dan ook corrigeren of verwijderen, ongeacht het precieze percentage dat eruit rolt.
Wat moet ik doen bij een (te) hoge Turnitin-score?
Als je na uploaden van je verslag een onverwacht hoge similariteitsscore ziet, blijf rustig. Ga systematisch na wat de oorzaak is. Enkele tips om goed met de situatie om te gaan:
1. Bekijk het rapport.
Klik in Turnitin op het percentage om het Similarity Report te openen. Daar zie je jouw tekst met alle gemarkeerde passages en de bronnen waarmee ze overeenkomen. Analyseer per fragment wat er aan de hand is. Is het een citaat dat je al had voorzien van aanhalingstekens en bron? Dan is er niks aan de hand, dat kun je zo laten. Is het een stuk tekst dat je per ongeluk vrijwel letterlijk uit een bron hebt overgenomen zonder verwijzing? Oeps. Dan is dat plagiaat en moet je dat stuk herformuleren of alsnog van een correcte bronvermelding voorzien. Loop alle gemarkeerde overeenkomsten langs en bepaal of ze legitiem zijn of niet.
2. Verbeter wat nodig is.
Voor zover je nog de kans hebt om je werk aan te passen (bijvoorbeeld bij een conceptversie of als de deadline nog niet voorbij is), pas eventuele risicovolle overeenkomsten aan. Herschrijf stukken tekst in je eigen woorden of voeg alsnog citaten en bronnen toe waar nodig. Turnitin zal die aanpassingen bij een her-check meestal als nieuw zien, of jouw score zal flink zakken. Weet dat gewoon wat woorden vervangen door synoniemen meestal niet genoeg is om echte overlap te verhullen. Herformuleer dus grondig in je eigen stijl, of citeer duidelijk als het echt letterlijk moet.
3. Licht context toe aan je docent.
Heb je gezien waarom jouw percentage hoog is (bijv. “het komt vooral door mijn literatuurlijst en die twee lange citaten”)? Dan kan het geen kwaad om dit proactief te melden bij je docent wanneer je je werk inlevert. Je zou bijvoorbeeld kunnen aangeven: “Let op, Turnitin geeft 40% aan, maar dat komt omdat ik veel geciteerd heb en een bijlage met wetteksten heb toegevoegd. Die zijn natuurlijk herkenbaar.” Zo toon je dat je eerlijk bent en zelf ook hebt gecheckt. Veel docenten waarderen die transparantie en zullen dan begrijpen dat de score te verklaren is.
4. Krijg je vragen of een beschuldiging? Bereid je voor.
Stel, je docent of de examencommissie vindt je score zorgelijk en start een gesprek of onderzoek. Geen paniek: dit is je kans om jouw kant uit te leggen. Verzamel bewijs van je schrijfproces. Werkte je in Google Docs of Word? De versiegeschiedenis kan laten zien dat je het werk geleidelijk zelf hebt geschreven. Dat is iets wat een plagiaatpleger of AI-tool niet heeft. Heb je conceptnotities, schetsen of eerdere drafts? Bewaar die, ze tonen jouw eigen inspanning. Je mag van de school verwachten dat ze specifiek aangeven welke passages plagiaatverdacht zijn. Loop samen met hen die stukken na en leg uit waar ze vandaan komen.
5. Weet dat één hoge score geen vonnis is.
Volgens de regels mag een Turnitin-rapport nooit het enige en definitieve bewijs van plagiaat zijn. Er moet altijd menselijk oordeel bij komen kijken. Veel onderwijsinstellingen erkennen dat inmiddels ook: ze gebruiken de plagiaatscore als indicatie, niet als eindbeslissing. Mocht je het gevoel hebben dat je onterecht wordt afgerekend op een cijfer zonder gehoord te worden, dan kun je in verweer gaan. De Studentenadvocaat heeft veel ervaring met plagiaatzaken en probeert altijd het best mogelijke resultaat voor je te behalen. Neem daarom contact met ons op.
6. Schakel tijdig hulp in als het serieus wordt.
Dreigt de examencommissie je een sanctie op te leggen? Dan heb je formeel het recht om in beroep te gaan tegen dat besluit. Dat doe je meestal bij het College van Beroep voor de Examens (CBE) van je onderwijsinstelling. Zo’n procedure is best spannend en vergt een goede onderbouwing. Je hoeft dat niet alleen te doen. Neem contact op met De Studentenadvocaat. Wij hebben veel ervaring met plagiaatzaken en kunnen je helpen je zaak duidelijk te maken en je rechten te verdedigen. Vaak kunnen we zo goed als gratis bijstand verlenen aan studenten. Het belangrijkste: sta op voor jezelf als je onterecht wordt beschuldigd.
Herkent Turnitin ook AI-gegenereerde tekst?
Sinds 2023 heeft Turnitin een extra functie: naast de plagiaatscore laat het docenten ook zien hoeveel van je tekst mogelijk door een AI (kunstmatige intelligentie) geschreven is. Dit is Turnitin’s beruchte AI-detectie. Je hebt misschien gehoord dat je rapport een tweede percentage kan bevatten, bijvoorbeeld “97% AI-geschreven”. Schrikbarend als je zelf hebt zitten zwoegen. Maar hoe betrouwbaar is dat?
De realiteit: Turnitin’s AI-detector is nog lang niet perfect. Het systeem probeert op basis van kenmerken in je tekst te raden of die door een mens of door een tool als ChatGPT is geschreven. Hierbij let het op dingen als: vloeiendheid, variatie in zinslengte, woordkeuze, enz. Een erg uniforme tekst zonder fouten, met elke zin in hetzelfde ritme, kan voor een AI-tekst worden aangezien. Turnitin geeft docenten dan een indicatie in procent (bijv. “90% waarschijnlijk AI”). Maar dat cijfer moet met een grote korrel zout genomen worden. Lees ook: Kunnen docenten zien dat ik AI heb gebruikt?
Veelgehoorde problemen bij AI-detectietools zoals Turnitin’s AI checker
Studenten die geen moedertaalsprekers Nederlands (of Engels) zijn, schrijven vaak extra verzorgd. Ze letten goed op hun grammatica en zetten hun zinnen misschien wat formeler op. Ironisch genoeg kan precies dat hun tekst meer als AI laten overkomen. De AI-detector denkt: dit is wel erg foutloos en netjes voor een tweedetaalleerder, zal wel ChatGPT zijn. Dat is natuurlijk een oneerlijke conclusie.
Gebruik je tools als Grammarly of andere spelling/grammaticacontrole om je tekst te perfectioneren? Dan loop je ook kans dat Turnitin je werk “te perfect” vindt AI-modellen produceren ook foutloze, goedgebekte zinnen. Dus een door de software gecorrigeerd essay kan lijkt qua stijl soms op AI-tekst.
Teksten die jaren geleden door mensen zijn geschreven, worden soms tóch door de detector aangemerkt als AI. Dit geeft aan dat de technologie behoorlijk wat ruis heeft en niet feilloos menselijke vs. AI-tekst kan onderscheiden. De eigenschappen van “AI-taal” en “mensen-taal” overlappen nu eenmaal; een goed schrijfvaardige persoon kan net zo klinken als een generieke chatbot.
Kan jouw school je straffen op basis van dat AI-percentage?
Nee, niet zonder meer. Zelfs Turnitin zelf waarschuwt dat hun AI-check niet 100% nauwkeurig is. Een hoge AI-score alleen is géén sluitend bewijs dat je fraude hebt gepleegd. Onderwijsinstellingen zouden dit enkel als aanknopingspunt mogen gebruiken, waarna ze in gesprek moeten gaan en eventueel ander bewijs moeten verzamelen. In de praktijk zijn veel docenten ook voorzichtig met AI-detectie: ze weten dat vals alarm vaak voorkomt. Sommigen negeren die AI-indicator zelfs volledig, zeker als de student bekendstaat als goed schrijver. Zie ook: AI voor studenten: waarom je er niet blind op moet vertrouwen.
(Over dit onderwerp hebben we trouwens nog een apart artikel: “Turnitin’s plagiaat checker: hoe goed herkent het AI?” met nóg meer tips om met AI-detectors om te gaan. Zeker de moeite waard als je hier meer over wilt weten.)
Let op: Heb je wél (deels) ChatGPT of een andere AI gebruikt bij het maken van je opdracht? Realiseer je dan dat dit kan worden gezien als een vorm van plagiaat of fraude. Je neemt dan immers werk van een ander (zij het een computer) over zonder bronvermelding. Ons advies is om hier eerlijk over te zijn richting je docent. Vooraf. Steeds meer scholen staan beperkt AI-gebruik toe, mits je vermeldt hoe en waarvoor je het hebt gebruikt. Bijvoorbeeld: “Ik heb ChatGPT geraadpleegd voor ideeën over hoofdstukindeling.” Door het te benoemen, voorkom je dat een docent zich verraden voelt als het toch uitkomt. Bovendien toon je academische eerlijkheid. In je bronvermelding kun je AI als hulpmiddel noemen. Er bestaan inmiddels richtlijnen, APA heeft zelfs een format voor het citeren van AI-content.
Wat te doen bij onterechte AI-beschuldiging?
Eigenlijk hetzelfde als bij plagiaat: vraag om een gesprek, laat je schrijfproces zien, blijf beleefd maar standvastig uitleggen dat jij de auteur bent. Als je elke alinea zelf hebt opgebouwd, kun je dat vaak aantonen. Laat eventueel je tekst door een andere detector halen om Turnitin’s bevinding te vergelijken. Uiteindelijk geldt weer: je hebt rechten als student. Je kunt niet veroordeeld worden op basis van een vermoeden van AI-gebruik. Er moet hard bewijs zijn van overtreding van de regels.
Je hebt recht om je kant van het verhaal te vertellen. Blijkt de school toch onredelijk streng, dan kun je in beroep gaan. Schakel dan ook De Studentenadvocaat in voor advies en bijstand. Zo sta je sterker in zo’n procedure en vergroot je de kans op een rechtvaardige uitkomst. Iedereen maakt aanspraak op een eerlijk oordeel, dus vecht het aan als je ten onrechte wordt beschuldigd.
Veelgestelde vragen over Turnitin-scores:
-
De similariteitsscore is het percentage van jouw tekst dat overeenkomt met andere bronnen in de Turnitin-database. Bijvoorbeeld een score van 10% betekent dat 10% van jouw zinnen of woorden teruggevonden is in eerder gepubliceerd materiaal. Het is belangrijk te weten dat dit percentage alle overeenkomsten telt. Ook correcte citaten en veelgebruikte zinnen, en niet per se plagiaat aangeeft. Lees ook: Hoeveel plagiaat mag je hebben?
-
Een echt veilig percentage bestaat niet zwart-op-wit, maar doorgaans wordt een lage score (bijv. onder ~5%) als geen reden tot zorgen gezien. Veel onderwijsinstellingen bekijken bij >10% even wat er speelt, en bij >15% volgt bijna altijd een check. Toch kan een hoger percentage ook onschuldig zijn. Zolang je netjes citeert en geen tekst zonder bron overneemt, zit je inhoudelijk veilig. Ongeacht het percentage.
-
Niet noodzakelijk. Een score van 30% betekent dat 30% van je tekst overeenkomt met iets uit de database, maar dat kan door allerlei oorzaken komen. Het hangt ervan af wat die 30% is. Zijn het bijvoorbeeld citaten, titels of veelvoorkomende zinnen, dan is er geen probleem. Pas als een groot deel letterlijk overgenomen is zonder bronvermelding, is het plagiaat.