Proberen en fouten maken. Leermethode ontdekt

Wetenschappers hebben ontdekt dat de hersenen een dubbel mechanisme gebruiken om te leren door vallen en opstaan. Dit verklaart hoe gewoontes worden gevormd en kan helpen bij het leggen van de basis voor behandelstrategieën voor aandoeningen zoals verslavingen of dwangmatig gedrag.
Het onderzoek, onder leiding van neurowetenschappers van het Sainsbury Wellcome Centre (SWC) aan het University College London (UCL) en uitgevoerd bij muizen, kan ook bijdragen aan de ontwikkeling van therapieën voor de ziekte van Parkinson.
Bij de leermethode van vallen en opstaan probeer je verschillende opties totdat je er een vindt die werkt. Ondertussen leer je van je fouten, zo meldde Efe op woensdag.
"We hebben een mechanisme gevonden waarvan we denken dat het verantwoordelijk is voor gewoontes. Zodra je een voorkeur voor een bepaalde handeling ontwikkelt, kun je het op waarden gebaseerde systeem omzeilen en gewoon vertrouwen op het standaardbeleid van wat je in het verleden hebt gedaan", aldus Marcus Stephenson-Jones, groepsleider bij SWC en hoofdauteur. Dit maakt de hersenen ook vrij voor andere taken.
Onderzoekers hebben een dopaminesignaal (een neurotransmitter) in de hersenen ontdekt dat als een ander type leersignaal fungeert dan voorheen bekend was.
Het was bekend dat dopaminesignalen in de hersenen fouten in de voorspelling van beloningen (RPE's) veroorzaken, die het individu laten weten of een optie beter of slechter is dan verwacht (dit is het circuit dat individuen aanzet tot het zoeken naar plezier).
In deze nieuwe studie ontdekten de auteurs dat er naast fouten in de beloningsvoorspelling ook een extra dopaminerge signaal is, genaamd actievoorspellingsfout (APE), dat bijwerkt hoe vaak een actie wordt uitgevoerd.
Deze twee leersignalen zorgen ervoor dat individuen (in dit geval ratten) op twee verschillende manieren kunnen leren een keuze te maken: leren kiezen voor de meest waardevolle optie of de meest voorkomende optie, zo bleek uit het onderzoek.
Stel je voor dat je naar je lokale koffiezaak gaat. De eerste keer dat je erheen gaat, duurt het misschien even voordat je een broodje kiest, en afhankelijk van welke je kiest, vind je hem misschien wel of niet lekker. Maar als je vaker naar de koffiezaak gaat, verspil je geen tijd aan nadenken over welke snack je moet kiezen en kies je in plaats daarvan meteen een die je lekker vindt. Wij denken dat het dopaminerge signaal van de EPA ervoor zorgt dat dit standaardbeleid wordt opgeslagen," legde Stephenson-Jones uit.
Bovendien biedt dit nieuw ontdekte leersysteem een veel eenvoudigere manier om informatie op te slaan dan wanneer u de waarden van verschillende opties direct met elkaar moet vergelijken. Hierdoor heeft uw brein meer tijd om meerdere taken tegelijk uit te voeren.
Zodra u bijvoorbeeld kunt autorijden, kunt u onderweg ook een gesprek met iemand voeren. Terwijl uw standaardsysteem alle repetitieve taken voor het besturen van de auto uitvoert, kan uw op waarden gebaseerde systeem bepalen waar het over moet gaan, zo legt het onderzoek uit.
De resultaten van het onderzoek laten zien waarom het zo moeilijk is om slechte gewoontes te doorbreken en waarom het vervangen van één handeling door een andere de beste strategie kan zijn : als je consequent een handeling vervangt, zoals het kauwen van nicotinekauwgom in plaats van roken, kan het EPA-systeem het overnemen en een nieuwe gewoonte bovenop de andere gewoonte vormen.
Dit onderzoek heeft mogelijk ook gevolgen voor de ziekte van Parkinson . Bekend is dat deze ziekte wordt veroorzaakt door het afsterven van dopamine-neuronen in de middenhersenen. Deze neuronen zijn betrokken bij beweging en zouden verantwoordelijk kunnen zijn voor het coderen van EPR. Dit zou kunnen verklaren waarom patiënten moeite hebben met routinematige taken zoals lopen, maar wel flexibeler gedrag kunnen vertonen, zoals schaatsen.
observador