Ich habe das Examen noch nicht geschrieben, aber ein paar Anmerkungen bzw. Mutmaßungen.
1. Ich glaube kaum, dass es dem IMPP um eine profane Normalverteilung geht - dann hätten die verdammt schlechte Statistiker. Dem IMPP wird es um Trennschärfe gehen, das heißt darum, ob Fragen (eines bestimmten Typs, eines bestimmten Faches, eines bestimmten Schwierigkeitsgrades...) geeignet sind, "gute" von "sehr guten" und "durchschnittliche" von "guten" Prüflingen etc. zu trennen. Entsprechend wurden vermutlich die kurzen und die langen Fälle im F18 verglichen - man kann hier sogar auf Medi-Learn in einem der fixierten Themen nachlesen, dass die Trennschärfe ziemlich gleich war. Analog hat das IMPP vielleicht bemerkt, dass Fragen in den Gebieten Derma und Neuro sich momentan sehr gut für diese Unterscheidung eignen, genau wie in früheren Examina der Fokus auf Infektio lag (als das dann alle besser lernten wurde die Trennschärfe vermutlich schlechter).
2. Die Trennschärfe ist in den Generalproben - anders als in den eigentlichen Examina - dann komplett verloren, weil die Antworten auf die Detailfragen und Kolibris nicht nur bei Amboss stehen, sondern auch noch gelb hervorgehoben sind (die meisten, die ich kenne, die fürs Examen lernen, sind so schwach, diese Markierungen anzuschalten, weil es natürlich kurzfristig den Kreuzerfolg verbessert). Letztlich sind das genau die Fragen, die den Unterschied zwischen 80, 85 und 90% ausmachen. Dass man von der Generalprobe auf die eigentliche Prüfung dann so abfällt ist eigentlich sogar zu erwarten.
3. Die hier vielfach geäußerte Hypothese, die Examina würden schwerer, lässt sich zumindest für die letzten Jahre anhand der offiziellen Statistiken nicht wirklich bestätigen. Das seit längerem schlechteste war Herbst 2017, mit einem Mittelwert von 75%. Die Mittelwerte schwanken zwischen 75% und 80%, was natürlich zu viel ist. Hier wird das IMPP zu Recht kritisiert. Die Behauptung, die Examina würden schwerer, ließe sich nur dann aufrechterhalten, wenn man annimmt, dass die Studenten über die Jahre besser würden. Als Begründung dafür wird dann der ständig erweiterte Umfang von Amboss entgegengehalten. Ich bin aber überzeugt davon, dass Lern- und Konzentrationsvermögen sowie Fleiß der Studenten im Durchschnitt eher konstant geblieben sein dürften, woraus sich ableiten lässt, dass die Menge an tatsächlich verinnerlichtem Stoff annähernd gleich bleibt, während sich vielleicht die Schwerpunkte verschieben.
Es kann natürlich sein, dass in diesem Examen alles anders war. Kann ich nicht ausschließen, aber die Vorhersage der Durchfallgrenze (kein Herabsetzen - 60%) von Medi-Learn gibt jedenfalls keinen Anlass zu dieser Vermutung. Die Tatsache, dass fehlerhafte Key-Feature-Fragen unfaire Folgefehler provozieren scheint seit F18 auch damit ausgeglichen worden zu sein, dass sehr viele Fragen herausgenommen wurden (nur 310 bzw 308 gewertete Fragen), was den Prüflingen übrigens auch zum Vorteil gereicht, da die richtig beantworteten Fragen trotzdem gewertet werden.