Noch ein bisschen Statistik.
Interessant ist der Vergleich von Standardabweichung (sdev) zur Bandbreite (spread, spr = max-min). Bei "vernuenftigen" Verteilungen sollte, wie gesagt, spr ~ 3 x sdev sein (statistisch gesehen heisst das, dass 99% aller Wertungen in die Bandbreite fallen). Abweichungen hiervon deuten auf schiefe Verteilungen und speziell auf Ausreisser hin. Solche Ausreisser sind aber keine "Messfehler", sondern einfach der Meinungsvielfalt geschuldet; sie bei der Mittelwertbildung wegzustreichen, also sollte tunlichst unterlassen werden.
Wie oft wurde welcher spread erreicht? Hier die Verteilung:
spr Anz
4 1
5 2
6 6
7 4 13/33
8 4
9 6
10 3
11 3
12 1
13 1
14 0
15 2
Niedrigster spread war immerhin 4 Punkte (sogar ein Pegelwein!), aber 20/33 Weine (fast zwei Drittel) wurden doch kontrovers genug gesehen (spr > 7), dass man als Aussenstehender beim Blindkauf besser die Finger davon laesst.
Konzentrieren wir uns also nur auf die 13 Weine (ein starkes Drittel der Probe), deren Bewertungen eine Bandbreite von 7 Punkten oder weniger abdecken. Dieser Zahlenwert ist motiviert durch die Erfahrung, dass bei Proben der spread typischerweise in der Ecke 6 bis 7 Punkte liegt, siehe z.B. den Rieslingcup und aehnliche Veranstaltungen, bei denen genuegend Weine (>10) von hinreichend vielen (>10) Verkostern bewertet werden, um die Meinungsvielfalt halbwegs gut abzubilden.
spr med
4
90
5
89 88
6 92 93 91 91.5 89 86
7 90 90 90 92.5 87
(In fett die beiden ersten Weine der Verkostung, die als Pegelweine angedacht waren. Wie man sieht, war man sich dabei noch recht einig.)
DIe Messgroesse "spread" ist deshalb so interessant, weil die Wahrscheinlichkeit, dass die Wertung einer Person, die nicht an der Probe teilgenommen hat, in die Punktebandbreite "Mittelwert plus/minus halber spread" faellt, sehr hoch ist (siehe oben). Konsumenten also, die nicht an der Probe teilgenommen haben, sich aber gerne an ihren Ergebnissen orientieren moechten, sollten sich auf Weine mit besonders kleinen spreads konzentrieren, denn hier koennen sie selbst das Ergebnis am ehesten nachvollziehen.
Fuer den "Siegerwein" (Rings, med 93) z.B. ist der spread 6 Punkte. Das heisst, ein beliebiger Verkoster wird den Wein hoechstwahrscheinlich irgendwo zwischen 90 und 96 Punkten sehen, gefolgt von Gutzler Morstein (89.5 bis 96.5), Huber Schlossberg und Baltes Schlossberg (je 89 bis 95). Das Spielchen kann man jetzt durchjuckeln. So ist z.B. der Fuerst Schlossberg mit eine spread von nur 6 Punkten ganz schon abgeschossen worden (83 bis 92); man muss den Wein unbedingt selber vorher probieren, die Weine von Fuerst in ihrer Entwicklung sehr gut kennen und/oder grosses Gottvertrauen darauf haben, dass aus dem haesslichen Entlein dereinst ein (teurer) Schwan wird.
Bei diesen spread-Betrachtungen hat der Gutzler ein hoeheres "up"-, aber eben auch ein hoeheres "down"-Risiko, denn potentiell kann er bis 89.5 abfallen, deswegen ist er nur zweiter. Erbsenzaehlerei? Na, nicht wirklich, denn die psychologische Wirkung ist dann doch eine ungeheure: Fuer 96 Punkte ist der Rings sicherlich ein Schnaeppchen, fuer "nur 90" Punkte aber ein teurer Spass, v.a. wenn man selber schon Weine kennt, denen man mehr Punkte gibt bzw. die bei selber Eigenbewertung billiger sind. Noch schlimmer der Baltes: Ich persoenlich wuerde
auf Verdacht bestimmt keine 52 Euro versenken, wenn der Wein auch eine 89 kassieren kann; da kenne ich in Burgund schoenere Flaschen fuer's Geld (mit Betonung auf "ich" und "kenne").
Andererseits kann man relativ sicher sein, blind fuer sein Geld einen Wein zu bekommen, den man mindestens "sehr ordentlich" finden wird, also eine relative idjotensichere Sache, wenn man unbedingt deutschen Spaetburgunder trinken muss, weil sonst nichts zum Essen passt oder die arroganten Nachbarn gerade auf Besuch sind.
Noch ein Hinweis: Solange sichergestellt ist, dass hinreichend viele
unterschiedliche Meinungen mit am Tisch sitzen (im Prinzip also: genug Verkoster, idealerweise mehr als 10)
und die Standardabweichungen sehr klein sind (dann gilt auch sehr gut spr ~ 3 x sdev), koennen die Probenergebnisse durchaus relevant sein. Das ist eine Sache, die so manch Grossverkoster, der sich ueber den Berliner Cup lustig gemacht hat, ignoriert. Dennoch sind alle Punktewertungen typischerweise immer mit einem "plus/minus 3 Punkte" zu versehen - das macht diese Grossproben wiederum zu einer etwas akademischen Geschichte (ausser natuerlich fuer die Teilnehmer

). Und da die Weine auf dem Treppchen statistisch quasi identisch gewertet wurden, muss man doch wieder selbst probieren.
Wenn nicht, wir wuerden fuer unsere Bewertungen Geld verlangen...
Cheers,
Ollie
PS: Achso: Dass sich Klimek ausgerechnet den Rings herauspickt (bzw. ueberhaupt den BSBC zitiert), ist freilich reiner Aufmerksamkeitsoekonomie Berliner Auspraegung geschuldet.
