Kostenlose und große Partiesammlungs-Datenbank für Scid

Aktuelle Version:

Datenbanken: 2024-11-01(beinhaltet nachfolgendes, inkrementelles Update)

Inkrementelles Update: 2024-11

Warum habe ich eine neue Datenbank erstellt?

Vor einiger Zeit habe ich nach frei verfügbaren PGN-Dateien oder Datenbanken gesucht, die noch gepflegt werden, war aber nicht erfolgreich. Entweder waren solche Projekte nicht mehr auffindbar oder sie wurden schon seit Jahren nicht mehr aktualisiert.

Also beschloss ich, meine eigene Datenbank mit Scid vs. PC/MAC zu erstellen. Ich begann auf der Grundlage mehrerer bestehender Datenbanken und PGN-Dateien. Um die Quellen zu differenzieren habe ich jede mit einem SOURCE-Tag versehen, so dass man mit Scid vs. PC/MAC oder Scid 5.0 nach ihnen suchen kann.

TagBeschreibung
BritbaseFür alle Partien aus dem British Chess Game Archive
ChessNostalgia (*)Auf dieser Seite ist nichts weiter zu finden.
ChessOK (*)chessok.com bietet PGNs weiterhin kostenlos an. (Bis Ende 2020)
Chessopolis (*)PGNs können weiterhin angeboten werden, aber dann hinter einer Paywall.
Convekta (*)Möglicherweise ein Verleger, der Schachliteratur anbot. Nur Händler mit Convekta-Produkten zu finden
DanbasePartiedatenbank des dänischen Schachverbandes https://danbase.skak.dk/
Danke @ Hans Jørgen Lassen
LichessBroadcastFür die Partien, die über das Lichess-Übertragungssystem gezogen werden
LichessEliteDatabase„All (standard) games of lichess to keep only games of players with a rating of 2400+ against players with a rating of 2200+, excluding bullet games.“
Quelle: https://database.nikonoel.fr/
Alle klassischen, Schnellschach- sowie Blitzpartien, in denen beide Spieler über 2550 Liches ELO sind, werden hinzugefügt.
LumbrasGigaBaseAlle Partien aus bestehenden Datenbanken, deren Herkunft nicht geklärt werden kann, wurden mit dieser Kennzeichnung versehen.
PGNMentorUmfangreiches Archiv mit individuellen Dateien für Spieler, Eröffnungen, Eröffnungsvarianten und verschiedene Turniere.
TWICFür alle Partien aus dem TWIC-Download.
(*) In einem Github-Projekt gefunden

Du kannst in Scid nach diesen SOURCE-Tag suchen. Menü Suche -> Partiedaten -> Extramarkierungen:

Der Prozess der Datenaufbereitung

Nach der Zusammenführung der Datenbanken wurde eine Reihe von Maßnahmen ergriffen, um die Datenbank zu komprimieren und Duplikate zu beseitigen:

  • Alle Partien mit weniger als 10 Halbzügen wurden gelöscht.
  • Alle Spielernamen, Turnierorte, Runden usw. wurden mit Hilfe der Wartungsfunktion von korrigiert, soweit Scid dazu in der Lage war.
  • Alle Partien, in denen beide Spieler eine ELO-Bewertung von weniger als 1800 ELO haben, wurden gelöscht.
  • Zu allen Partien wurden ECO-Codes hinzugefügt.
  • Alle verbleibenden Partien wurden mit den folgenden Parametern auf Duplikate überprüft:
    • Übereinstimmung der ersten 4 Buchstaben der Spielernamen
    • Die gleichen Spielerfarben.
    • Die gleichen Züge.
    • Das gleiche Ergebnis.
  • Die Dateien wurden mit dem Programm pgn-extract verarbeitet. Unnötige Tags wurden entfernt und einige umbenannt, damit die Informationen in Standard-Tags verfügbar sind (hauptsächlich Datum)

Inhalt der Datenbank

Ein Beispiel für die in der Datenbank enthaltenen Spieler findest Du hier.

  • Mehr als 13.200.000 Partien
  • Mehr als 590.000 Spieler
  • Mehr als 36.000 Veranstaltungen
  • Mehr als 26.000 Standorte

Ein Urheberrecht auf Schachpartien ohne Kommentierung kann nach deutschem Recht nicht vereinbart werden, wohl aber die Kommentierung selbst. Deshalb wurde die gesamte Datenbank von allen Kommentaren und Varianten bereinigt. Der Deutsche Schachbund hat diese Frage im Jahr 2006 in einem kurzen Artikel geklärt. Das im Artikel erwähnte Gutachten ist online verfügbar und kann heruntergeladen werden:

DSB-Gutachten zur Frage „Gibt es ein Urheberrecht auf Schachpartien“ (PDF in deutscher Sprache)

Künftige Aktualisierungen

Die wird Datenbank einmal im Monat – in der Regel am ersten Dienstag – aktualisiert:

  • Datenbankdateien (si5- und si4-Format)
  • Eine differnzielle PGN-Datei mit den neuen Partien seit der Veröffentlichung der letzten Datenbank.

Wie kannst Du mich unterstützen?

Ich liebe Kaffee! Du bist herzlich eingeladen, mir einen Kaffee zu spendieren! ;)

Die ursprüngliche Erstellung der Datenbank, die Bereinigung, die Suche nach Quellen usw. war recht zeitaufwändig. Dies ist nun jedoch abgeschlossen, so dass die weitere Pflege kein großes Problem mehr darstellt.

Aber natürlich bezahle ich auch für diese Website – wenn also jemand die Datenbank mag und helfen möchte, diese Website am Laufen zu halten, dann unterstützt mich bitte auf Buy Me A Coffee.

4 Antworten zu „Kostenlose und große Partiesammlungs-Datenbank für Scid“

  1. Tapio

    Ich möchte mich auch sehr bei Dir bedanken. Ich erstelle ganz gerne Eröffnungsbücher und kenne mich mittlerweile ganz gut mit SCID(vsPC) aus, diese dicken Datenbanken zu verarbeiten, PGN daraus erzeugen usw. kostet schon Zeit. Vielen Dank also.

    1. Gern geschehen – der Rechner hat gut 30 Stunden gearbeitet :D

  2. Hauke

    Vielen Dank für die Mühe und tolle Arbeit.
    Wäre es auch möglich eine Amateurdatenbank zu erzeugen bei der Turnierpartien von Spielern unter 1800 Elo drin bleiben? Meine Gegner sind nicht so stark und fliegen so immer aus allen Sammlungen raus. Das ist auch bei TWIC immer ein Problem :(

    1. Hallo Hauke,

      grundsätzlich würde das gehen. Es ist halt nochmals extra Arbeit. Das Hauptproblem ist aber, dass es – vom Lichess Broadcast abgesehen – eigentlich kaum Quellen gibt, die Spiele mit so niedrigen Wertungen enthalten.

      Dazu kommt, dass Turniere wo Amateure mitspielen, kaum auf DGT-Boards gespielt werden. Und um z.B. die Lichess-Datenbank auf Spieler bis 1800 einzuschränken, da fehlen mir die Ressourcen zu. Die Datenbank ist RIESIG…

      Trotzdem danke für das Kompliment! ;)

      VG,
      Michael

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Views: 839

Nach oben scrollen