Completely new OTB release on July 1st

Völlig neue OTB-Veröffentlichung am 1. Juli

On July 1st, I'll be releasing a new OTB database and its accompanying PGN files. This version is almost completely free of duplicate games. You can learn more about this process in the linked article.

Am 1. Juli veröffentliche ich eine neue OTB-Datenbank und die dazugehörigen PGN-Dateien. Diese Version ist nahezu vollständig von doppelten Partien bereinigt. Im verlinkten Artikel kannst Du nachlesen mehr über diesen Prozess erfahren.

Kostenlose Schach-Partie-Datenbank für Scid

Aktuelle Version:

Datenbanken: 2025-06-03 (beinhaltet nachfolgendes, inkrementelles Update)

Eröffnungsbücher Zeiträume: 2025-02-06
Eröffnungsbücher ECO: 2025-02-06
Eröffnungsbücher NIC-Codes: 2025-07-13

Inkrementelles Update: derzeit keines

Wie kannst Du mich unterstützen?

Ich liebe Kaffee! Du bist herzlich eingeladen, mir einen Kaffee zu spendieren! ;)

Die ursprüngliche Erstellung der Datenbank, die Bereinigung, die Suche nach Quellen usw. war recht zeitaufwändig. Dies ist nun jedoch abgeschlossen, so dass die weitere Pflege kein großes Problem mehr darstellt.

Aber natürlich bezahle ich auch für diese Website – wenn also jemand die Datenbank mag und helfen möchte, diese Website am Laufen zu halten, dann unterstützt mich bitte auf Buy Me A Coffee.

Nun aber zu den wesentlichen Dingen ;)

Über die Datenbank

Diese Datenbank wurde mit und für Scid vs. PC/MAC sowie Scid 5.0 erstellt und wurde mittlerweile in zwei Teile aufgeteilt.

  1. OTB-Datenbank mit etwa 9,5 Millionen Partien
  2. Online-Datenbank mit etwa 7,1 Millionen Partien

Da alle Scid-Versionen leider eine Menge doppelter Partien zu übersehen scheinen, habe ich ein Script geschrieben, das die Partien einer größeren PGN-Datei in mehreren Phasen dedupliziert. Hier könnt Ihr Euch die Funktionsweise des Scripts näher anschauen. Da der Vorgang für 10 Millionen Partien gut 10 Stunden in Anspruch nimmt, werde ich diese Deduplizierung nur über die OTB-Datenbank laufen lassen und das auch nich zu jedem Release. Ich denke, zu jedem Jahresbeginn ist an der Stelle ausreichend.

Der Download ist sowohl im PGN- als auch im jeweiligen Datenbankformat von Scid vs. PC/MAC sowie Scid 5.0 möglich.

Die Daten stammen aus verschiedenen Quellen, darunter mehrere bestehende Datenbanken und PGN-Dateien. Um die Herkunft der einzelnen Partien nachvollziehen zu können, wurden alle Einträge mit einem SOURCE-Tag versehen. Diese Tags ermöglichen es, die Datenbank mit Scid vs. PC/MAC oder Scid 5.0 nach bestimmten Quellen zu filtern und zu durchsuchen.

Nr.TagDescriptionDatabase
1AjedrezCorrFernschach-Datenbank von https://ajedrezdata.com/databases/OTB
2AjedrezOTBOTB Datenbank von https://ajedrezdata.com/databases/both
3BritbaseFür alle Partien aus dem British Chess Game Archiveboth
4CaissabaseDatenbank, die es anscheinend nicht mehr gibt.both
5CanadaKanadischer Schachverbandboth
6ChessNostalgia (*)Auf dieser Seite ist nichts weiter zu finden.OTB
7ChessOK (*)chessok.com bietet PGNs weiterhin kostenlos an. (Bis Ende 2020)both
8Chessopolis (*)PGNs können weiterhin angeboten werden, aber dann hinter einer Paywall.OTB
9ChessScotlandSchottischer SchachverbandOTB
10Convekta (*)Ein russischer Software-Entwickler, der eine Software wie Chessbase verkauft. Wird hauptsächlich in Russland verwendet.OTB
11DanbasePartiedatenbank des dänischen Schachverbandes https://danbase.skak.dk/
Danke @Hans Jørgen Lassen
OTB
12FederscacchiItalienischer SchachverbandOTB
13FICGSFree Internet Chess & Go Server (Fernschach Partien)OTB
14FinlandFinnischer Schachverbandboth
15GamesOfGMsEine Datenbank, die nur OTB-Partien von Großmeistern enthältOTB
16GreekBaseGriechischer Schachverbandboth
17IECGInternational Email Chess GroupOTB
18KingbaseEine Datenbank, die nur OTB-Partien von mehrheitlich Großmeistern enthältOTB
19LichessBroadcastFür die Partien, die über das Lichess-Übertragungssystem gezogen werdenboth
20LichessEliteDatabaseAlle (Standard-)Partien von Lichess, um nur Partien von Spielern mit einem Rating von 2400+ gegen Spieler mit einem Rating von 2200+ zu behalten, ausgenommen Bullet-Partien. Quelle: https://database.nikonoel.fr/
Alle klassischen, Schnell- und Blitzpartien, in denen beide Spieler über 2550 Liches ELO haben, werden hinzugefügt.
Online
21LumbrasGigaBaseAlle Spiele aus bestehenden Datenbanken, deren Herkunft nicht geklärt werden kann, wurden mit dieser Kennzeichnung versehen.both
22MastersEine Datenbank, die Partien vonTitelträger enthältboth
23MillionbaseEine weitere alte Datenbankboth
24PGNMentorUmfangreiches Archiv mit individuellen Dateien für Spieler, Eröffnungen, Eröffnungsvarianten und verschiedene Turniere.both
25SlovakiaSlovakischer SchachverbandOTB
26TWICFür alle Partien aus dem TWIC-Download.both
(*) Found in the Github project

Du kannst in Scid nach diesen SOURCE-Tag suchen. Menü Suche -> Partiedaten -> Extramarkierungen:

Der Prozess der Datenaufbereitung

Nach der Zusammenführung der Datenbanken wurde eine Reihe von Maßnahmen ergriffen, um die Datenbank zu komprimieren und Duplikate zu beseitigen:

  • Alle Partien mit weniger als 10 Halbzügen wurden gelöscht.
  • Alle Spielernamen, Turnierorte, Runden usw. wurden mit Hilfe der Wartungsfunktion von korrigiert, soweit Scid dazu in der Lage war.
  • Alle Partien, in denen beide Spieler eine ELO-Bewertung von weniger als 1800 ELO haben, wurden gelöscht.
  • Zu allen Partien wurden ECO-Codes hinzugefügt.
  • Alle verbleibenden Partien wurden mit den folgenden Parametern auf Duplikate überprüft:
    • Übereinstimmung der ersten 4 Buchstaben der Spielernamen
    • Die gleichen Spielerfarben.
    • Die gleichen Züge.
    • Das gleiche Ergebnis.
  • Die Dateien wurden mit dem Programm pgn-extract verarbeitet. Unnötige Tags wurden entfernt und einige umbenannt, damit die Informationen in Standard-Tags verfügbar sind (hauptsächlich Datum).

Nach diesem Prozess in Scid werden die PGN-Dateien durch ein von mir geschriebenes Script nach nicht durch Scid gefundene Duplikaten durchsucht und diese dann entfernt.

Trennung der Datenbanken

Um die Inhalte der Datenbanken in online und offline Partien zu trennen wurden folgende Suchbegriffe (sowohl beim Turnier, als auch beim Ort) verwendet:

  • chess.com
  • lichess.org
  • chess24.com
  • online
  • internet
  • titled arena
  • titled tue

Solltet Ihr weitere Vorschläge für Suchbegriffe haben, teilt sie mir bitte per E-Mail oder in einem Kommentar mit.

Inhalt der Datenbank

Ein Beispiel für die in der Datenbank enthaltenen Spieler findest Du hier.

  • OTB-Datenbank mit etwa 9,7 Millionen Partien
  • Online-Datenbank mit etwa 7,1 Millionen Partien
  • Mehr als 700.000 Spieler (OTB und online)

Urheberrecht

Ein Urheberrecht auf Schachpartien ohne Kommentierung kann nach deutschem Recht nicht vereinbart werden, wohl aber die Kommentierung selbst. Deshalb wurde die gesamte Datenbank von allen Kommentaren und Varianten bereinigt. Der Deutsche Schachbund hat diese Frage im Jahr 2006 in einem kurzen Artikel geklärt. Das im Artikel erwähnte Gutachten ist online verfügbar und kann heruntergeladen werden:

DSB-Gutachten zur Frage „Gibt es ein Urheberrecht auf Schachpartien“ (PDF in deutscher Sprache)

Künftige Aktualisierungen

Die wird Datenbank in der Regel am ersten Dienstag eines jeden Monats aktualisiert. Dabei werden die Datenbankdatei im si4- und si5 -Format, sowie ein Update-File im PGN-Format, welches die neuen Partien seit dem letzten Update enthält, zur Verfügung gestellt. Habt Ihr bereits eine Datenbank-Version heruntergeladen, ist es in der Regel ausreichend, die neuen Partien im PGN-Format in die Datenbank zu importieren. Damit erspart Ihr Euch den erneuten Download der kompletten Schach-Datenbank.

6 Antworten zu „Kostenlose Schach-Partie-Datenbank für Scid“

  1. Mike R.

    Verdammt starke Arbeit! Die umfangreichste DB die ich kenne, knapp 16 Mio Partien und auch schon mit SCID bereinigt. Vielen, vielen Dank dafür. Jetzt hätte ich nur noch eine dumme Frage: wie kann man denn in SCID (Version 4.7.0) die Eröffnungsbücher (.bin Format) einbinden?
    Danke und Grüße

    1. Ich nutze auf dem Mac 2 verschiedene Versionen:
      1. Scid vs. Mac (Version 4.26)
      2. Scid 5.1.0

      In Scid vs. Mac findest Du unter „Fenster“ den Menüpunkt „Eröffnungsbücher“
      In Scid 5.0 ist es ebenfalls im Menü „Fenster“ die Option „Buchfenster“

      Dort wählst Du die Bücher aus. Bedenke, dass die Versionen sich da unterscheiden können, aber da in der Richtung solltest Du suchen…

  2. Tapio

    Ich möchte mich auch sehr bei Dir bedanken. Ich erstelle ganz gerne Eröffnungsbücher und kenne mich mittlerweile ganz gut mit SCID(vsPC) aus, diese dicken Datenbanken zu verarbeiten, PGN daraus erzeugen usw. kostet schon Zeit. Vielen Dank also.

    1. Gern geschehen – der Rechner hat gut 30 Stunden gearbeitet :D

  3. Hauke

    Vielen Dank für die Mühe und tolle Arbeit.
    Wäre es auch möglich eine Amateurdatenbank zu erzeugen bei der Turnierpartien von Spielern unter 1800 Elo drin bleiben? Meine Gegner sind nicht so stark und fliegen so immer aus allen Sammlungen raus. Das ist auch bei TWIC immer ein Problem :(

    1. Hallo Hauke,

      grundsätzlich würde das gehen. Es ist halt nochmals extra Arbeit. Das Hauptproblem ist aber, dass es – vom Lichess Broadcast abgesehen – eigentlich kaum Quellen gibt, die Spiele mit so niedrigen Wertungen enthalten.

      Dazu kommt, dass Turniere wo Amateure mitspielen, kaum auf DGT-Boards gespielt werden. Und um z.B. die Lichess-Datenbank auf Spieler bis 1800 einzuschränken, da fehlen mir die Ressourcen zu. Die Datenbank ist RIESIG…

      Trotzdem danke für das Kompliment! ;)

      VG,
      Michael

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Views: 2167

Nach oben scrollen