Quanten.de Diskussionsforum  

Zurück   Quanten.de Diskussionsforum > Plauderecke

Plauderecke Alles, was garantiert nichts mit Physik zu tun hat. Seid nett zueinander!

Antwort
 
Themen-Optionen Ansicht
  #1  
Alt 09.12.17, 18:33
Timm Timm ist offline
Singularität
 
Registriert seit: 26.03.2009
Ort: Weinstraße, Rheinld.Pfalz
Beiträge: 2.130
Standard Alpha Zero schlägt Stockfish

Google KI bildet sich selbst in vier Stunden zum Schach-Großmeister aus.
Und - kaum zu fasen - schlägt eines der bisher besten Schachprogramme, die bereits weit über Großmeister Niveau liegen.

https://www.futurezone.de/science/ar...ister-aus.html

Hier einige kommentierte Partien

https://www.youtube.com/watch?v=3taHp9EC5Kw

Statt bis zu 70 Millionen Stellungen/s untersucht Alpha Zero "nur" 80 Tausend und scheint damit wesentlich selektiver zu "rechnen".

Wohin geht diese Reise mit sich selbst optimierenden Algorithmen?
__________________
Der Verstand schafft die Wahrheit nicht, sondern er findet sie vor - Aurelius Augustinus
Mit Zitat antworten
  #2  
Alt 10.12.17, 23:46
Hawkwind Hawkwind ist offline
Singularität
 
Registriert seit: 22.07.2010
Beiträge: 1.947
Standard AW: Alpha Zero schlägt Stockfish

Eine faszinierende Entwicklung! Ich hätte nie erwartet, dass Programme, die nicht auf der konventionellen Minmax-Alpha-Beta -Suche basieren, derart erfolgreich Schach spielen können. Und nicht nur Schach spielen!

BTW, es gibt allerdings Zweifel, ob das Match gegen Stockfish ganz "fair" war, denn - wie man liest - spielte Stockfish ohne Eröffnungsbuch. Da konventionelle Schachprogramme im Grunde total deterministsich sind, kann ein lernendes Programm den Gegner immer wieder in ungünstige Varianten locken. Ein gutes und variantenreiches Eröffnungsbuch würde die Züge von Stockfish weniger "ausrechenbar" zu machen.

Schach-Großmeister und Computerschach-"Veteran" Larry Kaufman hatte das kritisiert
Zitat:
"It is of course rather incredible, he said. "Although after I heard about the achievements of AlphaGo Zero in Go I was rather expecting something like this, especially since the team has a chess master, Demis Hassabis. What isn't yet clear is whether AlphaZero could play chess on normal PCs and if so how strong it would be. It may well be that the current dominance of minimax chess engines may be at an end, but it's too soon to say so. It should be pointed out that AlphaZero had effectively built its own opening book, so a fairer run would be against a top engine using a good opening book."
BTW, das Schachprogramm M-Chess von Marty Hirsch nutzte in den 90ern diesen "Trick" über ein recht simples Book-Learning, um sich im Spiel gegen andere Prgramme an die Spitze der Ratingliste zu setzen. Aus der Beschreibung von M-Chess

Zitat:
Some sets of heuristics are employed to decide which moves to add to the opening book, and which to delete from it. Moves are deleted when the score just out of book is not too high, and the score later in the game is worse. Moves are added when the score just out of book is not too low, and the score later in the game is satisfactory. A further pre-condition for moves that may be added to the opening book is that the increase in score has been mainly monotonic. If this condition is not met, a future game may enable better moves to be found due to the general learning. In other words, only the best moves the program is able to discover (at a given level) are added to the opening book. Different thresholds are applied for the storage and deletion of moves for White and Black.

Aber es ist eigentlich auch wurscht, ob AlphaZero Stockfish nun total dominiert oder nicht.
Mit Zitat antworten
  #3  
Alt Gestern, 11:13
Timm Timm ist offline
Singularität
 
Registriert seit: 26.03.2009
Ort: Weinstraße, Rheinld.Pfalz
Beiträge: 2.130
Standard AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von Hawkwind Beitrag anzeigen

BTW, es gibt allerdings Zweifel, ob das Match gegen Stockfish ganz "fair" war, denn - wie man liest - spielte Stockfish ohne Eröffnungsbuch. Da konventionelle Schachprogramme im Grunde total deterministsich sind, kann ein lernendes Programm den Gegner immer wieder in ungünstige Varianten locken. Ein gutes und variantenreiches Eröffnungsbuch würde die Züge von Stockfish weniger "ausrechenbar" zu machen.
Da könnte ich mir vorstellen, daß Wettkämpfe folgen werden, bei denen Spitzenprogramme ihr Eröffnungsbuch und auch hashtables benutzen dürfen, damit sie maximal wehrhaft sind.
Du erinnerst Dich sicher, daß früher Programme, damals noch schwächer, von Menschen in Stellungen "gelockt" wurden, die sie weniger gut beherrschten. Das ist finde ich ein Ausdruck von Überlegenheit, der sich nun offenbar auch bei Alpha Zero zeigt.

Hier einige Kommentare von Demis Hassabis, dem Gründer von DeepMind.

Zitat:
What’s also remarkable, though, Hassabis explained, is that it sometimes makes seemingly crazy sacrifices, like offering up a bishop and queen to exploit a positional advantage that led to victory. Such sacrifices of high-value pieces are normally rare. In another case the program moved its queen to the corner of the board, a very bizarre trick with a surprising positional value. “It’s like chess from another dimension,” Hassabis said.
Solche Opfer sind natürlich spektakulär. Bei einem Menschen würde man von einem phantastischen positionellen Verständnis sprechen, denn weit genug in die Tiefe rechnen kann er nicht. Man kann sich fragen, ist das bei Alpha Zero einfach größere Tiefe oder fällt es bei Stockfish beim alpha beta pruning durchs Raster. Das an konkreten Beispielen herauszufinden sollte für die Entwickler von SF nicht allzu schwierig sein.

Zitat:
Hassabis speculates that because Alpha Zero teaches itself, it benefits from not following the usual approach of assigning value to pieces and trying to minimize losses. “Maybe our conception of chess has been too limited,” he said. “It could be an important moment for chess. We can graft it into our own play.”
Das Wissen eines neuronalen Netzes ist in Gewichten gespeichert. Aber ich habe keine Vorstellung wie es rechnet. Ob es überhaupt mit priorisierten Zuglisten arbeitet, ob es eine Ruhesuche macht, ob es Varianten mit Bewertung preisgibt usw.
__________________
Der Verstand schafft die Wahrheit nicht, sondern er findet sie vor - Aurelius Augustinus
Mit Zitat antworten
  #4  
Alt Gestern, 12:13
Bernhard Bernhard ist offline
Moderator
 
Registriert seit: 14.06.2017
Beiträge: 255
Standard AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von Timm Beitrag anzeigen
Das Wissen eines neuronalen Netzes ist in Gewichten gespeichert. Aber ich habe keine Vorstellung wie es rechnet.
Bei der Mustererkennung gibt es Algorithmen, die mit großen Matrizen und der Matrixmultiplikation arbeiten.
__________________
Freundliche Grüße, B.
Mit Zitat antworten
  #5  
Alt Gestern, 15:22
Hawkwind Hawkwind ist offline
Singularität
 
Registriert seit: 22.07.2010
Beiträge: 1.947
Standard AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von Timm Beitrag anzeigen
Das Wissen eines neuronalen Netzes ist in Gewichten gespeichert. Aber ich habe keine Vorstellung wie es rechnet. Ob es überhaupt mit priorisierten Zuglisten arbeitet, ob es eine Ruhesuche macht, ob es Varianten mit Bewertung preisgibt usw.
Die Bewertungen dürften ziemlich "unkonventionell" sein; angeblich verfügt das Programm nicht über die üblichen Heuristiken (Malus für Doppelbauer, Bonus für Turm auf offener Linie etc.), die ja auf Erfahrungen menschlicher Spieler basieren. Ist mir völlig rätselhaft, was die da bewerten: auch die Materialbewertung ist ja im Grunde stellungsabhängig: z.B. in offenen Stellungen ist der Läufer höher einzuschätzen als der Springer. Aber irgendeine materielle Bewertung wird es wohl geben; was will man sonst machen?

---

hier gibt es übrigens die Publikation der Gruppe:
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

Geändert von Hawkwind (Gestern um 15:28 Uhr)
Mit Zitat antworten
  #6  
Alt Gestern, 18:03
Timm Timm ist offline
Singularität
 
Registriert seit: 26.03.2009
Ort: Weinstraße, Rheinld.Pfalz
Beiträge: 2.130
Standard AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von Hawkwind Beitrag anzeigen
Also Montecarlo Suche statt alpha beta. Aber für mich ansonsten ziemlich kryptisch. Interessant ist auch die Häufigkeitsverteilung bei den selbstgelernten Eröffnungen, das dürfte Gesprächsstoff geben.

Übrigens hat wie hier zu sehen, Carlsen gegen Aronian gerade das Blatt in einer Serie von mit den Vorschlägen von Stockfish übereinstimmenden Zügen zu seinen Gunsten gewendet und gewonnen.
__________________
Der Verstand schafft die Wahrheit nicht, sondern er findet sie vor - Aurelius Augustinus
Mit Zitat antworten
  #7  
Alt Gestern, 18:38
Hawkwind Hawkwind ist offline
Singularität
 
Registriert seit: 22.07.2010
Beiträge: 1.947
Standard AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von Timm Beitrag anzeigen
Also Montecarlo Suche statt alpha beta. Aber für mich ansonsten ziemlich kryptisch.
Für mich leider auch ... anscheinend wird jedem Zug in einer Position durch die Bewertung eine Gewinnwahrscheinlichkeit zugeordnet. Anscheinend wird nicht einmal das Material auf dem Brett bewertet!?

Zitat:
Zitat von Timm Beitrag anzeigen
Interessant ist auch die Häufigkeitsverteilung bei den selbstgelernten Eröffnungen, das dürfte Gesprächsstoff geben.
Ich habe den Verdacht, dass AlphaZero die Eröffnungstheorie revolutionieren könnte. Das ist ein bisschen wie "Schach vom anderen Stern" oder HAL-9000 spielt Schach (aus "2001 – Odysee im Weltraum").
Mit Zitat antworten
  #8  
Alt Gestern, 21:02
Timm Timm ist offline
Singularität
 
Registriert seit: 26.03.2009
Ort: Weinstraße, Rheinld.Pfalz
Beiträge: 2.130
Lächeln AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von Hawkwind Beitrag anzeigen
Für mich leider auch ... anscheinend wird jedem Zug in einer Position durch die Bewertung eine Gewinnwahrscheinlichkeit zugeordnet. Anscheinend wird nicht einmal das Material auf dem Brett bewertet!?
Ja, nach dem Zitat oben nicht. Bei einem matt ist ist Material Unterlegenheit egal, im Mittelspiel aber nicht. Wenn aber alle Selbstspiele bis zur Entscheidung remis, Gewinn, Verlust gespielt werden, dann sollte das Material keine Rolle spielen!? Na ja, ich weiß nicht, es sind eigentlich müßige Spekulationen.


Zitat:
Zitat von Hawkwind Beitrag anzeigen
Ich habe den Verdacht, dass AlphaZero die Eröffnungstheorie revolutionieren könnte. Das ist ein bisschen wie "Schach vom anderen Stern" oder HAL-9000 spielt Schach (aus "2001 – Odysee im Weltraum").
Ein klasse Film.

Und ja, die Sekundanten werden gut ausgelastet sein.
__________________
Der Verstand schafft die Wahrheit nicht, sondern er findet sie vor - Aurelius Augustinus
Mit Zitat antworten
Antwort

Lesezeichen

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 01:47 Uhr.


Powered by vBulletin® Version 3.8.8 (Deutsch)
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
ScienceUp - Dr. Günter Sturm