Quanten.de Diskussionsforum

Quanten.de Diskussionsforum (http://www.quanten.de/forum/index.php5)
-   Plauderecke (http://www.quanten.de/forum/forumdisplay.php5?f=5)
-   -   Alpha Zero schlägt Stockfish (http://www.quanten.de/forum/showthread.php5?t=3281)

Timm 09.12.17 18:33

Alpha Zero schlägt Stockfish
 
Google KI bildet sich selbst in vier Stunden zum Schach-Großmeister aus.
Und - kaum zu fasen - schlägt eines der bisher besten Schachprogramme, die bereits weit über Großmeister Niveau liegen.

https://www.futurezone.de/science/ar...ister-aus.html

Hier einige kommentierte Partien

https://www.youtube.com/watch?v=3taHp9EC5Kw

Statt bis zu 70 Millionen Stellungen/s untersucht Alpha Zero "nur" 80 Tausend und scheint damit wesentlich selektiver zu "rechnen".

Wohin geht diese Reise mit sich selbst optimierenden Algorithmen?

Hawkwind 10.12.17 23:46

AW: Alpha Zero schlägt Stockfish
 
Eine faszinierende Entwicklung! Ich hätte nie erwartet, dass Programme, die nicht auf der konventionellen Minmax-Alpha-Beta -Suche basieren, derart erfolgreich Schach spielen können. Und nicht nur Schach spielen!

BTW, es gibt allerdings Zweifel, ob das Match gegen Stockfish ganz "fair" war, denn - wie man liest - spielte Stockfish ohne Eröffnungsbuch. Da konventionelle Schachprogramme im Grunde total deterministsich sind, kann ein lernendes Programm den Gegner immer wieder in ungünstige Varianten locken. Ein gutes und variantenreiches Eröffnungsbuch würde die Züge von Stockfish weniger "ausrechenbar" zu machen.

Schach-Großmeister und Computerschach-"Veteran" Larry Kaufman hatte das kritisiert
Zitat:

"It is of course rather incredible, he said. "Although after I heard about the achievements of AlphaGo Zero in Go I was rather expecting something like this, especially since the team has a chess master, Demis Hassabis. What isn't yet clear is whether AlphaZero could play chess on normal PCs and if so how strong it would be. It may well be that the current dominance of minimax chess engines may be at an end, but it's too soon to say so. It should be pointed out that AlphaZero had effectively built its own opening book, so a fairer run would be against a top engine using a good opening book."
BTW, das Schachprogramm M-Chess von Marty Hirsch nutzte in den 90ern diesen "Trick" über ein recht simples Book-Learning, um sich im Spiel gegen andere Prgramme an die Spitze der Ratingliste zu setzen. Aus der Beschreibung von M-Chess

Zitat:

Some sets of heuristics are employed to decide which moves to add to the opening book, and which to delete from it. Moves are deleted when the score just out of book is not too high, and the score later in the game is worse. Moves are added when the score just out of book is not too low, and the score later in the game is satisfactory. A further pre-condition for moves that may be added to the opening book is that the increase in score has been mainly monotonic. If this condition is not met, a future game may enable better moves to be found due to the general learning. In other words, only the best moves the program is able to discover (at a given level) are added to the opening book. Different thresholds are applied for the storage and deletion of moves for White and Black.

Aber es ist eigentlich auch wurscht, ob AlphaZero Stockfish nun total dominiert oder nicht.

Timm 11.12.17 11:13

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Hawkwind (Beitrag 86205)

BTW, es gibt allerdings Zweifel, ob das Match gegen Stockfish ganz "fair" war, denn - wie man liest - spielte Stockfish ohne Eröffnungsbuch. Da konventionelle Schachprogramme im Grunde total deterministsich sind, kann ein lernendes Programm den Gegner immer wieder in ungünstige Varianten locken. Ein gutes und variantenreiches Eröffnungsbuch würde die Züge von Stockfish weniger "ausrechenbar" zu machen.

Da könnte ich mir vorstellen, daß Wettkämpfe folgen werden, bei denen Spitzenprogramme ihr Eröffnungsbuch und auch hashtables benutzen dürfen, damit sie maximal wehrhaft sind.
Du erinnerst Dich sicher, daß früher Programme, damals noch schwächer, von Menschen in Stellungen "gelockt" wurden, die sie weniger gut beherrschten. Das ist finde ich ein Ausdruck von Überlegenheit, der sich nun offenbar auch bei Alpha Zero zeigt.

Hier einige Kommentare von Demis Hassabis, dem Gründer von DeepMind.

Zitat:

What’s also remarkable, though, Hassabis explained, is that it sometimes makes seemingly crazy sacrifices, like offering up a bishop and queen to exploit a positional advantage that led to victory. Such sacrifices of high-value pieces are normally rare. In another case the program moved its queen to the corner of the board, a very bizarre trick with a surprising positional value. “It’s like chess from another dimension,” Hassabis said.
Solche Opfer sind natürlich spektakulär. Bei einem Menschen würde man von einem phantastischen positionellen Verständnis sprechen, denn weit genug in die Tiefe rechnen kann er nicht. Man kann sich fragen, ist das bei Alpha Zero einfach größere Tiefe oder fällt es bei Stockfish beim alpha beta pruning durchs Raster. Das an konkreten Beispielen herauszufinden sollte für die Entwickler von SF nicht allzu schwierig sein.

Zitat:

Hassabis speculates that because Alpha Zero teaches itself, it benefits from not following the usual approach of assigning value to pieces and trying to minimize losses. “Maybe our conception of chess has been too limited,” he said. “It could be an important moment for chess. We can graft it into our own play.”
Das Wissen eines neuronalen Netzes ist in Gewichten gespeichert. Aber ich habe keine Vorstellung wie es rechnet. Ob es überhaupt mit priorisierten Zuglisten arbeitet, ob es eine Ruhesuche macht, ob es Varianten mit Bewertung preisgibt usw.

Bernhard 11.12.17 12:13

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Timm (Beitrag 86206)
Das Wissen eines neuronalen Netzes ist in Gewichten gespeichert. Aber ich habe keine Vorstellung wie es rechnet.

Bei der Mustererkennung gibt es Algorithmen, die mit großen Matrizen und der Matrixmultiplikation arbeiten.

Hawkwind 11.12.17 15:22

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Timm (Beitrag 86206)
Das Wissen eines neuronalen Netzes ist in Gewichten gespeichert. Aber ich habe keine Vorstellung wie es rechnet. Ob es überhaupt mit priorisierten Zuglisten arbeitet, ob es eine Ruhesuche macht, ob es Varianten mit Bewertung preisgibt usw.

Die Bewertungen dürften ziemlich "unkonventionell" sein; angeblich verfügt das Programm nicht über die üblichen Heuristiken (Malus für Doppelbauer, Bonus für Turm auf offener Linie etc.), die ja auf Erfahrungen menschlicher Spieler basieren. Ist mir völlig rätselhaft, was die da bewerten: auch die Materialbewertung ist ja im Grunde stellungsabhängig: z.B. in offenen Stellungen ist der Läufer höher einzuschätzen als der Springer. Aber irgendeine materielle Bewertung wird es wohl geben; was will man sonst machen? :)

---

hier gibt es übrigens die Publikation der Gruppe:
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

Timm 11.12.17 18:03

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Hawkwind (Beitrag 86209)

Also Montecarlo Suche statt alpha beta. Aber für mich ansonsten ziemlich kryptisch. Interessant ist auch die Häufigkeitsverteilung bei den selbstgelernten Eröffnungen, das dürfte Gesprächsstoff geben.

Übrigens hat wie hier zu sehen, Carlsen gegen Aronian gerade das Blatt in einer Serie von mit den Vorschlägen von Stockfish übereinstimmenden Zügen zu seinen Gunsten gewendet und gewonnen.

Hawkwind 11.12.17 18:38

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Timm (Beitrag 86210)
Also Montecarlo Suche statt alpha beta. Aber für mich ansonsten ziemlich kryptisch.

Für mich leider auch ... anscheinend wird jedem Zug in einer Position durch die Bewertung eine Gewinnwahrscheinlichkeit zugeordnet. Anscheinend wird nicht einmal das Material auf dem Brett bewertet!?

Zitat:

Zitat von Timm (Beitrag 86210)
Interessant ist auch die Häufigkeitsverteilung bei den selbstgelernten Eröffnungen, das dürfte Gesprächsstoff geben.

Ich habe den Verdacht, dass AlphaZero die Eröffnungstheorie revolutionieren könnte. Das ist ein bisschen wie "Schach vom anderen Stern" oder HAL-9000 spielt Schach (aus "2001 – Odysee im Weltraum").

Timm 11.12.17 21:02

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Hawkwind (Beitrag 86212)
Für mich leider auch ... anscheinend wird jedem Zug in einer Position durch die Bewertung eine Gewinnwahrscheinlichkeit zugeordnet. Anscheinend wird nicht einmal das Material auf dem Brett bewertet!?

Ja, nach dem Zitat oben nicht. Bei einem matt ist ist Material Unterlegenheit egal, im Mittelspiel aber nicht. Wenn aber alle Selbstspiele bis zur Entscheidung remis, Gewinn, Verlust gespielt werden, dann sollte das Material keine Rolle spielen!? Na ja, ich weiß nicht, es sind eigentlich müßige Spekulationen.


Zitat:

Zitat von Hawkwind (Beitrag 86212)
Ich habe den Verdacht, dass AlphaZero die Eröffnungstheorie revolutionieren könnte. Das ist ein bisschen wie "Schach vom anderen Stern" oder HAL-9000 spielt Schach (aus "2001 – Odysee im Weltraum").

Ein klasse Film.:)

Und ja, die Sekundanten werden gut ausgelastet sein.

Hawkwind 15.12.17 13:54

AW: Alpha Zero schlägt Stockfish
 
https://www.msn.com/de-at/nachrichte...cid=spartanntp

Zitat:

...
Wissenschaftler haben neben unserem Sonnensystem erstmals ein weiteres gefunden, in dem acht Planeten um eine Sonne kreisen. Die US-Raumfahrtbehörde Nasa und der Internetgigant Google kündigten am Donnerstag den Fund eines achten Planeten an, der sich um den Stern Kepler-90 dreht. Die neuste Entdeckung dieses sogenannten Exoplaneten wurde mithilfe von Googles künstlicher Intelligenz gemacht.
...
Hervorhebung von mir.

Ist das auch "AlphaZero und Konsorten"?
Da kommen so langsam Erinnerungen an "Skynet" aus den Terminator-Filmen hoch. Vielleicht erklärt uns AlphaZero irgendwann für unmündig (was ja angesichts Klimakatastrophe etc sogar nachvollziehbar wäre) und übernimmt die Kontrolle?

Bernhard 15.12.17 14:55

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Hawkwind (Beitrag 86231)
und übernimmt die Kontrolle?

"Das wäre doch mal was! Die Computer können denken, und die Menschen hören ganz damit auf."

Zitat aus Tron 1. Wer hat's gesagt?


Alle Zeitangaben in WEZ +1. Es ist jetzt 06:00 Uhr.

Powered by vBulletin® Version 3.8.8 (Deutsch)
Copyright ©2000 - 2024, vBulletin Solutions, Inc.
ScienceUp - Dr. Günter Sturm