Quanten.de Diskussionsforum

Quanten.de Diskussionsforum (http://www.quanten.de/forum/index.php5)
-   Plauderecke (http://www.quanten.de/forum/forumdisplay.php5?f=5)
-   -   Alpha Zero schlägt Stockfish (http://www.quanten.de/forum/showthread.php5?t=3281)

Hawkwind 15.12.17 15:44

AW: Alpha Zero schlägt Stockfish
 
BTW, this is the opinion of the computer chess pioneer Ed Schröder (author of "Rebel") about the Deep Zero - Stockfish match:

Zitat:

Zitat von Ed Schröder
I am not a conspiracy theorist at all but this Alpha Zero thing needs to be questioned for various reasons and I will serve for some limited time as devil's advocate to warm up the discussion.

#1. We are offered games without depths and scores.
#2. I don't believe it's possible 4 hours of self play can do that, not even 4000 hours, it's insane.
#3. I haven't seen an official statement from Google.
#4. Games can be played by a correspondence player with the help of Houdini tactical (or so) and cherry-picked the best ones, ignoring all the lost games also making use of massive take-backs.

CONSEQUENCES
If this type of learning is possible then (IMO) mankind is in deep trouble, imagine what in theory would be possible. Examples.

#1. Predict the stock market and get rich.

#2. Suppose politicians ask the question:

Dear comp, how do we solve global warming?

Alpha 666

Reduce the population from 7 billion to 500 million and the Earth will restore itself.

------

Shoot !
:)

quoted from the American computer chess forum

http://www.talkchess.com/forum/viewt...=743214#743214
---

hmm, warum schreib ich eigentlich auf Englisch? :)

Timm 15.12.17 22:05

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Hawkwind (Beitrag 86233)
hmm, warum schreib ich eigentlich auf Englisch? :)

Perhaps because the english processing part of your neural net couldn't but proceed in english after having read Ed Schröder.

Er ist ja ziemlich bissig. Die Unterstellung #4 scheint selbst unter "devil's advocate" ziemlich abwegig.

Hier noch Infos zu AlphaZero von Jemand, der ziemlich Ahnung zu haben scheint.

https://chess.stackexchange.com/ques...ding-alphazero
Zitat:

Stockfish uses alpha-beta, while AlphaZero uses Monte-Carlo. They are two very different algorithms. The alpha-beta algorithm assumes a lower/upper bound, while Monte-Carlo creates simulations from the root to leaf.
https://chess.stackexchange.com/ques...has-never-seen
Zitat:

The evaluation function of a chess engine, whether instantiated as a neural net or explicit code, is always able to assign a value to any board position. If you give it a board position, even absurd ones that would never occur in a game, it will be able to spit out a number representing how favorable it is to one player or another. Since the number of board positions in chess is unmanageably gigantic, the training can only occur on an infinitesimal sample of the game tree. The engine is not simply recalling previously calculated values of board positions, but is performing calculations based on the arrangement of the pieces. For a non-neural-net example, part of a chess engine's evaluation might be to add up the value of each piece on its side and subtract the total value of the opponent's pieces. Then, one set of parameter that would be adjusted while training would be the value of each piece.

Timm 16.12.17 10:33

AW: Alpha Zero schlägt Stockfish
 
https://chess.stackexchange.com/ques...tockfish-match

Zitat:

AlphaZero and the previous AlphaGo Zero used a single machine with 4 TPUs Stockfish and Elmo played at their strongest skill level using 64 threads and a hash size of 1GB.

So, AlphaZero used special hardware developed by Google. It used specialized Tensor Processor Units (TPUs) rather than general Central Processing Units (CPUs) as are available commercially.

This is how Wikipedia describes the second generation TPUs they used -

The second generation TPU was announced in May 2017. Google stated the first generation TPU design was memory bandwidth limited, and using 16 GB of High Bandwidth Memory in the second generation design increased bandwidth to 600 GB/s and performance to 45 TFLOPS. The TPUs are then arranged into 4-chip 180 TFLOPS modules

They used 4 TPUs for the games, so a processing power of 180 TFLOPS. Note TFLOPS = 1000 billion floating point operations per second.
Welch eine gewaltige Rechenleistung von AlphaZero.

Die Analyse einiger Partien weiter unten zeigt, daß SF mit mehr Zeit bessere Züge gefunden hätte, was ja nicht verwunderlich ist. Aber es wirft die Frage auf, welche Zeit/Zug man SF geben müßte, damit der Vergleich der engines angesichts der gigantischen hardware von AZF fair ist. Ich kenne mich da überhaupt nicht aus, aber ein Anhaltspunkt könnten die 180 TFLOPS von AZ's hardware sein.

Hawkwind 16.12.17 13:22

AW: Alpha Zero schlägt Stockfish
 
Zitat:

They used 4 TPUs for the games, so a processing power of 180 TFLOPS. Note TFLOPS = 1000 billion floating point operations per second.
Ein Quad-Core-PC mit 3,0 GHz dagegen hat etwa 48 GFLOPS.

Lief Stockfish auf einer derartigen HW, dann kann man davon ausgehen, dass die HW von AlphaZero um einen Faktor von einigen tausend performanter war (4000 ?).
HW und SW sind so unterschiedlich, wie will man da "Fairness" definieren?
Man könnte versuchen, das auszugleichen, indem man AlphaZero 5 Sek / Zug gibt und Stockfish 5 h / Zug.

Timm 16.12.17 16:45

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Hawkwind (Beitrag 86237)
Ein Quad-Core-PC mit 3,0 GHz dagegen hat etwa 48 GFLOPS.

Lief Stockfish auf einer derartigen HW, dann kann man davon ausgehen, dass die HW von AlphaZero um einen Faktor von einigen tausend performanter war (4000 ?).

Es liegt schon lange zurück, ich habe dunkel in Erinnerung, daß mit alpha-beta Suche die erreichbare Tiefe mit 4-facher Rechenzeit grob um einen HZ wächst. Falls das so ist, könnte dieser Faktor ca. 10 HZ bringen, wenn ich das richtig überschlagen habe. Wie auch immer, SF würde erheblich stärker spielen.

Aber auch wenn SF unter solchen Voraussetzungen überlegen wäre, diese Selbstlernfähigkeit von AZ ist etwas fundamental Neues und vermutlich noch keineswegs ausgereizt.

Die Diskussion ist in vollem Gange und vielleicht äußert sich Hassabis von Deep Mind nochmal. Zur erreichten Tiefe scheint bisher nichts bekannt zu sein. Hast Du bzgl. Monte Carlo 'von der Wurzel bis zum Blatt' auch so verstanden, daß die Spiele gegen sich selbst bis zu einem eindeutigen Ergebnis ausgeführt werden?

Hawkwind 16.12.17 17:19

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Timm (Beitrag 86238)
Es liegt schon lange zurück, ich habe dunkel in Erinnerung, daß mit alpha-beta Suche die erreichbare Tiefe mit 4-facher Rechenzeit grob um einen HZ wächst. Falls das so ist, könnte dieser Faktor ca. 10 HZ bringen, wenn ich das richtig überschlagen habe. Wie auch immer, SF würde erheblich stärker spielen.

Allerdings sind die FLOPS wohl generell ein wenig aussagekräftiger Benchmark, da Schachprogramme i.d.R. keine Floating-Point-Operationen ausführen, Stockfish sicher auch nicht.

Zitat:

Zitat von Timm (Beitrag 86238)
Aber auch wenn SF unter solchen Voraussetzungen überlegen wäre, diese Selbstlernfähigkeit von AZ ist etwas fundamental Neues und vermutlich noch keineswegs ausgereizt.

Sehe ich auch so: die konventionellen Schachprogramme sind ja darauf angewiesen, dass die Erfahrungen starker menschlicher Schachspieler im Code implementiert werden (Doppelbauern möglichst vermeiden, Eröffnungsbuch etc), wogegen AlphaZero wirklich allein von den Regeln ausgeht. Das ist aus meiner Sicht viel beeindruckender - schaut wirklich nach Intelligenz aus.

Zitat:

Zitat von Timm (Beitrag 86238)
Die Diskussion ist in vollem Gange und vielleicht äußert sich Hassabis von Deep Mind nochmal. Zur erreichten Tiefe scheint bisher nichts bekannt zu sein. Hast Du bzgl. Monte Carlo 'von der Wurzel bis zum Blatt' auch so verstanden, daß die Spiele gegen sich selbst bis zu einem eindeutigen Ergebnis ausgeführt werden?

Habe da leider noch nicht raus, was das wirklich bedeutet.

future06 18.12.17 12:39

AW: Alpha Zero schlägt Stockfish
 
Alpha-Zero verwendet sog. Deep Learning mit künstlichen Neuronalen Netzen, die Fließkommaoperationen benötigen. Konventionelle Schachprogramme verwenden ausschließlich Ganzzahl-Operationen.

Monte-Carlo bedeutet in der Informatik allgemein, dass Zufallszahlen verwendet werden. Die Alpha-Beta-Suche ist hingegen eine deterministische Suche, die jeweils den kompletten Suchraum abdeckt, jedoch Suchzweige abschneidet, die prinzipiell kein besseres Ergebnis erzielen können als bereits gefunden Züge.

Die Technologie die Alpha-Zero verwendet, wird momentan auch zb. für das autonome Fahren verwendet. Allein aus diesem Grund wird hier viel Geld in die Entwicklung gesteckt, Nvidia (eigentlich ein Grafikchip-Hersteller) hat zb. marktreife Chips entwickelt, die vergleichbar mit der Alpha-Zero Hardware sind.

Meiner Einschätzung nach (bin Informatiker und verfolge diese Technologie seit vielen Jahren) kommt da in den nächsten 10-20 Jahren etwas auf uns zu, was durchaus das Potential von Skynet hat :)

Timm 02.01.18 17:49

AW: Alpha Zero schlägt Stockfish
 
https://de.chessbase.com/post/alpha-...r-zu-alphazero
Zitat:

Zitat von Hawkwind (Beitrag 86239)

Habe da leider noch nicht raus, was das wirklich bedeutet.

Chrilly ist Dir sicherlich ein Begriff. Demnach wird tatsächlich Monte Carlo aus jeder Position bis zum Ende gespielt. Was also zählt ist das Ergebnis, nicht das Material. Und wenn ich es richtig verstehe, orientiert sich die Wahl des Zuges an der Zahl der Varianten, die zu dem relativ besten Ergebnis führen.

TomS 03.01.18 10:16

AW: Alpha Zero schlägt Stockfish
 
Hier eine recht gute Zusammenfassung:

https://de.chessbase.com/post/alpha-...ns-mit-aepfeln

Hawkwind 03.01.18 12:37

AW: Alpha Zero schlägt Stockfish
 
Zitat:

Zitat von Timm (Beitrag 86397)
https://de.chessbase.com/post/alpha-...r-zu-alphazero

Chrilly ist Dir sicherlich ein Begriff.

Den gibt's auch noch; unsere Progs haben manchmal "die Klingen gekreuzt". BTW, wir sind ja jetzt fast Nachbarn.

Danke für den Link; Chrilly schreibt ja immer recht interessant und kurzweilig. :)


Alle Zeitangaben in WEZ +1. Es ist jetzt 10:27 Uhr.

Powered by vBulletin® Version 3.8.8 (Deutsch)
Copyright ©2000 - 2024, vBulletin Solutions, Inc.
ScienceUp - Dr. Günter Sturm