Einzelnen Beitrag anzeigen
  #1  
Alt 31.08.08, 16:38
Benutzerbild von richy
richy richy ist offline
Singularität
 
Registriert seit: 01.05.2007
Ort: karlsruhe
Beitr?ge: 4.170
Standard Zipfelsinn III

Hi
Mit dem "Zipfelsinn", ein Guetemass dass ich aus der Zipf Verteilung hergeleitet habe, laesst sich die semantische Information einer Nachricht abschaetzen.
Falls es so eine gibt.
Zum Beispiel laesst sich damit alleine aus den Noten messen, ob Mozart oder Stockhausen harmonischer im Klang ist.
Ich hatte dieses Prinzip auch auf Zahlenreihen angewendet.
Numerisch Versuche ergaben, dass insbesonders folgene Klassen Z-verteilt sind:

- Die Primfaktoren der Fibonaci Zahlen
- Die Werte der Verhulst Gleichung fuer den Parameter 1+Wurzel(8), also
der 3 er Zyklus direkt vor der letzen grossen Insel der Ordnung.
http://home.arcor.de/richardon/richy...zipf/verh1.htm
Hierfuer habe ich das Guetemass auch fuer ein Set der r Parametern verwendet. Und es zeigte sich dass hier eine Korrelation zum, Ljapunov Exponenten, wenigestens bei der Verhulst Gleichung besteht.
Allerdings beschraenkt diese sich vornehmlich auf die Nullstellen.




rot=Zipelsinn
blau=Ljapunov (Ich weiss den schreibt man anders)

Der Ljapunov ist ein numerischer Wert, der die Ordnung eines System beurteilt.
neg=Ordnung, 0=Verzweigung, pos=chaos,
Nachteil: Man benoetigt die Systemfunktion des Prozesses.
Ein Ordnungsmass alleine aus den Messwerten waere doch super. Und ich bin ja nicht weit davon entfernt.

Im folgenden moechte ich dazu mein Guetemass, die Abweichung von der Verteilungs Funktion 1/i "verbessern".
Bisher habe ich dazu einfach das Gaussche Fehlerquadrat benutzt.

Die "schoenste Formel der Welt", die Methode der kleinsten Quadrate von Gauss, hat mich nun angespornt doch mal etwas anderes auszuprobieren.
Mein neuer Ansatz wird uebrigends auch bei Wiki im Zusammenhang mit der Zeta/Zipf-Verteilung erwaehnt. Sorry wenn ich hier manchmal verkeurzt Z Verteilung schreibe. Ich meine dann nicht die Fisher Z Verteilung.
http://de.wikipedia.org/wiki/Zeta-Verteilung

Mir erschien der Aufwand fuer die Berenchnung des Paramaters n in i^n bisher etwas zu gross, da ich damit rechnete, dass man hierfuer ein GL System loesen muesse.
Was natuerlich kein Prob ist,aber zeitintensiv.
Die Synthesefunktion i^n ist aber etwas ganz einfaches.
Im folgenden wird sich auch zeigen, dass fuer die Aproximation auch lediglich ein Integral
numerisch zu bestimmen ist. Also sehr einfach und nicht zeitintensiv.


Bin mir nicht sicher ob meine Rechnung richtig ist, vielleicht kann sie jemand mal kontrollieren, oder die Aufgabenstellung als Uebung selber loesen:


AUFGABE:
********
Gegeben ist eine Reihe von M Messwerten f(x) x=1..M, f(x)>0, x element N
Approximieren sie die Messwerte durch eine Funktion s(x)=x^n
Zu Bestimmen ist also ein Parameter n fuer eine "gute" Approximation.

Skizze meiner Loesung
*****************
Fehlerintegral nach Gauss :
J(x,n)=int( (f(x)-x^n)^2 dx ) soll minimiert werden
dJ(x,n)/dn=int( -2*n*(f(x-x^n)*x^(n-1) dx)=0

Fuer n<>0 und elementaren Umformungen
....
Int f(x)*x^(n-1) dx =int x^(2*n-1) dx
f(x) liegt mir als Messwerte vor. Ich muss also numerisch integrieren.
Sieht bischen uebel aus die Gleichung. Ich habe jetzt folgenden kleinen
Kustgriff verwendet. Auf beiden Seiten logarithmiert.
Frage : Welche Einschraenkungen muss ich dabei beachten ?

Int log(f(x)*x^(n-1)) dx =int log(x^(2*n-1)) dx
Logaritmengesetzt angewendet ...
n=int log(f(x) dx / int log(x) dx
***********************
Sieht schonmal ganz gut aus oder ? :-)
Ich integriere in den Grenzen 0 bis M
NENNER
int log(x) dx = x*(log(x)-x) Grenze 0..M = M*log(M)-M+1

ZAHLER
Den kann ich nur nuerisch intgrieren zum Beispiel ganz einfach ueber eine Summe, so dass ich n nun bestimmen kann:

Ergebnis
******
Eine Messreihe f(x) von M pos Werten wird ueber x^n gut approximiert wenn gilt :
***********************************
n=Integral(x=1..M, log(f(x)) / (M*log(M)-M+1)
***********************************
(x element N)

Ich habe mal ein paar Tests mit verschiedenen Funktionen durchgefuehrt.
Das scheint einwandfrei zu funktionieren.
Damit habe ich nun die Moeglichkeit fuer eine Reihe von Messwerten den Exponenten n zu bestimmen.Fuer n=-1 liegt die Zipf verteilung vor. Als Guetemass waere also 1+n sinnvoll.
Jetzt erhalte ich sowohl pos als auch neg Werte. Ich bin schon gespannt ob die mit dem
Ljapunov korreliert sind.

BTW :
In den Schaubildern oben ist der LE um den Faktor 0.2 gestaucht.

Ge?ndert von richy (02.09.08 um 03:24 Uhr)
Mit Zitat antworten