PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Zipfelsinn III


richy
31.08.08, 16:38
Hi
Mit dem "Zipfelsinn", ein Guetemass dass ich aus der Zipf Verteilung hergeleitet habe, laesst sich die semantische Information einer Nachricht abschaetzen.
Falls es so eine gibt.
Zum Beispiel laesst sich damit alleine aus den Noten messen, ob Mozart oder Stockhausen harmonischer im Klang ist.
Ich hatte dieses Prinzip auch auf Zahlenreihen angewendet.
Numerisch Versuche ergaben, dass insbesonders folgene Klassen Z-verteilt sind:

- Die Primfaktoren der Fibonaci Zahlen
- Die Werte der Verhulst Gleichung fuer den Parameter 1+Wurzel(8), also
der 3 er Zyklus direkt vor der letzen grossen Insel der Ordnung.
http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/zipf/verh1.htm
Hierfuer habe ich das Guetemass auch fuer ein Set der r Parametern verwendet. Und es zeigte sich dass hier eine Korrelation zum, Ljapunov Exponenten, wenigestens bei der Verhulst Gleichung besteht.
Allerdings beschraenkt diese sich vornehmlich auf die Nullstellen.

http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/zipf/erg1.gif
http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/zipf/erg2.gif

rot=Zipelsinn
blau=Ljapunov (Ich weiss den schreibt man anders)

Der Ljapunov ist ein numerischer Wert, der die Ordnung eines System beurteilt.
neg=Ordnung, 0=Verzweigung, pos=chaos,
Nachteil: Man benoetigt die Systemfunktion des Prozesses.
Ein Ordnungsmass alleine aus den Messwerten waere doch super. Und ich bin ja nicht weit davon entfernt.

Im folgenden moechte ich dazu mein Guetemass, die Abweichung von der Verteilungs Funktion 1/i "verbessern".
Bisher habe ich dazu einfach das Gaussche Fehlerquadrat benutzt.

Die "schoenste Formel der Welt", die Methode der kleinsten Quadrate von Gauss, hat mich nun angespornt doch mal etwas anderes auszuprobieren.
Mein neuer Ansatz wird uebrigends auch bei Wiki im Zusammenhang mit der Zeta/Zipf-Verteilung erwaehnt. Sorry wenn ich hier manchmal verkeurzt Z Verteilung schreibe. Ich meine dann nicht die Fisher Z Verteilung.
http://de.wikipedia.org/wiki/Zeta-Verteilung

Mir erschien der Aufwand fuer die Berenchnung des Paramaters n in i^n bisher etwas zu gross, da ich damit rechnete, dass man hierfuer ein GL System loesen muesse.
Was natuerlich kein Prob ist,aber zeitintensiv.
Die Synthesefunktion i^n ist aber etwas ganz einfaches.
Im folgenden wird sich auch zeigen, dass fuer die Aproximation auch lediglich ein Integral
numerisch zu bestimmen ist. Also sehr einfach und nicht zeitintensiv.


Bin mir nicht sicher ob meine Rechnung richtig ist, vielleicht kann sie jemand mal kontrollieren, oder die Aufgabenstellung als Uebung selber loesen:


AUFGABE:
********
Gegeben ist eine Reihe von M Messwerten f(x) x=1..M, f(x)>0, x element N
Approximieren sie die Messwerte durch eine Funktion s(x)=x^n
Zu Bestimmen ist also ein Parameter n fuer eine "gute" Approximation.

Skizze meiner Loesung
*****************
Fehlerintegral nach Gauss :
J(x,n)=int( (f(x)-x^n)^2 dx ) soll minimiert werden
dJ(x,n)/dn=int( -2*n*(f(x-x^n)*x^(n-1) dx)=0

Fuer n<>0 und elementaren Umformungen
....
Int f(x)*x^(n-1) dx =int x^(2*n-1) dx
f(x) liegt mir als Messwerte vor. Ich muss also numerisch integrieren.
Sieht bischen uebel aus die Gleichung. Ich habe jetzt folgenden kleinen
Kustgriff verwendet. Auf beiden Seiten logarithmiert.
Frage : Welche Einschraenkungen muss ich dabei beachten ?

Int log(f(x)*x^(n-1)) dx =int log(x^(2*n-1)) dx
Logaritmengesetzt angewendet ...
n=int log(f(x) dx / int log(x) dx
***********************
Sieht schonmal ganz gut aus oder ? :-)
Ich integriere in den Grenzen 0 bis M
NENNER
int log(x) dx = x*(log(x)-x) Grenze 0..M = M*log(M)-M+1

ZAHLER
Den kann ich nur nuerisch intgrieren zum Beispiel ganz einfach ueber eine Summe, so dass ich n nun bestimmen kann:

Ergebnis
******
Eine Messreihe f(x) von M pos Werten wird ueber x^n gut approximiert wenn gilt :
***********************************
n=Integral(x=1..M, log(f(x)) / (M*log(M)-M+1)
***********************************
(x element N)

Ich habe mal ein paar Tests mit verschiedenen Funktionen durchgefuehrt.
Das scheint einwandfrei zu funktionieren.
Damit habe ich nun die Moeglichkeit fuer eine Reihe von Messwerten den Exponenten n zu bestimmen.Fuer n=-1 liegt die Zipf verteilung vor. Als Guetemass waere also 1+n sinnvoll.
Jetzt erhalte ich sowohl pos als auch neg Werte. Ich bin schon gespannt ob die mit dem
Ljapunov korreliert sind.

BTW :
In den Schaubildern oben ist der LE um den Faktor 0.2 gestaucht.

richy
01.09.08, 00:20
Kann jemand mit Zipfelsinn III ueberhaupt etwas anfangen ?
http://de.wikipedia.org/wiki/Zipfsches_Gesetz
http://de.wikipedia.org/wiki/Pareto-Verteilung

Korrektur :
In meiner Formel oben habe ich die Aplitude der Messwerte nicht beruecksichtigt.
Die Synthesefunktion muss korrekterweise, spezieller c*i^n lauten.
Fuer c kann man zum Beispiel f(1) waehlen.
Mit der Methode von Gauss laesst sich c leider offenbar nicht optimieren.

Nur Vollstaendigkeitshalber :
Es ergibt sich dann:

n= [ Interga(f(x) dx,x=1..M)-(M-1)*log(c)] / (M*log(M)-M+1)
**********************************************
Wobei das Integral numerisch ausgewertet wird. Z.B. mittels Trapezregel.

Die Approximation funktioniert recht gut.
Allerdings ist das Ergebnis nicht sehr viel besser, wie das bisherige Guetemaß.
Die Appproximation stellt eine Naeherung dar waerhend das Fehlerquadrat keine Naeherung enthalt.
Das ist ein Vorteil des Zipfelsinns gegenueber dem neuen Guetmaß.

Nur wenn das System nicht Eingeschwungen ist, sich also noch keine Periodizitaeten
ausbilden, wird der Ljapunovexponent dennoch erstaunlich gut, besonders im chaotischen Bereich incl Vorzeichen abgebildet.


ciao

richy
01.09.08, 21:31
Ergebnisse (ohne Vorlauf, Integration 2 ter Ordnung)
http://home.arcor.de/richardon/2008/lja2.gif
http://home.arcor.de/richardon/2008/lja1.gif

rot=Guetemaß
gruen= Ljapunov
Unterteilung des Intervalls 0..1 in 200 Klasse
Parameter ist der Wert r der Verhulst Gleichung
Diese wurde in 100 Abschnitte aufgeloest
Dass Bild zeigt also 100 numerische Experimente (Wie beim Feigenbaumdiagramm)
In jedem Experiment wurden 1000 Iterationsschritte durchgefuehrt.

Bei eingeschwungenen Periodizitaeten liegt eine Gleichverteilung vor.
n ist dann gleich 0 und n+1=1
Alleine aufgrund diesen Aspekts kann das Guetemaß nicht mit dem LE identisch sein.
Daher auch die grossen Abweichungen im negativen Bereich,geordneten,periodischen Bereich.

Beispiel fuer die x^n Approximation in lineraem Maßstab :
n= [ Interga(f(x) dx,x=1..M)-(M-1)*log(f(1))] / (M*log(M)-M+1)
http://home.arcor.de/richardon/2008/appro2.gif
Horizontale Achse : (Klassennummer)
Vertikale Achse : (Auftrittswahrscheinlichkeit)
rot=Meßwerte
gruen=Approximation

Beispiel fuer die x^n Approximation in logarithmischem Maßstab :
http://home.arcor.de/richardon/2008/appro.gif

Horizontale Achse : log(Klassennummer)
Vertikale Achse : log(Auftrittswahrscheinlichkeit)

Das funktioniert also recht gut.

richy
02.09.08, 04:14
Eingeschwungener Zustand:

Folgendes Schaubild zeigt die Simulation mit einem Vorlauf von 100 Iterationen.
Damit ist gewaehrleistet, dass periodische, geordnete Zusatende eingeschwungen sind :
http://home.arcor.de/richardon/2008/lja3.gif
rot gibt den Exponenten n der Verteilungsfunktion an.

Der roten und gruenen Kurve scheint zunaechst wenig gemeinsam.
Die Darstellung zeigt, dass es nicht das Ziel sein kann, den Ljapunov
Exponenten ueber eine Betrachtung von Verteilungen zu reproduzieren.
Das ist aber auch ueberhaupt nicht notwendig.
Das eigentliche Interesse liegt darin chaotische und nichtchaotische Systeme
zu unterscheiden. Zusaetzlich sollen die Uebrgaenge beider Zustaende, Birfurkationen detektiert werden.

Wenn man genau hinschaut :

Mit n=n'+1 gibt es drei Bereiche :

1)n=0 (auf jeden Fall eine Birfukation)
2)n in etwa 0.5 (chaotischer Bereich)
3) n=1 (deteminierter, periodischer, gleichverteilter Bereich)
Natuerlich gibt es auch gleichverteilte Zufallsprozesse.
Die Methode ist also nicht eindeutig

Aus den Ergerbnissen ohne Vorlauf folgt noch eine vierter
Bereich :
n<0, der dem nichtchaotischen Bereich zuzuorden ist, wenn dieser
nicht eingeschwungen ist.

Man kann mit dem Ergebnis also schon etwas anfangen.

Hamilton
02.09.08, 21:31
Das ist ja ganz interessant, aber ich hätte da ein paar Kommentare:
Soweit ich das sehe, hast Du mit deiner Zipfdistance (ich schlage diesen Namen vor, denn Zipfelsinn klingt schon etwas naja, oder?), die nichts anderes ist als der (euklidische?) Abstand der Werteverteilung einer Zahlenfolge zu (irgendeiner?)-Zipfverteilung.
Das Gauß'sche Fehlerintegral ist das hier:
http://upload.wikimedia.org/math/5/5/e/55eab29eea80a1e65693a5292e43433f.png
Das ist aber völlig unbrauchbar, da du ja nicht davon ausgehst, dass hier irgendwas Gaußverteilt ist, daher denke ich, dass das wieder nur ein Namensproblem ist.
Nach http://en.wikipedia.org/w/index.php?title=Zipf%27s_law&oldid=229365506
ist Zipf's law states that given some corpus of natural language utterances, the frequency of any word is inversely proportional to its rank in the frequency table. Thus the most frequent word will occur approximately twice as often as the second most frequent word, which occurs twice as often as the fourth most frequent word, etc. For example, in the Brown Corpus "the" is the most frequently occurring word, and by itself accounts for nearly 7% of all word occurrences (69971 out of slightly over 1 million). True to Zipf's Law, the second-place word "of" accounts for slightly over 3.5% of words (36411 occurrences), followed by "and" (28852). Only 135 vocabulary items are needed to account for half the Brown Corpus.
Also eine typische Verteilung von Wörtern in einem "sinnhaltigen" Text, verfasst in englischer, oder vermutlich auch einer anderen Sprache.
Trotzdem ist es ein bisschen hoch gepokert zu behaupten, es sei ein Maß für den semantischen Inhalt eines Textes- viele Texte folgen scheinbar Zipf's Law, ob nun sinnvoll oder nicht. Der Schritt, das zu verallgemeinern und die Verteilung einer Zahlenfolge damit zu untersuchen und das Ergebnis als semantisches Informationsmaß zu verkaufen ist noch viel gewagter.
Immerhin hast du dort hohe Werte, wo der Verlauf der logist. map periodisch ist, also extrem langweilig, wie ich finde. Warum das Maß scheinbar völlig unbeeindruckt von der Zyklenzahl ist, müsstest du auch noch begründen, wenn du an dieser Interpretation festhalten willst.

Trotzdem ist es interessant zu sehen, dass da was bei herauskommt.
Immer dort, wo der Lyapounovexponent positiv ist, nimmt dein Maß ab. Nur in den nichtchaotischen Inseln und vor dem ersten Übergang ins Chaos hast Du hohe Werte, vermutlich weil du dort n-fach Zyklen hast und die sind halt periodisch und haben eine ganz andere Verteilung als die chaotischen Bereiche, die scheinbar eher eine Powerlaw bzw. Zipfverteilung haben.

Also Fazit: Dein Maß ist interessant, du solltest aber nochmal genau und in möglichst wenigen gut strukturierten Formeln aufschreiben, wie genau es definiert bzw. gebildet wird- von welcher Zipfverteilung du ausgehst, wie du die Parameter wählst und wie du den Abstand genau berechnest (ich weiß, steht irgendwo im Code, aber du kennst mich doch inzwischen, ich mag es auf dem Silbertablett, vorgekaut- ich will nicht lang suchen müssen)
Dann solltest du mal versuchen das gegen andere Verteilungen zu testen- z.b. Gauß, Poisson, Weibull
wäre doch interessant zu wissen, ob es mit denen auch geht oder was da sonst passiert.
Ich weiß allerdings nicht, ob es wirklich eine gute Anwendung dafür gibt, für die es nicht bereits "sauberere" Methoden gibt, aber das wird man sehen.

richy
03.09.08, 02:35
Hallo Hamilton
Vielen Dank fuer dein Interese an meinem Beitrag.
Erstmal :
Ja, ich habe an mehreren Stellen eine falsche Bezeichnung fuer die Methode der kleinsten Quadrate gewaehlt. Diese ist von Gauss und man integriert schliesslich ueber alle Fehlerquadrate. Der Name Gaussches Fehlerintegral ist aber wie du auch festgestellt hast schon fuer ein anderes Integral vergeben :
http://upload.wikimedia.org/math/5/5/e/55eab29eea80a1e65693a5292e43433f.png
Das hat mit meiner Berechnung aber nichts zu tun. Ich muss die falsche Bezeichnung noch auf einigen Seiten korrigieren.
Weisst du den korrekten Namen fuer das Integral der Methode der kleinsten Quadrate ?

Methode der kleinsten Quadrate :
*************************
Wenn ich ein Funktion f(x) ueber eine Synthesefunktion s(x) annaehern will, messe ich die Abstandsquadrate wie dieses Bild zeigt.
http://home.arcor.de/richardon/richy2001/mathe/gauss/err1.gif
Man waehlt Synthesefunktionen die von einem oder mehreren Parametern a abhaengen.
Nun integriere ich alle Abstaende :
J=Integral(f(x)-s(x,a)^2dx)
Der Fehler J kann ich minimieren indem ich dJ(a)/da=0 bilde
Liegen mehrere Parameter a vor muss ich dazu ein Gleichungssystem loesen.
Die Mehode ist recht bekannt. Waehlt man harmonische Funktionen ist wegen der Orthogonalitaet nur die Hauptdiagonale des Gleichungssystems besetzt. Dies nuetzt z.B. die Fourierreihenapproximation aus.
Meine Simulation ist aber weitaus einfacher.

Was habe ich fuer die Erstellung der Schaubilder also konkret getan ?
Es sind Simulationen der logistischen Gleichung y(k+1)=r*y(k)*(1-y(k))
in der ich ueber r den Ljapunov analytisch berechne.

Und zusaetzlich :
Messe ich fuer jede Funktion die Verteilung der Werte.
Dazu diskretisiere ich das Intervall [0..1] und zaehle wie oft die Werte in den entsprechenden Bereich fallen. Eine ganz uebliche Vorgehensweise, wie sie auch bei der Zipf Verteilung oder anderen Verteilungen benutzt wird.

Und dann gehe ich recht einfach vor :

(alte "Zipfelsinn") Methode 1:
**********************
Hier bestimme ich lediglich das Integral, besser die Summe ueber alle Abstandsquadrate zwischen der ermittelten Verteilung und der Zipf Verteilung: Die wie du angegeben hast lautet:
http://upload.wikimedia.org/math/b/e/7/be72da0329b77dabb02cfa0c95854c80.png
Allerdings gilt im Zipfschen Gesetzt s=1. Es ist also eine Konstante/k Verteilung. Wobei die Konstante der Normierung dient.

Ich bestimme also J=Summe( (Zipf(N)-Messverteilung(N)^2 )
Das ist alles. Und wenn die Messverteilung genau einer Konstante/k Verteilung entspricht, so ist J gleich 0.
Zum Beispiel bei der Birfukationsstellen der logistischen Gleichung bei 1+Wurzel(8).
Exakt Zipf Verteilt. Was schon merkwuerdig ist.
Genauso Woerter in Sprachen, Noten in Musik, Staedtegroessen (nicht exakt),
Auch die Primfaktoren der Fib Zahlen. Exakt 1/k. Nicht 1/k^2 oder 1/k^1.1 !
Ich meine man nennt dies einfache Zipf Verteilung oder Zipfsches Gesetz.

Methode 2:
********
Hier gehe ich aehlich vor. Statt der Summe der Abweichungen zur Zipf Verteilung zu messen versuche in den Exponenten s aus dem Messwerten der folgenden Gleichung zu bestimmen :
http://upload.wikimedia.org/math/b/e/7/be72da0329b77dabb02cfa0c95854c80.png

Dazu benutze ich (eher zufaellig) ebenfalls die Methode der kleinsten Quadrate.
Wobei ich von der Notation Konstante*k^s ausgegangen bin.
Es ergibt sich folgende Bestimmungsgleichung fuer s :
s= [ Interga(f(x) dx,x=1..M)-(M-1)*log(f(1))] / (M*log(M)-M+1)
x element N
f(x) sind die gemessenen Verteilungswerte.
M=Anzahl der Messwerte. Also Anzahl der Klassen die sich ergeben haben.
Das Integral muss natuerlich numerisch ausgewertet werden.

Dass diese einfache Approximationsformel gut funktioniert habe ich oben dargestellt.
Ich habe das auch graphisch in der Simulation fuer jeden Schritt ueberprueft.
Mein ermitteltes s passt recht ordentlich.


Fuer s=-1 ergibt sich die Zipf Verteilung.
Oder besser gesagt das Zipfsche Gesetz. Hier gilt s=-1.
Und mehr aus Anschuungsgruenden habe ich letztendlich s+1 dargestellt. Damit der Wert bei Zipf Verteilungen gleich 0 wird.
Diese treten an Birfukatoionen auf und da ist der Ljapunov auch 0.

Fuer eine weitere Diskussion ist dieses Bild aber geeigneter.
Das stellt nun wirklich s in k^s dar.
Abb A)
http://home.arcor.de/richardon/2008/lja5.gif

Trotzdem ist es ein bisschen hoch gepokert zu behaupten, es sei ein Maß für den semantischen Inhalt eines Textes- viele Texte folgen scheinbar Zipf's Law, ob nun sinnvoll oder nicht.


Ja, es ist gewagt. Darum habe ich auch geschrieben :
Mit dem "Zipfelsinn", ein Guetemass dass ich aus der Zipf Verteilung hergeleitet habe, laesst sich die semantische Information einer Nachricht abschaetzen.
Falls es so eine gibt.

Ich kann in einem Buch alle Woerter umsortieren, so dass der Text sinnlos wird. Dennoch bleibt die Wortverteilung gleich.
Aus A folgt B kann ich nicht schliessen aus B folgt A. Schon klar.
Wobe es dennoch erstaunlich ist warum die Zipfsche oder Benfordsche Verteilung ueberhaupt so oft anzutreffen ist.
Steckt in Mozart mehr semantische Information als in Schoenberg ?
Bisher koennen wir solche Information nicht messen.

Letztendlich ist es eine Spielerei. Wobei so etwas wie ein numerisch ermittelter Ljapunovexponent natuerlich ein ganz handfeste Anwendung waere. Allerdings kann dies mit den Methoden nicht exakt gelingen. Aber Birfukationsstellen zu detektieren scheint moeglich.

Immerhin hast du dort hohe Werte, wo der Verlauf der logist. map periodisch ist,
Ich denke mit Abb A) ist es nun erkenntlicher warum dem so ist.
Im periodischen Bereich habe ich s=0 gemessen. Akso eine Gleichberteilung.
Was natuerlich naheliegend ist.
Man sieht auch sehr schoen dass bei der Naeherung an die Birfukation bei etwa 3.4 eine 1/k Verteilung vorliegt. Wobei diese bei einem laengeren Einschwingen des Systems sich wohl einer Gleichverteilung naehern wurde k^0.

Was man auch schoen sieht und ich mir nicht erklaeren kann.
Im chaotischen Bereich liegt eine 1/(Wurzel(k)) Verteilung vor.
Das liegt wohl am quadratischen Charakter der Gleichung.

Und was man leider nicht gut sieht. Den 0-Peaks (Gleichverteilung,Periodizitaet) bei den Birfulationsstellen geht ein Zipf also 1/K Verteilung oder wenigstens Tendenz hierzu voraus, die nicht wahrscheinlich nicht verschwindet, einschwingt. Man muss hier sehr viel hoeher aufloesen um dies darzustellen. Daher auch diese Bild.
http://home.arcor.de/richardon/2008/lja6.gif

Die alte Methode 1 zeigt dies noch genauer und ist auch genauer
http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/zipf/erg2.gif
Hier ist die Abweichung zur 1/k Verteilung dargestellt. J=0
(BTW: Den Ljapunov habe ich hier dummerweise mit 0.2 skaliert.)
Vor dem grossen Fester der Ordung bei 1+Wurzel(8) sind die Werte genau einfach Zipf verteilt.
Genau 1/k. Hast du eine Erklaerung ? Ich nicht.

... von welcher Zipfverteilung du ausgehst,

Ich hoffe das ist jetzt klar. 1/k, also s=1, dem Zipfschen Gesetz..
Immer wenn etwas harmonisch ist scheint es genau 1/k verteilt.
Und Chaostheoretiker meinen Leben spielt sich an der Grenze zwischen Ordnung und Chaos ab. Da wird die Welt auch fraktal.
Dass der goldene Schnitt hier wohl eine Rolle spielt zeigen die Fib Zahlen.
In der Musik ist der sonst nicht so offensichtlich wie zum Beispiel der Malerei.

Viele Gruesse

richy
03.09.08, 03:00
MOZART :
http://science.orf.at/science/news/116198
http://static2.orf.at/science/storyimg/storypart_163913.gif

Uebrigends schlecht dargestellt. Auch die Achsen vertauscht ?
Man muss beide Achsen logarithmieren um eine Gerade zu erhalten.
Dann sieht man die Abweichungen sehr viel besser.

Und vielleicht nochmal ganz kurz gefasst :

Soweit ich das sehe, hast Du mit deiner Zipfdistance (ich schlage diesen Namen vor, denn Zipfelsinn klingt schon etwas naja, oder?), die nichts anderes ist als der (euklidische?) Abstand der Werteverteilung einer Zahlenfolge zu (irgendeiner?)-Zipfverteilung.

Genau, das has hatte ich mit der Methode 1 gemessen. Abstand der Werteverteilung einer Zahlenfolge zur Zipf Verteilung Kostante/k.

Und mit Methode 2 habe ich von Kostante/k^s den Exponenten s numerisch approximiert.
Wobei ich von Kostante*k^s ausgegangen bin und bisher s+1 dargestellt habe.
Abb A) zeigt s

Warum das Maß scheinbar völlig unbeeindruckt von der Zyklenzahl ist, müsstest du auch noch begründen.

Was meinst du mit Zyklenzahl ?
Durch das Einschwingen spielt die Anzahl der Iterationen schon eine gewisse Rolle.

Oder meinst du mit Zyklenzahl die Anzahl periodischer Attraktoren ?
Die Gleichverteilung beim Weg zum Chaos laesst sich in etwa erklaeren.
Hier liegt das Prinzip der Periodenverdopplung vor.2 er 4 er 8 er 16 er Zyklen
Ein 16 er Zyklus ist alle 8 Schritte ein 2 er Zyklus. Der groesste Zyklus ist maßgebend.
Pr0blematisch ist hier aber dass wenig Klassen vorliegen.

Beweisen kann ich mit einem numerischen Versuch nichts. Nur zeigen, dass die Werte
beim Weg ins Chaos anscheinend tatsaechlich gleichverteilt sind.
Und das die Konvergenz umso schlechter wird he naeher sich der Ljapunov dem Wert 0 naehert.
Daher auch die beiden Peaks im periodischen Bereich dort.Trotz 100 Vorlaufe ist die
Iteration dort noch auf dem Weg zum Attraktor.
Ein Vergleich der Langzeittendenz bei r=3 und r=1+Wurzel(8) waere noch interessant.
Z.B. ueber 100 000 Iterationen. Das geht in Minuten.
Programmiert habe ich das schon.
Ebenso eine numerisch Approximation des LE:
http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/le3.htm
Unter der Vorraussetzung , dass der gegebenen Wertetabelle eine Differenzengleichung 1 ter Ordnung zugrunde liegt.
Ich vermute das funktioniert nur bei Systemen erster Ordnung.

Was meinst du ?

Hamilton
03.09.08, 22:58
Hi,
danke für deine Antwort.
Also die Methode der kleinsten Quadrate, so heißt das, glaub ich, kenn ich, allerdings wende ich meist einfach Algorithmen an, die das effektiv implementiert haben, z.b. in Gnuplot, wenn ich eine Funktion gegen eine Datenmenge fitten will- eine typische Anwendung für diese Methode, deswegen wird sie auch gern "least square fit" genannt.
Ich denke, dass das eine Möglichkeit ist, den Abstand abzuschätzen, du könntest aber auch eher in Richtung Kullback-Leibler-Entropie gehen und das Maß damit auf einen informationstheoretischen Boden stellen; das halte ich hier für eleganter und angebracht.

Was Du jetzt mal tun solltest:
Versuch mal verschiedene chaotische Prozesse (Maps oder ODEs) auf ihre Werteverteilung zu untersuchen und zu schauen ob sie mit 1/x verteilt sind.
Also Lorenz, Rössler, Hénon, ...
Das würde mich mal interessieren, ob diese Power Law oder scalefree Verteilung charakteristisch ist für Chaos- sowas hab ich mir nie angeschaut-

Nachwievor kannst Du den Anspruch ein semantisches Maß zu haben (falls es das gibt) nicht halten. Dazu hast Du einfach keinen Anhaltspunkt, es ist nicht plausibel zu begründen.
Du hast z.b. für r=3.2 einen zweierzyklus und bei r=3.5 einen viererzyklus, aber dein Maß ändert sich nicht signifikant. Ich müsste doch davon ausgehen, dass dies einen Unterschied im Semantikgehalt gibt, wenn dein Maß das tatsächlich messen könnte.
Außerdem kann man einfach zufällszahlen generieren, die 1/x verteilt sind und die hätten dann einen anderen Semantikgehalt, als gauß-oder gleichverteilte Zufallszahlen. Mich wundert sowieso, warum du den reinen Abstand als Maß benutzt, wo doch der Abstand zu exakt 1/x verteiltem Text, wie er ja hohe Semantik aufweisen müsste, gerade einen kleinen Abstand hat-
Vergiss also lieber die Semantik, das kannst du nicht halten.

Interessant könnte dein Maß dennoch sein, sollte sich rausstellen, dass man damit leicht chaos von stochastischem Rauschen mit hoher Sicherheit unterscheiden kann, denn das wird derzeit wohl eher mit Periodogrammen gemacht und dann muss man da noch draufgucken und das entscheiden.
Ich bin mir aber nicht sicher, ob es da nicht was besseres gibt.
Also bleib dran.

Hamilton
03.09.08, 23:03
...Unter der Vorraussetzung , dass der gegebenen Wertetabelle eine Differenzengleichung 1 ter Ordnung zugrunde liegt.
Ich vermute das funktioniert nur bei Systemen erster Ordnung.

Was meinst du ?
Keine Ahnung- warum vermutest du, dass es nur bei system 1. ordnung geht?
Ich würde mal, an deiner Stelle, einige prominente Beispiele untersuchen und die Verteilung anschauen- vielleicht findest du gemeinsamkeiten, vielleicht auch nicht.

richy
03.09.08, 23:51
Hi Hamilton

... du könntest aber auch eher in Richtung Kullback-Leibler-Entropie gehen und das Maß damit auf einen informationstheoretischen Boden stellen;
Danke fuer den Tipp, danach werde ich mal googeln.

Versuch mal verschiedene chaotische Prozesse (Maps oder ODEs) auf ihre Werteverteilung zu untersuchen und zu schauen ob sie mit 1/x verteilt sind.
Also Lorenz, Rössler, Hénon, ...
Klar das wuerde mich auch interessieren. Oder auch konkrete Messdaten.
Tropfender Wasserhahn, Aktienkurse, Midifiles etc.
Wobei ich die Verteilung nur bei Uebergaengen Chaos->Orednung vermute.

BTW: Das Zipfsche Gesetz ist uebrigends eine Konstante/x Verteilung.
Konstante = 1/Summe(1/n,m=0..M)

Nachwievor kannst Du den Anspruch ein semantisches Maß zu haben (falls es das gibt) nicht halten. Dazu hast Du einfach keinen Anhaltspunkt, es ist nicht plausibel zu begründen.

Naja. Das Gegenteil kann mir aber auch niemand beweisen :-) Semantik ist ein mehr
philosophischer Begriff. Und in der Musik wird die Verteilung genau fuer den Zweck angewendet.Wobei es subjektiv ist was nun als harmonischer empfunden wird. Wenn Lang Lang oder ein Affe Klavier spielt.
Auch einem Lied mit gleichverteilten Noten wird man nicht Lang zuhoeren.
Mal abgesehen von der Basedrum.
Und irgendwie will man ja auch bischen Interesse beim Leser wecken.
Auf meiner Seite sollte auch klar sein wie dies gemeint ist.

Es ist auch seltsam wie ich dazu kam die Primfaktoren der Fib-Zahlen bezueglich der Zipf Verteilung zu untersuchen. Bei Heim spielen die Fibonacci Zahlen bei den informatorischen Koordinaten eine Rolle.
Naja wenn eine Zahl ein Satz ist, dann sind deren Primfaktoren die Woerter.
Der Versuch war recht aufwendig und man freut sich dann, wenn ein Ergebnis dabei herauskommt, das man doch eher nicht erwartet hat.

Wobei man das auch einfacher haben kann. So ist bekannt, dass die Ziffern
der Fibonacci Zahlen der Bendford Verteilung gehorchen. Die meisten beginnen
mit einer 1. Am zeithaeufigsten mit 2 e.t.c .. Irgendwie irre :D

Aber Ok.Ich werde meine Webseite mal korrigieren, welche Stellen wirklich nicht haltbar sind. Wobei die Seite nicht nur bei Mathematikern interesse wecken soll. Einige Musiker benutzen Verhulst fuer Klangexperimente.
Ein Tipp waere also Werte mit k/x Verteilung zu bevorzugen.
Ebenso gibt es akademische Arbeiten die auf biegen und brechen versuchen in der Musik
wie bei der Malerei den goldenen Schnitt zu finden. Meist an den Haaren herbeigezogen.
Die Primfaktoren der Fibonacci Zahlen koennten hier einen Hinweis liefern.
Ueberhaupt auch was das Besondere an dieser Verteilung ist.


Du hast z.b. für r=3.2 einen zweierzyklus und bei r=3.5 einen viererzyklus, aber dein Maß ändert sich nicht signifikant.

Die Zyklen im geordneten Teil sind gleichverteilt.Wirklich signifikant scheint mir auch nur die Stelle r=1+Wurzel(8). Der Uebergang zu einer grossen Insel der Ordnung mitten im Chaos.
Gerade solche Stellen sind auch von besonderem Interesse.

Außerdem kann man einfach zufällszahlen generieren, die 1/x verteilt sind und die hätten dann einen anderen Semantikgehalt, als gauß-oder gleichverteilte Zufallszahlen.
Klar habe ich mir auch schon ueberlegt. Hier auch programmiert :
http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/rnd.htm
Wobei veschiedene Verteilungen aber auch zu einem abweichenden shannonschen Informationsgehalt fuehren.

Die Zipf Verteilung ist hoestenfalls notwendig aber nicht hinreichend.
Ein Scrabbelspiel mit Buchstaben die nicht der Zipf-Verteilung entsprechen waere jedenfalls dennoch frustruerend. Immerhin steckt darin die Informatiom:
Das sind die Buchstaben einer Sprache.

Mich wundert sowieso, warum du den reinen Abstand als Maß benutzt, wo doch der Abstand zu exakt 1/x verteiltem Text, wie er ja hohe Semantik aufweisen müsste, gerade einen kleinen Abstand hat-

Verstehe ich jetzt nicht so ganz. Meinst du dass ausgerechnet Maß=0 bedeutet Zipfsches Gesetz ? Naja man koennte 1/Maß bilden.
Aber so passt es zufaellig auch gut mit dem Ljapunov zusammen.
Mit s*=s+1 habe ich oben ja auch eher Verwirrung gestiftet.

Periodogramme sind auch interessant. Sollte ich mir wieder mal anschauen.
Auch die Autokorrelationsfunktion.

BTW
Hab die Kullback-Leibler-Entropie gefunden. Danke.

ciao

Hamilton
04.09.08, 22:32
Naja. Das Gegenteil kann mir aber auch niemand beweisen :-) Semantik ist ein mehr
philosophischer Begriff.
Das ist aber höhst unwissenschaftlich- man behauptet nicht einfach so irgendwas ohne irgend eine plausible Begründung und sagt "beweis mir erst mal das Gegenteil" - sowas geht einfach nicht.

richy
04.09.08, 23:59
Das ist aber höhst unwissenschaftlich- man behauptet nicht einfach so irgendwas ohne irgend eine plausible Begründung und sagt "beweis mir erst mal das Gegenteil" - sowas geht einfach nicht.

Bei den M-Theorien geht es aber auch. Experimentell kann man die Strings DIREKT wohl niemals nachweisen. Also sie auch nicht wiederlegen.
Ebenso bei den Interpretationen der Wahrscheinlichkeitswelle.

Aber so viel liegt mir an der Intepretation der Zipf Verteilung als eine Semantik nicht, dass ich das auf meiner HP nicht korrigieren wollte.
Folgt in Kuerze.
Wobei ich die Anwendung im kuenstlerischen Fall nicht nur plausibel sondern auch spannend finde.

Die Anwendung auf die Zipf Verteilung war anfangs nur aus einer Laune heraus.
Was mich an dem Ergebnis wirklich interessierte war die Korrelation mit dem Lapunov Exponenten (LE). Aber nicht wegen irgendeiner Semantik an den Nullstellen, sondern weil ich vermute, dass meine numerische Simulation des LE nur auf DZGL#s 1.Ordnung beschraenkt ist.

Ansonsten waere ich ja zufrieden.

...Unter der Vorraussetzung , dass der gegebenen Wertetabelle eine Differenzengleichung 1 ter Ordnung zugrunde liegt.
Ich vermute das funktioniert nur bei Systemen erster Ordnung.
Was meinst du ?


Keine Ahnung- warum vermutest du, dass es nur bei system 1. ordnung geht?


Begruendung meiner Vermutung :
Grundidee des Algos :

Gegeben sie die DZGL 1.Ordnung
y(k+1)=f{y(k)}
***********
Die zur Bildung des LE notwenige Differentation der Funktion f(y) ersetze ich durch eine geeignete numerische Differentation.
Warum ich diese alleine aus den Messwerten bilden kann habe ich hier begruendet. Auch wie man dies optimiert :
http://home.arcor.de/richardon/richy2001/mathe/chaos/analytic/le3.htm
Kurz gefasst :
Jeder Messwert der Zahlenreihe ist Ausgangswert der Iteration und der
zugehoerige Eingangswert ist der Wert zuvor. "Dazwischen" liegt die Systemfunktion, die ich damit auch numerisch differnzieren kann. dy(k+1) / dy(k)
Wie man siehr funktioniert dies numerisch recht gut.

Jetzt der Fall einer DZGL 2.ter Ordnung
Gegeben sei die DZGL 2.Ordnung
y(k+1)=f{y(k),y(k-1)}
***************
Beispiel Fibonacci Zahlen :
y(k+1)=y(k)+y(k-1)

Jeder Messwert ist wie gehabt ein Ausgangswert. Aber der Wert zuvor
ist nicht der einzigste Eingangswert sondern auch noch dessen Vorgaenger.

Es liegt nicht nur eine einfache Uebertragungsfunktion y=f(x) vor sonder eine
Flaeche ueber einer Ebene y=f(x1,x2). Bei den Fib Zahlen waere die Funktion
y=x1+x2

Nahliegend waere es LE1=dy/dx1 und LE2=dy/dx2 zu verwenden. Das waere
auch einfach numerisch implementierbar. In ein paar Minuten.
So einfach ist der Sachverhalt aber sicherlich nicht.

Hier wurde das Problem im Rahmen einer Diplomarbeit wohl schon geloest.
http://elib.uni-stuttgart.de/opus/volltexte/2000/578/pdf/DIP-1793.pdf
Allerdings bin ich mit dem Lesestoff noch nicht ganz durch.
Und es geht hier um LE in einem hoeherdimensionalen Raum. Nicht direkt das was ich suche.
Wobei sich eine DZGL n ter Ordnung ein System von n Gleichungen 1 ter Ordnung ueberfuehren laesst.
Und den Loesungsansatz scheinen alle diese Verfahren zu verwenden.
In der Arbeit werden auch statistische Verfahren erwaehnt Kolmogrow Sinai Entropie.
An anderer Stelle wird der Ljapinov als ein Maß fuer den Informationsverlust bezeichnet.
Aber darin sind wir uns wohl auch einig, dass Entropie, SHANNONSCHE Information und Ljapunov miteinander verwandt sind. Die Korrelation in meinem Schaubild auch kein Zufall ist.
Nur beim Begriff Semantik nicht. Den werde ich vorerst dann auch streichen, wenn es nicht um kuenstlerische Aspekte geht.Dort finde ich den angebracht.
Ob eine Gleichung nun Kunst erzeugen kann. Die Mandelbrotmenge, deren Fraktale an den Uebergaengen uwischen chaos und Ordnung liegen.
Naja, es ist auch Geschmackssache.

richy
05.09.08, 03:55
BTW:
Die c/x Verteilung bei 1+Wurzel(8) scheint seit 1988 bekannt zu sein:
Lies mal hier Seite 152 :
http://books.google.de/books?id=5Z7E30CfM_0C&pg=PA138&lpg=PA138&dq=Kolmogorov+Sinai+Entropie&source=web&ots=uPdzPsYeVR&sig=B1uU_evaId3UfSaYRPAJ4V7gmLo&hl=de&sa=X&oi=book_result&resnum=4&ct=result#PPA152,M1
Es geht dabei um intermittierende Systeme wie Verhulst bei 1+wurzel(8) etwa 3,8259. Das wird auf Seite 149 bemerkt.
Intermittende Systeme stehen in engem Zusammenhang einer charakteristischen Struktur des Leistungssepktrums. Dem sogenannten 1/f Spektrum welches einen weiteren Hinweis auf langweitreichige Korrelation in einer reellwertigen Signalfolge liefert.
Da diese Form des Leistungsspktrums u.a auch in natuerlichen Sequenzen , Biosequenzen, Musik und Texten nachweisbar ist, ist die Frage nach einem Zusammenhang zwischen solchen Sequenzen und intermittenden Prozessen naheligend.

Na sag ich doch :D
http://home.arcor.de/richardon/2008/lja6.gif
s=-1 also x^-1=1/x

So ganz ist bei mir die Phantasie doch noch nicht durchgebrannt :-)
Und 1/f Leistungsspektrum gefaellt mir nun wirklich besser als Zipfelsinn.
(Warum Leistungsspektrum ? Naja wenn ein Zyklus die Periode 4 hat, wird er nur alle 4 Schritte gezaehlt.)
Manno das ist ganz einfach rosa Rauschen !
Da steht doch die komplette Liste :
http://de.wikipedia.org/wiki/1/f-Rauschen

Ein Börsenkurs kann ebenfalls diesem Verhalten entsprechen, wenn nämlich die Kursschwankungen im gleichen Maße stärker werden, wie sie an Geschwindigkeit verlieren.

Lol, genau das wollte ich detektieren. Ich vermutete dass es dann heikel oder beschaulich wird. Die Grenze von Ordung zu Chaos oder umgekehrt.
Klar das wuerde mich auch interessieren. Oder auch konkrete Messdaten.
Tropfender Wasserhahn, Aktienkurse, Midifiles etc.
Die Kolmogrow Sinai Entropie und Ljapunov haben tatsaechlich auch die selben Nullstellen.
Das Buch muss ich mir eigentlich kaufen..

richy
05.09.08, 16:04
(Warum Leistungsspektrum ? Naja wenn ein Zyklus die Periode 4 hat, wird er nur alle 4 Schritte gezaehlt.)
Ist die Begruendung richtig ? Ich stehe gerade auf dem Schlauch,
Haeufige Woerter haben kleine Periodendauern. Damit muessten sie doch hochfrequent sein. Sie sind im Leistungsspektrum aber sicherlich niederfrequent.
Was mache ich falsch ?
Ist f scheint nicht der Betrag der Fouriertransformierten der Zeitreihe ?
Deinem Tipp mit den Periodogrammen muss ich nochmals nachgehen.

Bezueglich Harmonie :
Auch die Schlagseite eines Betrunkenen kann zum Beispiel einem 1/f-Rauschen entsprechen, weil eine doppelt so schnelle Seitwärtsbewegung nur halb so heftig auftritt, wie die langsamere Seitwärtsbewegung. Eine dreimal so schnelle Seitwärtsbewegung ist dann nur dreimal schwächer zu beobachten, und so weiter.
Mensch, nach meiner Ansicht muesste sich ein Betrunkener doch aesthetisch und harmonisch. geradezu kuentlerisch bewegen.

Hm, diese Begriffe sollte ich auch ueberdenken :D

Lorenzy
05.09.08, 18:11
Bei den M-Theorien geht es aber auch. Experimentell kann man die Strings DIREKT wohl niemals nachweisen. Also sie auch nicht wiederlegen.
Ebenso bei den Interpretationen der Wahrscheinlichkeitswelle.
Du verwechselst da was. Weshalb sollte eine Wahrscheinlichkeitswelle oder ein String nachweisbar sein? Das wäre so als wolltest du Detektoren bauen welche die Gleichung E=mc^2 nachweisen. Beschreibungen der Natur sind nicht nachweisbar, die stehen nur in Büchern oder dergleichen.:rolleyes:

richy
05.09.08, 18:28
Ich habe geschrieben "experimentell ....nachweisen". Das heist dass ich eine moeglichst direkte Messung vornehme. Und mit moeglichst direkt meine ich dass ich einen Maßstabe an das Meßobjekt anlege. Moeglichst direkt = mit moeglichst wenig Zwischengroessen.
Was sollte ich da verwechselt haben ?
Ich habe auch nicht Betragsquadrat der Wahrscheinlichkeitswelle geschrieben, wobei ich dieses aber auch nicht direkt messen kann. Denn wenn ich es tue ist der Wellencharakter weg.
Auf den kann ich nur statistisch schliessen. Und unter der Annahme eines ergodischen Prozesses.
Die Strings sind in der Groessenordnung der Planklaenge.
Bis wir in dieser Groessenordnnung etwas direkt messen koennen werden noch ein paar Jaehrchen vergehen.
Bisher wurden noch keine Abweichungen der Gravitationskonstante bei kleinen Abstaenden gemessen.
Na gut dann war der Abstand eben noch zu gross.
Das Spielchen kann man bis zur Planklaenge weitertreiben.
Und dann ist prinzipiell Schluss.
Wenn kein kleines SL am KHC entsteht war die Energie zu klein und wir bauen einen groeseren LHC.
Solche Experimente koennen die Stringtheorie also nur verifizieren aber nicht falsifizieren.
Prima.
Kann ich was dafuer, dass niemand weiss wie man einen semantschen Informatiosgehalt definieren, messen koennte ?
Ob eine 1/x Verteilung der Inhalt eines Scabbelsaeckchens ist oder ein Buch.
Also wenn schon, dann bitte gleiches Recht fuer alle.
Wobei ich Hamiltons Meinung vertrete . Es ist in der Tat unwissenschaftlich.
In meinem Fall aber reines Privatvergnuegen.

Lorenzy
05.09.08, 21:22
Ich habe geschrieben "experimentell ....nachweisen". Das heist dass ich eine moeglichst direkte Messung vornehme. Und mit moeglichst direkt meine ich dass ich einen Maßstabe an das Meßobjekt anlege. Moeglichst direkt = mit moeglichst wenig Zwischengroessen.
[...]
Die Strings sind in der Groessenordnung der Planklaenge.
Bis wir in dieser Groessenordnnung etwas direkt messen koennen werden noch ein paar Jaehrchen vergehen.

Strings sind bisher nur mathematische Objekte und Teil einer Beschreibung die möglicherweise in der Lage ist, Beobachtungen übergeordneter Prozesse vorherzusagen. Es ist ein Trugschluss zu glauben, dass Strings die Grössenordnung der Plancklänge aufweisen müssten, weil in höheren bereits messbaren Grössenordnungen noch nie ein String beobachtet wurde. Das hat auch nichts mit Verstecken zu tun. Die Grösse der Strings folgt aus der notwendigen Konsistenz einer Stringtheorie. Stringtheorien sollten ja nicht im Widerspruch zu anderen physikalischen Theorien stehen, sondern zu einer Vereinigung führen. Was nicht passt, wird passend gemacht, aber immer mit dem guten Vorsatz der Konsistenz. Und wenn dadurch ein String, welcher in der Grössenordnung der Plancklänge liegt rausspringt, dann ist das eben so. Man darf immer die Qualität von Vorhersagen kritisieren, aber dann sollte man zumindest eine Theorie mit einer besseren Qualität vorschlagen. Jammern alleine bringt nichts.

Man kann nicht erwarten, dass man theoretische Forschung betreibt kann, ohne dass man sich Mechanismen ausdenken darf, welche für eine direkte Messung nicht zugänglich sind (wenn das so wäre hätte man diese Grenze schon vor 100 Jahren überschritten). Und dein Einwand das möglichst wenig Zwischengrössen zum experimentellen Nachweis liegen dürfen oder sollen ist ja mehr ein subjektiver Einwand. Wie ist "möglichst wenig Zwischengrössen" definiert und wer definiert das?

Und das wohl bescheuertste Argument gegen die Forschung von Stringtheorien ist die Aussage, dass in anderen erfolgsversprecherenden Bereichen, Kapazitäten an genialen Physikern und Mathematikern fehlen sollen. Zu Einsteins Zeit gab es sicher auch erfolgsversprechendere Gebiete der Physik, als dass sich irgendjemand mit sowas wie mit Raum und Zeit hätte beschäftigen sollen.

Versteh mich nicht falsch. Jemand der zurzeit die Stringtheorie als Siegesflagge durch die Gegend trägt, kann ich genauso wenig ernst nehmen, wie jemand der behauptet, dass keine Erfolgsaussichten in diesem Bereich gegeben sind.

richy
06.09.08, 00:51
Hi Lorenzy

Strings sind bisher nur mathematische Objekte und Teil einer Beschreibung die möglicherweise in der Lage ist, Beobachtungen übergeordneter Prozesse vorherzusagen.

In jedem mathematischen Modell sind die groessen mathematische Objekte.
Auch E=m*c^2 ist ein mathematisches Modell. Aber alle Symbole darin beschreiben eine physikalische Messgroesse.
Nach deiner Aussage beschreibt ein String aber noch nix und das stoert dich nicht einmal.

Es ist ein Trugschluss zu glauben, dass Strings die Grössenordnung der Plancklänge aufweisen müssten,
Ich hab schon mehrere Male versucht zu erklaren warum dem so sein muss.
Vielleicht verwechselst da etwas mit den astronomischen Strings.
http://www.stern.de/wissenschaft/kosmos/568510.html

Das hat auch nichts mit Verstecken zu tun.

Klar, man kann "verstecken" auch wie folgt umschreiben :
Die Grösse der Strings folgt aus der notwendigen Konsistenz einer Stringtheorie. Die Grösse der Strings folgt aus der notwendigen Konsistenz einer Stringtheorie.
Und welche Inkonsitenz ergaebe sich wenn sie groesser waeren ?
Vielleicht das Newtonsche Gravitationsgesetz ?


Man darf immer die Qualität von Vorhersagen kritisieren, aber dann sollte man zumindest eine Theorie mit einer besseren Qualität vorschlagen.
Welchje messbaren Vorhersagen meinst du konkret ?
Alternativen habe ich habe ich doch genannt. Die Loop Quantengravitation.
Oder zeitartige zusaetzliche Dimension. Oder beides.

Man kann nicht erwarten, dass man theoretische Forschung betreibt kann, ohne dass man sich Mechanismen ausdenken darf, welche für eine direkte Messung nicht zugänglich sind

Dass ich die String Theorie ueberhaupt erwaehnt habe hatte einen ganz konkreten Grund.
Naehmlich der folgende Dialog :

richy
Naja. Das Gegenteil kann mir aber auch niemand beweisen :-) Semantik ist ein mehr philosophischer Begriff.

Hamilton
Das ist aber höhst unwissenschaftlich- man behauptet nicht einfach so irgendwas ohne irgend eine plausible Begründung und sagt "beweis mir erst mal das Gegenteil" - sowas geht einfach nicht.

Das Gegenteil, dass mein Zipfelsinn keine semantische Information enthaelt, kann niemand beweisen. Weil es quantitativ ueberhaupt nichts zu messen gibt. Weil semantische Information bisher hoechsten qualitativ erfassbar ist.
Ich kann hoechstens eine Korrelation zwischen Verteilungsfunktionen und dem menschlichen Empfinden, Verstaendnis herstellen. Die Referenz ist also keine quantitative Groesse. Und wenn ich dies jetzt auf Zahlenfolgen uebertrage.
Dann fehlt selbst die menschliche Referenz. Oder was sagt dir 1 2 3 5 8 ?
Mein Zipfelsinn ist nicht falsifizierbar.

Natuerlich war meine Antwort etwas provokativ. Deshalb auch das Smiley.
Es war ja klar, dass Hamilton das nicht akzeptieren wird.
Aber dann waere deine Aussage aber auch voellig inakzeptabel.

Man kann nicht erwarten, dass man theoretische Forschung betreibt kann, ohne dass man sich Mechanismen ausdenken darf, welche für eine direkte Messung nicht zugänglich sind
Man kann die Stringtheorie nicht falsifizieren weil es nichts zu falsifizieren gibt.
Warst es sogar nicht du, der das Experiment bezueglich Newton und Stringtheorie hier
verlinkt hat ?
Wenn ich mir immer eine Hintertuer offen halte (noch kleinere Abstaende, noch hoehere Energien), dann ist das eine Theorie die prinzipiell nicht falsifizierbar ist.

Ausdenken darf man sich so etwas schon. Und die Wahscheinlichkeitswelle kann ich auch nur indirekt messen. Aber ich kan hier wenigstens etwas messen.

Fuer eine Theorie bedarf es neben einem Modell wenigstens einer Vorhersage, die experimentell ueberpruefbar ist. Und zwar so, dass es moeglkichst auszuschliessen ist, dass die Erfuellung der Vorhersage auch andere Ursachen haben koennte.
VWT, Kopenhagener Deutung Bohmsche Mechanik.
Alle fuehren auf die selben indirekten Messergebnisse der QM.

Also muss ich moeglichst direkt messen.

Wenn ich behaupte dass ein verschimmelter Kaese in der Kueche liegt, weil es danach riecht. Dann koennte sich genausogut eine verschimmelte Socke
dorthin verirrt haben.
Ich suche also erstmal nach dem Kaese.
Und vielleicht stinkt der so weil es halt so eine Sorte ist.
Um nachzuweisen, dass der Kaese verschimmelt ist, nehme ich am besten eine Schimmelprobe und betrachte sie unter dem Mikroskop.
Das meine ich mir direkter Messung.

Mich wuerde aber jetzt eher interessieren wie die Wellenlaenge haeufiger Woerter ist.
Kurz oder lang ?

Lorenzy
06.09.08, 02:29
Und welche Inkonsitenz ergaebe sich wenn sie groesser waeren?

Frag einen Stringtheoretiker. Leider sind in diesem Forum keine auf diesem Gebiet kompetenten Leute anwesend. Nur solche die sich dafür halten und meinen sie könnten Theorien von den klügsten Köpfen dieser Welt, mal eben so in der Luft zerreissen.:rolleyes:

Alternativen habe ich habe ich doch genannt. Die Loop Quantengravitation.

Dabei wird der Raum als dynamisches quantenmechanisches Spin-Netzwerk beschrieben, das durch Diagramme aus Linien und Knoten dargestellt werden kann. Den Knoten werden bestimmte Eigenschaften zugeordnet, die mathematisch denen des Spins von Elementarteilchen ähneln. Jedem Knoten lässt sich in gewissem Sinne ein Elementarvolumen zuordnen. Die Knotenabstände entsprechen der Planck-Länge.

Soso. Ein Netzwerk aus Knoten auf der Planckebene. Und wie weisst man diese Knoten nun experimentell möglichst direkt nach? :D

Warst es sogar nicht du, der das Experiment bezueglich Newton und Stringtheorie hier
verlinkt hat ?

Kann mich nicht an sowas erinnern.

Wenn ich mir immer eine Hintertuer offen halte (noch kleinere Abstaende, noch hoehere Energien), dann ist das eine Theorie die prinzipiell nicht falsifizierbar ist.


Aber Knoten im Abstand der Plancklänge sind dann wieder völlig ok.:confused:

richy
06.09.08, 02:53
Auch fuer die kluegsten Koepfe dieser Welt haette das Newtonsche Gravitationsgesetz bei 4 Dimensionen in etwa eine 1/r^3 Abhaengigkeit. Auf jeden Falle keine 1/r^2 Abhaengigkeit.

Soso. Ein Netzwerk aus Knoten auf der Planckebene. Und wie weisst man diese Knoten nun experimentell möglichst direkt nach?

Indem diese Knoten aus einer moeglichst einfachen Annahme folgen, die messbar ist.
Solch eine Annahme kann aber nicht sein, dass das Gravitationsgesetz propertional 1/r^2 ist.
Und daraus folgere ich, dass es zusaetzliche Dimensionen gibt, die aufgerollt sind.
Ich kann naehmlich daraus auch folgern, dass es auch aufgerollte Weihnachstmaenner gibt.
Oder noch besser, dass es gar keine zusaetzlichen raeumlichen Dimensionen gibt.
Ansonsten :
Indem ich mit dem Modell physikalische Vorhersagen treffe die sich im Eperiment ueberpruefen lassen. Bei einer TEO waere dies die theoretische Herleitung der Eigenschaften aller Elementarteichen.
Am besten solcher die noch nicht bekannt sind und erst aufgrund dieser Vorhersage gefunden werden.

Bei Heim ist die Quantisierung von Raum und Zeit im Bereich der Planklaenge auch nicht direkt messbar. Sie folgt aber aus der Annahme der Einheit von Feld und Feldquelle.
Aus E=m*c^2. Und das kann ich messen.
Und wenn ich den Rest vom Heim vergesse, koennte ich wenigstens diese Argumentation,
auch fuer die Diskretisierung der LQG heranziehen.
Und die Diskretisierung der Groessen im Mikroskopischen spricht auch nicht unbedingt gegen eine Diskretisierung von Raum und Zeit selbst.

Lorenzy
06.09.08, 03:14
Woher hast Du diese Weisheit?:mad:

EMISoll ich aus deinem :mad: schliessen, dass du dich professionell mit Stringtheorien befasst?

Lorenzy
06.09.08, 03:18
Bei Heim ist die Quantisierung von Raum und Zeit im Bereich der Planklaenge auch nicht direkt messbar. Sie folgt aber aus der Annahme der Einheit von Feld und Feldquelle.

Und woraus folgt ein String?

richy
06.09.08, 03:21
Um zu hoeren dass ein Klavier verstimmt ist muss man uebrigends kein professioneller Pianist sein.
Ein Profi wird sich aber bemuehen beim Vortrag vielleicht einige besonders verstimmte Toene auszulassen.
Ein schnelles Lied waehlen, dass man die Stimmung nicht hoert.
Ein virtuoses Lied, so dass man den Tienen nur schwer folgen kann.
Aber der professionelle Pianist kann so virtuos spielen wie er nur kann.
Das Klavier bleibt trotzdem verstimmt.

Und wenn dann dennoch einer ruft : Hey das Klavier ist ja verstimmt !
Dann gibt es sicherlich auch Leute die rufen werden :
Ruhe bitte ! Was erlauben sie sich denn ?
Das Klavier kann gar nicht verstimmt sein, weil es spielt doch ein professioneller Pianist darauf.

Lorenzy
06.09.08, 03:40
Zuerst solltest Du daraus schließen, das hier im Forum vielleicht auch User sind, die denken können.

EMI
Auf dem mathematischen Niveau von Stringtheorien?

Lorenzy
06.09.08, 03:49
Klar, auch da.
Du verstehst diese Mathematik?

Lorenzy
06.09.08, 13:19
@EMI
Keine Antwort ist auch eine Antwort.:rolleyes:

Lorenzy
06.09.08, 15:35
Leider sind in diesem Forum keine auf diesem Gebiet kompetenten Leute anwesend.
@EMI

Na dann bleib ich bei meiner Aussage. Gegen die Mathematik der Stringtheorie erscheint die der SRT wie Kinderkram. Und jemand der von sich behauptet er könne sich da durchwurschteln, ohne ein langjähriges und spezialisiertes Mathematikstudium hinter sich zu haben, kann ich nicht ernstnehmen. Sorry.

richy
08.09.08, 01:26
Hi Lorenzy

Gegen die Mathematik der Stringtheorie erscheint die der SRT wie Kinderkram.

Dem ist sicherlich so. Aber an dem mathematischen Gebaeude hat wohl auch kaum jemand etwas auszusetzen. Verstaendlichereise, weil es nur fuer Mathematiker verstaendlich ist.
Die Stingtheoerien sind aber physikalische Disziplinen. Es geht darum ob diese
Mathematik ueberhaupt etwas beschreibt, das physikalisch existiert.
Und das ist insofern schwierig, da sie kaum Aussagen macht, an dem man dies
ueberpruefen koennte.
Es geht also nicht um die Mathematik der Stringteorien, sondern deren Physik.
Um das Klavier. Nicht um den Pianisten.

Und woraus folgt ein String?
Das ist eine gute Frage. Und ich muss zugeben, dass ich das auch nicht im Detail weiss.
http://de.wikipedia.org/wiki/Stringtheorie

Je nach Grundannahmen werden in den Stringtheorien etwas unterschiedliche, aber ähnliche Schlussfolgerungen gezogen. Allen gemeinsam ist, dass Strings (englisch für Saite) als Objekte mit eindimensionaler räumlicher Ausdehnung angenommen werden.

Das hilft nicht viel weiter.Man koennte meinen, dass schon die Strings eine Grundannahme sind.
Das waere ausserordentlich schlecht.
Aber wahrscheinlich stehen darueber fundamentalere Annahmen.
Die waeren natuerlich interessanter.

Das hier waere schon konkreter:
Die Stringtheorie umgeht die in der klassischen Quantenfeldtheorie auftretenden Probleme der Singularitäten und der zu ihrer Zähmung entwickelten Renormierungstheorie. Sie ergeben sich speziell für Punktteilchen aus ihrer Selbstwechselwirkung, die bei ausgedehnten z. B. eindimensionalen Objekten „verschmiert“ und damit abgemildert wird.
Vielleicht kann dich bei WIKI auch dieser Satz ueberzeugen :

Die charakteristische Längenskala der Strings müsste in der Größenordnung der Plancklänge liegen, der Größe, ab der Effekte der Quantengravitation wichtig werden:

Das klingt nach einer mathematischen Schlussfolgerung. Das waere gut.
Physikalisch gesehen kann es auch kaum anders sein.
Den erwaehnten Versuch zum Gravitationsgestz findest du uebrigends hier :
http://science.orf.at/science/news/68625

Ich habe uebrigends laenger ueberlegt ob ich den Satz hier ueberhaupt schreibe :

Bei den M-Theorien geht es aber auch. Experimentell kann man die Strings DIREKT wohl niemals nachweisen. Also sie auch nicht wiederlegen.

Es ging mir hier nicht um die Thematik der M-Theorien selbst, sondern deren Problematik der Falsifizierbarkeit.
Natuerlich auch etwas provokativ und nicht todernst gemeint, wenn ich diese mit meiner Zipf Distanz Theorie vergleiche.
Da waere das Gegenargument, dass aus A folgt B nicht A aus B folgt .
Wobei dies aber noch keine Falsifikation ist, sondern nur eine Einschraenkung, dass A nicht hinreichend fuer B ist.
Wobei bei meiner Theorie letztendlich gar keine Falsifizierung moeglich ist, weil die semantische Information ueber ein qualitative Referenz bestimmt ist.

Hamilton hat mein Argument zu recht als unwissenschaftlich bezeichnet.
Es war ja auch nicht ernst gemeint.
Mir ist da spontan die M-Theorie eingefallen.
Ist diese denn ueberhaupt prinzipiell im Versuch fasifizierbar ?
Und wenn sie das nicht ist, dann waere das sehr fragwuerdig.

Nochmal der Link :
http://science.orf.at/science/news/68625
Theorie sagt Kraft im Abstand von 100 Mikrometern voraus
Diese Distanz ist deswegen von Belang, weil gemäß den Vorhersagen einiger String-Theoretiker, die "aufgerollten" Raumdimensionen gravitationsähnliche Kräfte mit einem Wirkungsbereich von 100 Mikrometern entfalten sollten.

Ein Beispiel dafür ist die Arbeit "Extra Dimensions at the Weak Scale and Deviations from Newtonian Gravity" von Z. Chacko und E. Perazzi, die als Volltext am CERN Document Server erhältlich ist.
...
Joshua Long und seine Mitarbeiter konnten indes keinerlei neue Kräfte finden: "So far, Newton is holding his ground", stellte C. D. Hoyle in seinem Kommentar trocken fest.

Welche Folgerung gibt es daraus ?
Keine.
Welche Folgerungen wird es geben wenn am LHC kein kleines SL detektiert wird ?
Keine.
Welches Experiment kann die M-Theorie angeben um zu entscheiden ob das Modell die physikalische Welt NICHT ! beschreibt.
Anscheinend keines

BTW :
Der Thread hier hies : Zipfelsinn III
Unsere Diskussion hat damit leider nichts mehr zu tun.
Ich habe daher einen Folgethread Rosa Rauschen aufgemacht, der leider bisher unkommentiert blieb.
Das Interesse am Ausgangsthema scheint gering.
Vieleicht koenntest du unsere Diskussion dennoch auslagern.
Ware nett.

Hamilton
08.09.08, 09:33
..Du siehst, es war sehr unklug, dieses M-Theorieagrument einzubringen :) Denn jetzt redet niemand mehr über deinen Kram (OK, so hätte ich das geschrieben, bis mich jemand freundlich darauf aufmerksam gemacht hat, dass "Kram" negativ besetzt ist, daher schreibe ich ..redet niemand mehr über deine geistigen Ergüsse.

Jetzt ist viel geschrieben worden und ich muss lang antworten:

Ich sehe, du stimmst mit mir überein, dass es unwissenschaftlich ist, zu behaupten, Du könntest mit deiner "Zipfness" oder "Zipf-Distance" soetwas wie Semantik messen, ohne vernünftig zu definieren, was denn Semantik überhaupt ist.
Die "Information" aus der Infotheorie I = -ln p ist ja auch ein einfaches mathematisches Konstrukt, dass einfachen, sinnvollen Forderungen genügen soll- hat, aber, wie du weist, keinen "menschlichen" Charakter- also die Information muss nicht semantisch, oder bedeutsam sein.
Ich bin davon überzeugt, dass Semantik, nennen wir es "verwertbare Information" von der Interpretation und Interpretationsfähigkeit des Empfängers abhängt.
Ein Satz auf Chinesisch mag für einen Chinesen wahrhaft Informativ sein, für mich ist er allenfalls dekorativ (z.b. über dem Eingang eines Chinarestaurants hängend).
Daher denke ich, dass ein allgemeines Semantikmaß, das einigermaßen unsere Alltagsvorstellung von Semantik wiedergeben soll, nicht möglich ist, da Semantik ein höchst individueller Begriff ist.


Periodogramm:
ist gleichbedeutend mit Power Spectral Density Estimate.
Das ist also die Fouriertransformierte aus der Autokorrelation.
GGf. kann man das Signal mit irgendwelchen Fensterfunktionen z.B. Bartlett, Hamming... glätten. Eine gute Weiterentwicklung ist die Welch-Methode

Damit bekommst du die "Frequenzverteilung" (ist jetzt nicht zwingend normiert-bzw. Verteilung nicht im Sinne von Statistik)
einer Zeitreihe raus.

Mal ein Tipp von mir:
Du benutzt ja Maple-
ich hatte das auch mal, da ich aber überwiegend mit numerischen Problemen zu tun hab und Maple da ganz klar Performancenachteile hat, benutze ich statt dessen Matlab- und seit Neustem Python mit den Modulen NumPy und Pylab.
Das Arbeiten mit Python ist wirklich sehr intuitiv- es gibt viele nützliche Funktionen, die bereits fertig vorliegen, die man nur noch benutzen muss, es ist schnell und vor allem FREEWARE!
Wage den Umsteig, es lohnt sich!


M-Theorie
Lorenzy hat recht: Niemand hier im Forum ist da wirklich kompetent, und wenn doch, dann hat er es bislang nicht durchblicken lassen.
Alles was ich selbst darüber weiß, ist das, was Hawking in seinen PopPhysik Büchern schreibt, aber das sind nur Ergebnisse, runtergekocht so dass "normale" Menschen glauben, das zu verstehen.
Ich habe mal, nachdem ich Vorlesungen über Quantenmechanik, relativistische Quantenmechanik und Quantenfeldtheorie gehört habe, ein Skript angesehen, dass Stringtheorie einführt- das habe ich nach kurzer Zeit wieder aus der Hand gelegt.
Die Konzepte sind mathematisch sehr anspruchsvolle Weiterentwicklungen von Quantenfeldtheorie. Selbst wenn man über ein paar Grundlagen verfügt, ist das immer noch abartig schwer!
Fazit: Die Natur dieser Theorie ist eine Hochform der Mathematik- jeder Versuch sich der Problematik ohne Mathe zu nähern ist lächerlich!

richy
09.09.08, 00:33
Hi
Naja, geistige Erguesse ist auch nicht sonderlich neutral. Waehle doch einfach Brechnung als Bezeichnung. Das ist neutral :)
..Du siehst, es war sehr unklug, dieses M-Theorieagrument einzubringen
Ja, sehe ich auch so, aber ich konnte es mir eben nicht verkneifen.
Ich bin davon überzeugt, dass Semantik, nennen wir es "verwertbare Information" von der Interpretation und Interpretationsfähigkeit des Empfängers abhängt.
Das scheint naheliegend. Ich hatte das so beschrieben, dass ein Mensch als Referenz notwendig ist.
Man koennte das Thema noch vertiefen und danach Fragen wie dies bei mathematischen oder physikalischen Gesetzen aussieht.
Wie ist deren Sinngehalt. Und vor allem: Existiert dieser unabhaengig von der Interpretationsfahigkeit eine Empfaengers ?
Aber so weit wollte ich das gar nicht betrachten.
Lediglich Erklaerungen finden warum es dieses Zipfsche Gesetzt ueberhaupt gibt.
(das hat mich vor 20 Jahren schon fasziniert)
Und das 1/f Spektrum scheint hier Antworten liefern zu koennen.

Beim 1/f-Rauschen handelt es sich um ein Rauschen, das in vielen physikalischen, biologischen aber auch ökonomischen Prozessen auftritt. Dieses Rauschverhalten ist immer dann zu beobachten, wenn bestimmte Ereignisse bei doppelter Geschwindigkeit (respektive bei doppelter Frequenz) nur halb so intensiv auftreten. Dieses ist leicht nachzuvollziehen, weil der Aufwand für Änderungen naturgemäß mit deren Geschwindigkeit immer weiter wächst.

Allerdings erklaert dies ein physikalisches 1/f Spektrum. Fuer reine Zahlenfolgen muesste man das Wort "Aufwand" anders deuten.

Periodogramm:
ist gleichbedeutend mit Power Spectral Density Estimate.
Das ist also die Fouriertransformierte aus der Autokorrelation.
Danke. Das ist auch Thema bei der "Nachrichtenuebertrageung" und "Digitale Datenuebertragung".
Leider hab ich da einiges wieder vergessen.

Allerdings ist mir immer noch nicht ganz klar wie dies mit der Verteilungsfunktion zusammenhaengen soll. Der Zusammenhang scheint aber recht sicher gegeben.
Ist es wirklich die Fouriertransformierte oder deren Betrag ?
Wenn ich 1/f ruecktransformiere erhalte ich f(t)= -1/2*I*(-Heaviside(t)+Heaviside(-t))
Das ist sicherlich nicht die AKF eines 1/x verteilten Prozesses.
Die ist ein Maß fuer die Korrelation innerhalb einer Funktion in Abhaengigkeit vom Abstand tau. Das Faltungsintegral der Funktion mit sich selbst.
Ah, Faltung wird im Bildbereich der FT zu einer Multiplikation.
Man erhaelt also auf jeden Fall das Betragsquadrat der F-Transformierten.


1/f-Rauschen kann hörbar gemacht werden, indem eine diskrete eindimensionale komplexe Funktion mit einer mit hyperbolisch abfallenden Amplitude und zufälliger Phase invers fourier-transformiert wird

Warum hyperbolisch ? Und welche hyperbolischen Funktionen genau ?
Der Zusammenhang ist mir einfach noch nicht klar.
Die zufaellige Phase scheint mir ein Hinweis dass mit 1/f das Betragsquadrat der FT gemeint ist.

Bei gefärbtem Rauschen, das in technischen Systemen meistens an Stelle von weißem Rauschen vorkommt, ergibt sich ebenso ein absolutes Maximum der Autokorrelationsfunktion bei τ = 0 und ein Abfall der Autokorrelationsfunktion für Verschiebungen | τ | > 0. Die Breite dieses Maximums wird von der "Farbe" des Rauschens bestimmt.

Muss ich wohl doch mal wieder in "Nachrichtenuebertragung" nachschlagen.
Oder kannst du mir den Zusammenhang kurz erklaeren ?

Nochmal zur M Theorie
Ist deren physikalischer Inhalt also vertrauenswuerdig,weil das Modell mathematisch so anspruchvoll ist ? :D
Weil die Mathematik so anspruchsvoll ist zaehlt der Versuch hier dann irgendwie nicht :
http://science.orf.at/science/news/68625
Die Meßgroessen dort haben wahscheinlich selbst nicht kapiert wie er sich verhalten sollen, weil alles so schwierig ist. :D
Wozu haben sich die beiden Forscher dann ueberhaupt die Muehe gemacht ?
Naja ich kanns halt net lassen.

Mathlab hab ich auch auf dem Rechner. Wenns richtig schnell sein soll programmiere ich aber einfach in C. Gibt nichts schnelleres. Werde deinen Tipp ausprobieren.

Hamilton
09.09.08, 20:42
Ist es wirklich die Fouriertransformierte oder deren Betrag ?
Der Betrag- manchmal auch der Logarithmus des Betrages.

Die Verteilung der Features dürfte eigentlich nichts mit dem Spektrum zu tun haben. Das sind auch zwei völlig verschiedene Dinge. Ich kann aus einer Zeitreihe ihre Autokorrelation berechnen und diese Fouriertransformieren- ein Text hat keine Autokorr.
Man muss sich irgendwas anderes ausdenken- z.b. die (zeitl) Abstände zwischen dem Auftreten eiens Worts in einem Text ermitteln oder man betrachtet eien Text mit 5 versch. Wörtern als 5dim Zeitreihe-
Man kann aber annehmen, dass ein Wort mit seltener Auftrittswahrscheinlichkeit eine niedrige Frequenz hat (im Mittel)

Ich glaube aber, dass Periodogramme für deine Zipfdistanz unerheblich sind.

Mathlab hab ich auch auf dem Rechner. Wenns richtig schnell sein soll programmiere ich aber einfach in C. Gibt nichts schnelleres. Werde deinen Tipp ausprobieren.
Matlab ist schön- C ist schnell und frei, aber anstrengend- es ist ja nichts da- alles muss man selber machen.
Die ganzen Pythonbibliotheken erleichtern einem die Arbeit ungemein.

Hamilton
12.09.08, 08:53
nanu? was ist los? Wann gibt's neue Ergebnisse?

richy
13.09.08, 14:37
Hi Hamilton
Der Betrag- manchmal auch der Logarithmus des Betrages.

Die AKF enrspicht im Zeitbereich einer Faltung. Daher ist sie automatisch der Betrag der FT. Theorem von Wiener-Chintschin
Der Log ist fuer die Darstellung.

ein Text hat keine Autokorr.
Jeder Prozess hat eine AKF. Bei einem Zufallsprozess ordnet jedem Merkmal eine Zahl zu. Zum Beispiel jedem Wort ueber die Klassennummer. Das ist die uebliche Vorgehensweise. Ein Wuerfel muss nicht die Zahlen 1..6 aufweisen. Auch bei einem A...F Wuerfel , waere der selbe Zufalssprozess beschrieben.

Ich glaube aber, dass Periodogramme für deine Zipfdistanz unerheblich sind.
Um die geht es mir momentan gar nicht sondern den Zusammenhang 1/x und 1/f Verteilung.

Die Verteilung der Features dürfte eigentlich nichts mit dem Spektrum zu tun haben. Das sind auch zwei völlig verschiedene Dinge.

So dachte ich anfangs auch. Ein Zufallprozess ist durch seine Verteilung beschrieben. Aber ebenso durch seine spektrale Leistungsdichte.
Genau den Zusammenhang suche ich. Im Moment in den Buechern meiner Studienzeit.
Hier wird auf den Zusammenhang doch implizit hingewiesen :

Intermittende Systeme stehen in engem Zusammenhang einer charakteristischen Struktur des Leistungssepktrums. Dem sogenannten 1/f Spektrum welches einen weiteren Hinweis auf langweitreichige Korrelation in einer reellwertigen Signalfolge liefert.
Da diese Form des Leistungsspktrums u.a auch in natuerlichen Sequenzen , Biosequenzen, Musik und Texten nachweisbar ist, ist die Frage nach einem Zusammenhang zwischen solchen Sequenzen und intermittenden Prozessen naheligend.
Wie erklaest du dir sonst den Zusammenhang ?

Die AKF in Form der Faltung der Zeitfunktion ist ein Spezialfall, der nur fuer ergodische Prozesse gilt. Die allgemeine Definition, die mir aber auch kaum gelaufig ist, benuetzt die Verbundwahrscheinlichkeit von Ensemblefunktionen.
Ich schreibe sie morgen hier mal an.

Einen Zusammenhang koennte ich mir so vorstellen.
Man benutzt weisses Rauschen als idealisiertes gleichverteilten Zufallsprozess. Die AKF ist ein Diracpuls, das Spektrum konstant.

Jetzt erzeugt man daraus ueber ein System die Zielverteilung. Das funktioniert ueber die Methode des aequivalenten Ereingis.
(So ist auch mein RND Generator programmiert)
Nun bildet man das Betragsquadrat der Systemfunktion im Frequenzbereich und multipliziert es mit dem Eingangspsektrum des Rauschens. (Also eins) und erhaelt das zu erwartende Spektrum.

Das nur mal als Skizze.
Verteilung und Spektrum sind natuerlich nicht das Gleiche. Ein 1/jf Spektrum waere eine Intergration weissen Rauschens. Aber nicht vom Betragsqzadrat her.
Koennte sein, dass hier die Mathematik sehr aufwendig wird.

Hamilton
13.09.08, 17:40
Die AKF enrspicht im Zeitbereich einer Faltung. Daher ist sie automatisch der Betrag der FT. Theorem von Wiener Kithyne.
Der Log ist fuer die Darstellung.
Hä?
Ich meine Periodogramm(f) = abs<-fft<-akf(t)
bzw. log davon- ja natürlich wegen der darstellung, hey was glaubst du, mit wem du hier sprichst?!

richy
14.09.08, 03:10
Hi Hamilton

Ich war heute bischen in Eile, daher nur die kurzen Antworten.
Ich meine Periodogramm(f) = abs<-fft<-akf(t)

Die Bezeichnung Periodogramm ist mir weniger gelaufig.
http://de.wikipedia.org/wiki/Periodogramm
Das Periodogramm ist als Schätzer für das Spektrum völlig ungeeignet. Dies liegt daran, dass wenn die beobachtete Zeitreihe beliebig lang wird, die Varianz des Schätzers immer von der gleichen Größenordnung wie der Erwartungswert bleibt und nicht gegen Null konvergiert.

Meine Frage bezueglich des Betrags hatte sich von alleine erledigt.

Die AKF eines ERGODISCHEN Prozesses fuer ein Zeitsignal x(t) lautet :
http://upload.wikimedia.org/math/f/8/2/f8211f931fb1da53ff0ab4c5279f25d5.png
(BTW: Das ist nicht die allgemeine Definition sondern nur die Form wie sie praktisch fuer ergodische Prozesse angewendet wird)

Und mit scharfem mathematischem Blick siehst du sicherlich, dass dies ein
Faltungsintegral (auch Duhamel Integral genannt) ist.
http://de.wikipedia.org/wiki/Faltung_(Mathematik)
http://upload.wikimedia.org/math/d/3/8/d387af717af1141b2473bd5794710f77.png
Dabei ist * (stern) die Kurzschreibweise des Faltungsoperators der dir sicherlich auch bekannt ist.
Und damit ist die AKF(tau) nichts weiter als die Faltung einer Funktion mit sich selbst.
Im folgenden benutze ich * als Faltungsoperator und "mal" als Multiplikationsoperator :

AKF(tau)=x(t) * x(t)
Salopp ausgedrueckt. Man schiebt die Funktion durch sich selbst durch.

hey was glaubst du, mit wem du hier sprichst?!

Das loest das Problem nicht.
Ich hoffe mit jemandem fuer den Integraltransformation gluecklicherweise kein Fremdwort ist.
Und dann muesste klar sein :
Einer Faltung
x(t) * x(t) im Zeitbereich
ergibt im Bildbereich der Fouriertransformation eine Multiplikation:
x(t)*x(t) o-o X(w) mal X(w)* (der Stern bei x(w)* fuer konjungiert komplex)
Und x(w) mal x(w)* ist aber nichts weiter als das BETRAGSQUADRAT.

Und damit ist das Theorem von Wiener-Chintschin selbstversstaendlich :
http://de.wikipedia.org/wiki/Wiener-Chintschin-Theorem
http://upload.wikimedia.org/math/4/4/3/443ad61f11134665e896ab69ac51cb9d.png
http://upload.wikimedia.org/math/c/6/4/c64d718fc311f3a0d245107495fc5357.png

Ich denke da sind wir uns einig.
Wenn man die AKF fouriertransformiert ergibt sich automatisch das Betragsquadrat.
Das ist auch logisch, denn das Zufaellige an einem Zufallsprozess ist die Phaseninformation.
Und die geht bei der Betragsbildung verloren.

Ich hoffe mal dass wir gemeinsam folgendes Problem loesen koennten

Wie haengt eine Verteilungs(dichte)funktion und die Fouriertransformiete der AKF(tau), das Spektrum, denn nun konkret zusammen ?

Allgemein kann man nicht aus dem Spektrum auf die Verteilungsfunktion schliessen.
Ich haette einen Vorschlag :

Wir nehmen weisses Rauschen.
Das schicken wir durch eine Blackbox, ein System, einen mathematische Operator.
Jetzt passen wir diesen mathematischen Operator so an, dass das Ausgangssignal
eine 1/x, eine Zipf Verteilung aufweist.
Dazu verwenden wir die Methode des aeqivalenten Ereignisses.
Der Begriff ist vielleich auch noch in anderer Form bekannt.
Das wird aber der zentrale Punkt der Loesung sein.

Den daraus resultierenden Operator betrachten wir im Bildbereich der F-Transformation.
Bilden dessen Betragsqadrat und erhalten damit das Spektrum einer 1/x , Zipf verteilten
Zufallsfunktion.
Diesen Operator zu bestimmen waere interessant.
Koennte mir auch vorstellen, dass die Aufgabe so nicht loesbar ist.

richy
15.09.08, 15:46
Hi Hamilton
Das aeqzivalente Ereignis hat den Ansatz
f(x)*dx = g(y)*dy
Dabei sind f(x) und g(y) die Ziel und Ausgangsverteilungsdichten, die man transformieren moechte

Man erhaelt mit der Methode h(x)=x*x/N/m, m=Summe(1/k,k=1..N)
x(t)=weisse Rauschen.
Im numerischen Experiment funktioniert das recht gut.
Es ergibt sich naeherungsweise eine c/y Verteilung

Die Systemfunktion im F-Bereich waere eine Faltung und damit das Spektrum weiterhin konstant. Das ist auch einsichtig, denn man veraendert die Korrelation nicht.
Eine andere Methode der Tranformation einer Verteilung waere die Inversionsmethode.

Folgender Loesungsweg scheint mir vielversprechend.
Dabei gehe ich wiederum von einem gleichverteilten weissen Rauschprozess aus.
Fraktale Integration
***************
Ein 1/f Spektrum erhaelt man wenn dieser Prozess ein System mit dem Frequenzgang G(f)=1/(Wuzel(j*f)) durchlaeuft.
G(f) ist der Frequenzgang eines fraktalen Integrators der Ordnung 1/2.
(Fuer eine ungeradzahlige Ableitung oder Integration wir der Begriff "fraktal" verwendet )
Die entsprechende Korrespondenz findet man zum Beispiel hier :
http://de.wikipedia.org/wiki/Fraktionale_Infinitesimalrechnung#Fraktionale_Weyl integrale_und_Faltungen

( Die Variable im Urbereich ist hier x, nicht t. Die Variable im Bildbereich ist k)
Die Rueckstransformierte ergibt eine fraktionales Weylintegral :
http://upload.wikimedia.org/math/c/7/4/c7481ffb938c1b9c5c2cfaa768ee0499.png
mit
Gl1)
http://upload.wikimedia.org/math/e/c/3/ec35a39c983b21f125443ab85d40b6d1.png
oder der Substitution t=x-y
Gl2)
http://upload.wikimedia.org/math/c/a/1/ca12b9a02cee958afa73fabe0d4bb85e.png
http://upload.wikimedia.org/math/d/4/2/d4273cf0a118a43a1d11f01c9b909e89.png

Fuer den Fall alpha=1/2 erhalten wir genau die gesuchte Korrespondenz des
Frequnzganges.
(Die Gammafunktion von 1/2 ist Wurzel(PI))
G(f)=1/(Wurzel(j*2*PI*k)).
Und dessen Betragsquadrat, das Spektrum ergibt sich zu :
G(f)=1/(2*PI*k)).

Jetzt muesste man den umgekehreten Weg gehen und aus der Transformationsgeleichung der Verteilung mittels Inversionsmethode oder aequivalentem Ereignis die Verteilung berechnen.
Etwas einfacher duerfte es sein die AKF berechnen.

Auf jeden Fall haben wir schonmal als Abfallprodukt geistiger Erguesse :-)
eine Methode gefunden rosa Rauschen zu erzeugen ohne eine FFT zu benuetzen.

Ich nenne das Filter mal frech fraktionales Weyl-Richy Filter.

Bezueglich der Ausgangsfrage tendiere ich momentan zu 2 Ansichten.
1)
Die von mir zitierten Aussagen stellen lediglich ein Analogon dar.
In dem zwar Frequenzverteilungen betrachtet werden, der Aspekt des Merkmals Frequenz aber keine Rolle spiel.
Darauf haetten die Autoren aber besser hinweisen muessen.

2)
Alle Beispile weisen auch ein c/x Verteilung auf.
Die physikalischen Beispiel weisen tatsaechlich ein 1/f Spektrum auf.
Beide Eigenschaften stehen aber in keinem ersichtlichen Zusammenhang.
Das waere schon sehr zufaellig.

Als naechstes werde ich mit dem fraktionalen Weyl Integral rosa Rauschen erzeugen und einfach numerisch die Verteilung bestimmen.

Hamilton
15.09.08, 21:47
Ich denke da sind wir uns einig.
Wenn man die AKF fouriertransformiert ergibt sich automatisch das Betragsquadrat.
Nö, da sind wir uns nicht einig.
Die Autokorrelation ist erstmal eine reelle Funktion, wie auch immer die gebildet wird und die Fouriertransformierte ist i.A. komplex.

Das Theorem besagt, dass man die AKF, die wie du richtig sagst, eine Faltung mit sich selbst ist über Multiplikation im Fourierraum bestimmen kannst.
Da steht S(f) = |x(f)|²
x(f) ist aber nicht das Signal, sondern die Fouriertransformierte von x(t).
Ich finde sowieso, dass das da alles ein bisschen komplizierter, als nötig aufgeschrieben ist.
Wie dem auch sei, einigen wir uns darauf, dass wir wissen, wie man die AKF bestimmt...

Der Wiki-Artikel über Periodogramme war interessant- ich habe daraus jedenfalls gelert, dass Periodogramme etwas anderes sind, als das Leistungsdichtespektrum- ich hab das immer gleichbedeutend benutzt, aber man muss da wohl aufpassen- wie gesagt, ich bevorzuge die Methode von Welch- gibt es auch eingebaut in Matlab.

hey was glaubst du, mit wem du hier sprichst?!
Sorry, das war unhöflich.
Aber wenn das schon zur Sprache kommt, ich bin Physiker mit Spezialisierung auf Dynamik komplexer Systeme (früher hat man auch gern "chaotisch" dazu gesagt, aber das ist ein wenig aus der Mode gekommen, da unseriöser Beiklang)

Wie haengt eine Verteilungs(dichte)funktion und die Fouriertransformiete der AKF(tau), das Spektrum, denn nun konkret zusammen ?
Da muss ich mal drüber nachdenken, im Augenblick fällt mir nichts cleveres dazu ein.
Wenn ich mir so einen Sinus sin(f0*t) daher nehme und die "Aufenthaltswahrscheinlichkeitsdichte" berechne, dann ergibt sich eine "U"-förmige Funktion- die Leistungsdichte ist jedoch eine scharfe Linie delta(f-f0)
Ich glaube, dieses Abschweifen bringt nichts.
Eigentlich ging es doch um was ganz anderes.

richy
15.09.08, 22:00
Uebrigends schade, dass sich hier anscheinend niemand aktiv an dem Thema
beteiligen moechte.

@EMI
keine Lust ?

@hamilton
ich habe deine Fragestellung :
hey was glaubst du ...
mal versucht ueber deine Profilangaben zu beantworten.
Ja, das war bischen unhoeflich von dir. Aber egal.
Ich bin auch nicht immer hoeflich und froh darueber, dass wenigstens einer hier sich fuer die Themen interessiert, die auch mich interessieren.
Bin ueber dein Interesse ueberaus dankbar.
Und wie du siehst kann mich soundso niemand aufhalten.

Du studierst noch ?
(Ich hatte auch mal Mathe Prof, Doc oder Anwendungsmathematiker angenommen.
Aber deine Grundeinstellung passt zu den Jobs nicht)

Welches Fach, wenn man fragen darf ? Ich denke mal dennoch Mathematik.
Ich bin uebrigends Elektroingenieur und Musiker.
Mein Modellfach war Bild und Ton, also Signalverarbeitung.
In dem Bereich, insbesonders der Numerik habe ich auch noch ein paar Jahre an der Uni gearbeitet.
Fraktale Differentation war da auch ein Thema.

Man kann das fraktionale Weyl Integral aber auch einfach als eine gueltige
Korrospondenz der Fouriertransformation auffassen.

Unsere Beiraege hatten sich zeitlich ueberschnitten.

Ah. Du bist also Physiker. Dazu spezialisiert fuer nichtlineaere Systeme.
Passt doch.

Marco Polo
15.09.08, 22:45
Uebrigends schade, dass sich hier anscheinend niemand aktiv an dem Thema
beteiligen moechte.


Hi richy,

immer wenn es etwas komplizierter wird, dann wird die Beteiligung dünn. Es gibt hier einfach zu wenige Physiker/Mathematiker.

Ich habe die gleiche Erfahrung schon mal in einem Thread zur SRT gemacht, bei dem rene und ich diverse Aufgaben durchgerechnet hatten. Die sonst üblichen SRT-Kritiker schweigten stille. Was kann man jetzt daraus schliessen?

Ich behalts mal besser für mich, sonst bekomme ich Kloppe. ;)

Gruss, Marco Polo

richy
15.09.08, 22:59
Nö, da sind wir uns nicht einig.
Die Autokorrelation ist erstmal eine reelle Funktion, wie auch immer die gebildet wird und die Fouriertransformierte ist i.A. komplex.
Yepp.
Aber der Betrag oder das Betragsquadrat einer Fouriertransformierten ist immer reell.
Das ist der Frequenz, Amplitudengang eines Systems.
Bei einem Signal dessen Leistungsdichtespektrum.

Wenn wir die AKF als eine Faltung der Zeitfunktion x(t) mit sich selbst betrachten,
dann ist deren Fouriertransformierte zunaechst das Quadrat der F-Transformierten der Zeitfunktion.
X(f) mal X(f)
Denn einer Faltung im Bildbereich entspricht eine Multiplikation im Frequenzbereich.
Das ist eine fundamentale Korrespondenz der F-Transformation.
X(f) mal X(f) muss nicht reell sein.

Bilden wir aber X(f) mal X(f)* (*=konjungiert komplex) ist dies das Betragsquadrat von X(f).
Und genau dieses wird im Theorem von Wiener-Chintschin wiedergegeben.
Woher das "konjungiert komplex" resultiert bin ich gerade ueberfragt.
Viellleicht ist es daher "nur" ein Theorem.

Die Fouriertransformierte der AKF ist nach Wiener-Chintschin immer eine reelle Funktion .
S(f) = |x(f)|²
Ein Betrag ist immer reell und damit ist S(f) immer reell.
Bei Rosa Rauschen S(f) = |1/(c*f)|
Und diese spektale Leistungsdichte kann ich auch als 1/(Wurzel(j*c*f)*1/(Wurzel(-j*c*f) anschreiben.

BTW:
Dass die F-Transformierte reell ist, ist kein ausreichendes Kriterium, dass auch deren Ruecktransformierte reell ist. Die S(f) muss dazu zusaetzlich eine gerade Funktion sein.
Aber auch dies ist mit der Betragsbildung garantiert.

Schau dir mal die F-Transformierte von f(t)=sin(t) an.
-j Pi Dirac(f - 1) + j Pi Dirac(f + 1)
Das ist eine imaginaere ungerade Funktion

dagegen die FT von cos(t)
Pi Dirac(f - 1) + Pi Dirac(f + 1)
eine gerade reelle Funktion.

Praktisch ist es zu wissen, dass die Korrospondenzen der FT auch rueckwaerts gelten.
Das siehst du in obigem Beispiel schon :
Die Cosinusfunktion ist gerade und daher das Spektrum reell.
Die Sinusfunktion ist ungerade und daher das Spektrum imaginaer. CIS !

Eine der wichtigsten (beidseitigen) Korrespondenz ist :

Ist die Zeitfunktion abgetastet ist deren Foriertransformierte periodisch
(Das fuehrt auf die Nyquist Abtastfrequenz, das Nyquist Kriterium)
Ist die Zeitfunktion periodisch, ist das Spektrum abgetastet, diskret
(Dass fuehrt auf die Spektrallinien)

Fuer zufaellige Signale gilt analog zu determinierten Signalen :
S_out(f))=|G(f)|^2 * S_in(f))

Fuer S_in(f) habe ich weisses Rauschen gewaehlt : S_in(f)=1
1/(Wurzel(j*c*f) waere dann die Fouriertransformierte eines Systmes G(f), dessen Ruecktransformierte, also Systemfunktion man aber kaum in einer FT Tabelle finden wird.
Denn dies entspricht einer fraktalen Integration.
Auch Maple kann diese Aufgabe nicht loesen.
Ueber dieses Stichwort haben wir dennoch die Ruecktransformierte gefunden.
http://upload.wikimedia.org/math/c/a/1/ca12b9a02cee958afa73fabe0d4bb85e.png

So ganz bin ich mir nicht mit der Kritik des Periodogrammes im klaren.
Wenn ich am Digitalrechner das Betragsspektrum berechne gehe ich doch auch nicht anders vor.

Eigentlich wollte ich an der Stelle die Ergebnisse mit dem Weyl Integral hier reinstellen.
Folgt in Kuerze.
Vorweg: Es ergibt sich anscheinend eine Gauss Verteilung.
Hast du gerade einen DFT oder FFT Algo parat ?
Ich will den 1/f Amplitudengang noch numerisch pruefen.
Wenn der stimmt haben wir eine super einfache Methode gefunden fuer den Entwurf
eines "rosa Filters" und dazu tiefere Erkenntnisse in das Wesen von rosa Rauschen.

Welch hat mit dem nur wenig zu tun. Das ist Numerik.
Ein optimiertes Gewichtungsfenster fuer die numerische Bestimmung der FT.
Damit werden "Auf und Abschalt", also "Randverzerrungen" unterdrueckt.
Kein Sinus schwingt ewig.
Auf und Abschalten entspricht einer Fensterung.
Und deren FT ist eine sin(c*f)/(c*f) Funktion
Im Zeitbereich wird das Fenster mit der Funktion multipliziert.
Im Frequenbereich also ? ... das Spektrum gefaltet.
Und da wir Meister der Faltung sind wissen wir auch wie der einfachste Fall einer Faltung aussieht. Naehmlich die Faltung einer Funktion mit einem Diracpuls(f-f0)
Die Funktion wird dann um diesen Diracimpils zentriert verschoben.
g(f) gefaltet Dirac(f-f0) = g(f-f0)
Und damit verschmiert sich der Puls zu einer sin(c*f)/(c*f) Funktion.
Bei einem Welch Fenster zu dessen etwas weniger verschmierten FT.
Und damit haben wir das Welchfenster und nebenbei Unschaerferelation der Nachrichtentechnik erklaert.
Und auch das Beugungsbild beim Spaltversuch.
Denn bei diesem wird der Spalt fouriertransformiert.

richy
15.09.08, 23:13
@marco
Der Vergleich hinkt etwas , denn es gibt kaum Fouriertransformationskritiker.
Oder Wiener-Chintschin Kritiker.

Marco Polo
15.09.08, 23:22
@marco
Der Vergleich hinkt etwas , denn es gibt kaum Fouriertransformationskritiker.
Oder Wiener-Chintschin Kritiker.


Stimmt. Die müsste man wohl mit der Lupe suchen. Fakt dürfte aber sein: Je weniger Fachleute anwesend sind, desto weniger Beteiligung bei komplexeren Themen.

Gr., MP

richy
16.09.08, 17:18
Wie haengt eine Verteilungs(dichte)funktion und die Fouriertransformiete der AKF(tau), das Spektrum, denn nun konkret zusammen ?

Da muss ich mal drüber nachdenken, im Augenblick fällt mir nichts cleveres dazu ein.

Ich meine inzwischen auch es gibt hier gar keinen eindeutigen Zusammenhang.
Wenn ich eine einfache Abbildung auf die Zufallsvariable ausfuehre, aendere ich deren Verteilungsfubktion. Z.B. mit der Inversiosnmethode
http://de.wikipedia.org/wiki/Inversionsmethode
Mit einfach meine ich , dass nur der aktuelle Wert abgebildet wird.
Und bei der Vorgehensweise aendere ich die Korreltation doch offenbar nicht zwingend.
Zu verschiedenen Verteilungen wuerde dann die selbe AKF gehoeren.

Erst wenn ich benachbarte Werte fuer die Abbildung heranzuehe, wie beim fraktionalen Integral, oder wenn ich einfach Mittelwerte bilde, werden im Ergebnis die Werte eine statistische Abaengigkeit aufweisen.

Wenn physikalische Prozesse nun tatsaechlich eine 1/x Verteilung UND ein 1/f Spektrum aufweisen (was wir noch nicht geklaert haben) so muesste beides Konsequenz einer uebergeordneten Ursache sein.
In all dem bin ich mir aber noch nicht sicher.

richy
17.09.08, 21:11
Hi
@Hamilton
Meine Anfrage nach einer FFT fuer Maple hat sich erledigt.
Hier gibt es eine prima Seite mit Maple Routinen.
http://peterstone.name/Maplepgs/maple_index.html

Zwischenergebnis
*************
So ganz traue ich meinen numerischen Versuchen noch nicht.
Aber ich meine folgende Aussagen unter Vorbehalt treffen zu koennen.

1)
DER MAPLE RND GENERATOR
liefert keine perfekt gleichverteilten Zufallswerte.

2)
DAS PERIODOGRAMMD
scheint mir das selbe wie das Betragsquadrat der DFT der Zeitfunktion.
Und die Ergebnisse bei Zufallssignalen entspricht nur bedingt der theoretischen Erwartung.
Eine DFT der AKF bringt hier auch nur kaum eine Verbesserung.
Mit geeigneteren Methoden sind vielleicht die moderneren adaptiven Parameter Spektralschaetzungsverfahren gemeint, wie der Burg Algorithmus.

3)
Uber die FRAKTALE Integration erzeugtes rosa Rauschen scheint eine Gauss Verteilungsdichte aufzuweisen. Das Spektrum folgt naehrungsweise einer 1/f Verteilung.
Immerhin :-)

4)
DIE LOGISTISCHE GLEICHUNG
weist nahe (1 + SQRT(8)) eine 1/X Verteilungsdichte auf.
Aber NICHT wie man aus den von mir hier verlinkten Seiten meinen koennte ein 1/f Spektrum !
Leider, denn das waere sonst ein prima rosa Rauschgenerator.
Der Vergleich muss also scheinbar als Analogon verstanden werden.
So entspricht zum Beispiel ein Wort mit hoher Auftrittswahrscheinlichkeit einer tiefen Frequenz. Diese ist also nicht die Wortfrequenz.
Man koennte dies auch so vormulieren :
Ein Wort mit niedrigem Shannonschen Informatiosgehalt enspricht einer niedrigen Freqzenz.

Bemerkenswert ist noch, dass die AKF bei 1/X Verteilung nahezu konstant ist.

Interessant waere ob es moeglich ist einen 1/X und 1/f Zufallgenerator zu konstruieren.
Ebenso einen 1/f Generator anhand eines physikalischen Modells.

Viele Gruesse
richy

Hamilton
17.09.08, 21:41
DIE LOGISTISCHE GLEICHUNG
weist nahe (1 + SQRT(8)) eine 1/X Verteilungsdichte auf.
Aber NICHT wie man aus den von mir hier verlinkten Seiten meinen koennte ein 1/f Spektrum !
Leider, denn das waere sonst ein prima rosa Rauschgenerator.
Der Vergleich muss also scheinbar als Analogon verstanden werden.
So entspricht zum Beispiel ein Wort mit hoher Auftrittswahrscheinlichkeit einer tiefen Frequenz. Diese ist also nicht die Wortfrequenz.
Man koennte dies auch so vormulieren :
Ein Wort mit niedrigem Shannonschen Informatiosgehalt enspricht einer niedrigen Freqzenz.

Bemerkenswert ist noch, dass die AKF bei 1/X Verteilung nahezu konstant ist.

Du, das sind Äpfel und Birnen- hüte dich vor solchen Aussagen.
Du kannst nicht einfach Wörtern eine Frequenz zuordnen, jedenfalls nicht so.

richy
17.09.08, 22:59
Man kann Aepfel schon mit Birnen vergleichen. Im Rahmen einer Analogie.
Aber dann muss man explizit darauf hinweisen. Und das wurde hier versaeumt:
WIKI
http://de.wikipedia.org/wiki/1/f-Rauschen
# Auch die Schlagseite eines Betrunkenen kann zum Beispiel einem 1/f-Rauschen entsprechen, weil eine doppelt so schnelle Seitwärtsbewegung nur halb so heftig auftritt, wie die langsamere Seitwärtsbewegung. Eine dreimal so schnelle Seitwärtsbewegung ist dann nur dreimal schwächer zu beobachten, und so weiter.
# Ein Börsenkurs kann ebenfalls diesem Verhalten entsprechen, wenn nämlich die Kursschwankungen im gleichen Maße stärker werden, wie sie an Geschwindigkeit verlieren.

Der WIKI Artikel ist inzwischen geaendert.

In der englischsprachigen Version allerdings nicht :
In biological systems, it is present in heart beat rhythms and the statistics of DNA sequences. In financial systems it is often referred to as a long memory effect. Also, it is the statistical structure of all natural images (images from the natural environment), as discovered by David Field (1987).

Richard F. Voss and J. Clarke claim that almost all musical melodies, when each successive note is plotted on a scale of pitches, will tend towards a pink noise spectrum.[1]
Es ist hier wohl nur die Analogie gemeint, dass das Spektrum als eine Verteilung der Leistung uber die Frequenz aufgefasst wird.

Aber dagegen scheint hier fast unmissverstaendlich tatsaechlich vom Leistungsdichtespektrum die Rede :

http://books.google.de/books?id=5Z7E30CfM_0C&pg=PA138&lpg=PA138&dq=Kolmogorov+Sinai+Entropie&source=web&ots=uPdzPsYeVR&sig=B1uU_evaId3UfSaYRPAJ4V7gmLo&hl=de&sa=X&oi=book_result&resnum=4&ct=result#PPA152,M1
Das Sperktrum fuer den immitenten Uebergang der dreier Periode ins Chaos,
wie er in der logistischen Gleichung auftritt, wurde berechnet von MORI et. al 1988.


Uups habe ich an der falschen Stellle die FFT ermittelt ?
Das steht :
immitenten Uebergang der dreier Periode ins Chaos,
ich habe bei 1 + Wurzel(8) gemessen
dem Uebergang vom Chaos in die dreier Periode.
Da muss ich also nochmal ran.
Was haelts du von den obigen Aussagen ?

Hamilton
18.09.08, 09:33
Nun, die Beispiele aus den Zitaten, Herz-Rhythmus, Random-Walk ...
das sind alles Zeitreihen- Zeitdiskrete Zahlenfolgen.
Du willst das aber auf eine Sequenz von Wörtern anwenden und das ist etwas anderes.
Ich glaube auch, dass doeser Exkurs nicht so viel bringt?
Warum gehst du jetzt schon seit einiger Zeit so sehr auf Periodogramme ein- ich denke, es geht um ein Informationstheoretisches Maß -- dafür sind die Verteilungen p(x) interessant, aber nicht irgendwelche Frequenzen?!

richy
18.09.08, 16:36
Hi Hamilton

Warum gehst du jetzt schon seit einiger Zeit so sehr auf Periodogramme ein- ich denke, es geht um ein Informationstheoretisches Maß --


Weil in Texten wie im folgenden von einem Leistungsdichtespektrum von, DNA Sequenzen, Musik, Texten die Rede ist. Ich moechte wissen wie dies dort genau zu verstehen ist. BTW: Mit Musik ist sicherlich nicht das Audiosignal sondern die Notenfolge gemeint.

Intermittende Systeme stehen in engem Zusammenhang einer charakteristischen Struktur des Leistungssepktrums. Dem sogenannten 1/f Spektrum welches einen weiteren Hinweis auf langweitreichige Korrelation in einer reellwertigen Signalfolge liefert.
Da diese Form des Leistungsspktrums u.a auch in natuerlichen Sequenzen , Biosequenzen, Musik und Texten nachweisbar ist, ist die Frage nach einem Zusammenhang zwischen solchen Sequenzen und intermittenden Prozessen naheligend.

Ich habe hier die selben Zweifel wie du. Deshalb habe ich bei der logistischen Gleichung auch versucht dies numerisch nachzuvollziehen.(Bisher erfolglos)
Nun, die Beispiele aus den Zitaten, Herz-Rhythmus, Random-Walk ...
das sind alles Zeitreihen- Zeitdiskrete Zahlenfolgen.

Oben ist explizit "Texte" angegeben.

Will man ein Buch statistisch erfassen, so kann man jedem Wort ueber dessen Auftrittswahscheinlichkeit eine Zahl zuordnen. Aus dem Buch wird eine Zeitreihe.
Ich messe die Auftrittswahrscheinlichkeit der Merkmale und kann eine Verteilung erstellen. Damit beschaeftigen sich Linguistiker tagtaeglich.
Auch ich habe bisher immer nur Verteilungen untersucht.
Wie soll ich aber aus der Verteilung, wie in obigerm Zitat, uebehaupt auf eine Leistungsdichtedpeltrum schliessen ?
Dazu muss doch die Zeitreihe selbst, nicht die Verteilung untersucht werden.
Ich habe hier die selben Zweifel wie du.
Und auf die entsprechenden Links bin ich gestossen, weil ich deinem Vorschlag des
Periodogramms im Zusammenhang mit 1/f Rauschen nachgegangen bin.

"Physikalische" Werte fuer ein Wort waere dessen Auftrittswahrscheinlichkeit, oder shannonscher Informationsgehalt, damit auch dessen Klassennummer in der sortierten Verteilung. Oder auch die Wortlaengen .
So bin ich auch bisher vorgegangen.
Ein Text ist dann eine Folge von Auftrittswahrscheinlichkeiten oder Informationsgehalten.
Erst dann kann ich konkret sagen welche Groesse hier zum Beispiel eine Periodizitaet aufweist.

Daher geht dein Einwand vielleleicht in die richtige Richtung :
Ich denke, es geht um ein Informationstheoretisches Maß -- dafür sind die Verteilungen p(x) interessant
BTW: Mir geht es bei all dem nicht um eine semantische Information !
Ich will z.B nur wissen ; Warum existiert das Zipfsche Gesetz.
Und habe auch schon fast eine Antwort gefunden. (Dazu spaeter)

Zum Periodogramm:
Es ist in der Tat gleichgueltig ob ich auf eine Zeitfunktion eine DFT anwende und hieraus das Betragsquadrat bilde oder die DFT auf die AKF anwende.
Beides fuehrt zum Periodogramm (Betrag der FT) und ist bei Zufallssignalen zunaechst eine voellig ungeeignete Methode der Schatzung !
Wer misst misst Mist.
Es gibt zwei Versionen der AKF.

V1)
Ist ertungswerttreu, dafuer ist die Varianz falsch wiedergegeben.

V2)
In der zweiten Version naehert sich die Varianz mit zunehmender Anzahl von Abtastwerten der realen Varianz. Dafuer ist der Erwartungswert voellig falsch.
Ich habe die AKF V2) benutzt, da fuer meine Betrachtungen absolute Erwartungswerte zunaechst keine Rolle spielen.
Ein Periodogramm ist eine DFT der Version V1

Und du hattest Recht. Die Fensterrung spielt hierbei eine groessere Rolle.
In etwa akzepzabel bezueglich Erwartungs und Varianztreue wird die Schaetzung wenn ich mehrere Periodogramme mittele und dabei Welch Fenster und Bartlett Fenster benutze.
Dennoch ist das Ergebnis eher bescheiden.
Grosse Genauigkeiten erhaelt man mit adaptiven Modellen wie dem Burg Algorithmus.
Die dahinter stehende Mathematik ist recht schwierig. Die Implementation weniger, so dass ich den Algo in den 80 ern sogar mal auf dem Taschenrechner programmiert habe.
Der Burg Algo waere also das geeignete Hilfsmittel fuer spektrale Schaetzungen.
http://books.google.de/books?id=WIC4rhqJY-wC&pg=PA394&lpg=PA394&dq=%22Burg+Algorithmus%22&source=web&ots=dAL9bY2lNi&sig=dK9HAQhFKbgpAyq1gIC_8ODhtqs&hl=de&sa=X&oi=book_result&resnum=2&ct=result
(BTW das Buch ist von meinem damaligen Prof. Pruefungsstoff zur digitalen Signalverarbeitung. Aus dem habe ich auch die ganzen Infos)

Den C-Quellcode gibt es in "Nuemerical Recipes in C"
http://www.fizyka.umk.pl/nrbook/c13-6.pdf
In dem Buch steht alles was man jemals braucht. Kostenlos hier online :
http://www.fizyka.umk.pl/nrbook/bookcpdf.html
Ich hab vor 15 Jahren noch 120 DM dafuer geblecht.
Dafuer gabs alle Quellcodes auch auf Diskette.

Ich glaube auch, dass dieser Exkurs nicht so viel bringt ?

Obige Erkenntnis ist doch schon etwas. Ebenso die fraktionale Integration.
Und im folgenden Beutrag versuche ich mal die Ursache des Zipfschen Gesetzes
anhand des 1/f Spektrums zu skizzieren.

richy
18.09.08, 17:07
Skizze der Ursache des Zipfschen Gesetzes.

Im folgenden mochte ich ueber Analogien zum 1/f Spektrum eine Erklaerug fuer das zipfsche Gesetz finden.

Ausgangspunkt soll die Erklaerung des 1/f Rauschens physikalischer Prozesse sein.
Hier zunaechst eine schoen Grafik dazu :

http://wwwex.physik.uni-ulm.de/lehre/physikalischeelektronik/phys_elektr/img3433.gif

Im folgenden Link gibt es einen Erklaerungsversuch fuer das 1/f Rauschen :
http://books.google.de/books?id=sB_em8OXiisC&pg=PA88&lpg=PA88&dq=1(f+Spektrum&source=web&ots=9PefxdzWGk&sig=lDZAmDQMFbNPDfxe1Vj7s78dUSc&hl=de&sa=X&oi=book_result&resnum=7&ct=result#PPA88,M1

Wichtige Punkte :
1)
Bei, 1/f Rauschen ist die spektrake Gesamtleistung in einer log Slakierung, musikalisch also z.B einer Oktav konstant.
S(f)=c*Integral(1/f df) = c*ln(f2) - ln(f1) = c*ln(f2/f1)
Ist f2/f1 konstant so ist S(f) konstant !

In jedem Oktavintervall des Systems steckt somit die selbe Leistung.
S(200 Hz / 100 Hz) = S( 2000 Hz / 1000 Hz) entspricht 3 dB wobei der Frequenzbereich einmal aber im ersten Fall 100 Hz sind und im zweiten Fall 1000 Hz. ist.
Bei WIKI ist das schlecht (ohne Integration) erklaeet.
2)
Es muss sowohl eine untere Grenzfrequenz fu als auch eine obere Grenzfrequenz fo geben, da die Leistung nicht unbegrenzt sein kann.

3)
Da der ln fuer grosse Argumente von allen Verteilungen am langsamsten waechst, ist die 1/f Verteilung enegetisch am guenstigsten zur Ueberdeckung grosser Frequenzbereiche
Die Fiktion wieisses Rauschen natuerlich ausgeschlossen.
=>
Steht einem physikalischen System ein begrenzter Energievorrat zu Verfuegung und wird dieser ueber einen grossen Frequenzbereich verteilt, so ist mit 1/f Rauschen zu rechnen. Unter Beachtung von 2.

Analogien zur Linguistik :
******************
a) Die spektrale Leistungsdichte
enspricht zunaechst allgemein dem sprachoekonomischen Aufwand fuer eine Wahrscheinlichkeitsklasse von Woertern.
Dieser Aufwand setzt sich aus mehreren Teilen zusammen.

a1)
Beispielsweise enem physikalischen Anteil, Aufwand wie der Wortlaenge.
Um ein langes Wort zu formulieren benoetige ich mehr Energie als ein kurzes.
(Sollen beide Woerter in gleicher Zeit formuliert sein, mehr Leistung)
Daraus ergibt sich schon folgender Schluss :
Haeufig verwendete Woerter muessen kurzer sein :
Schaen wir einfach mal nach :

30 Formen stellen 31,8 % der Wörter
die, der, und, in, zu, den, das, nicht, von, sie, ist, des, sich, mit ....
Weitere 70 Formen stellen weitere 15,3 % der Wörter
... man, aber, aus, durch, wenn, nur, war, noch, werden, bei, hat, wir, was, wird, sein, einen, welche, sind, oder, um, haben, einer ...
Weitere 107 Formen stellen weitere 7,25 % der Wörter
ja, wurde, jetzt, immer, seinen, wohl, dieses, ihren, würde

Signifikant ist, dass die haeufigsten Woerter meist der Laenge drei, also kurz sind.
Die "Donaudampfschiffahrtsgesellschaft" wird selten verwendet.

a2)
Ein weiterer Aufwand ist die Auftrittwahrscheinlichkeit eines Wortes. Damit auch dessen
Shannonscher Informationsgehalt.
Je goesser die Auftrittswahrscheinlichkeit ist, umso geringer ist der Informationsgehalt.

Beispiel:
Wenn man stottert uebersteigt die geistige Informationsmenge den Uebertragungskanal.
Man senkt dem Informationsgehalt durch Wiederholung der selben Woerter.
Ebenso erfuelllen Fuellwoerter wie ahee .. diesen Zweck.

b)
Die Wortfrequenz
ergibt sich aus der Haeufigkeit des Wortes. Sie kann aber nicht ! der Frequenz der Leistungsdichte entsprechen, wenn ich die Auftrittswahrscheinlichkeit betrachte. Denn haeufige Woerter haben eine hohe Frequenz, aber geringen Aufwand, Entropie, Leistung.

c)
Die Gesamtleistung entspricht dem Gesamtaufwand eines Textes u.a. auch dessen SHANNONSCHEN Informationsgehalt.

d)
Die Evolution der Sprache oder desses Erlernen muss gesondert beruecksichtigt werden.


(Mache gerade mal ne Pause)

richy
18.09.08, 21:06
Fangen wir bei d) an :
Wie erlent ein Kind eine Sprache ?
Zuerstmal hat man, wenn man noch sehr jung ist gar nicht viel zu sagen.
Damit muss in der Kindersprache nur wenig Shan.Info uebertragen werden.
Die Woerter werden kurz und haufig sein. Z.B :
Da da da , dada dada
Oder schon mit hoeherer (wenn man will semantischer) Information :
Mama Papa.
Wohl kein Zufall, dass dies in sich phonetische Wiederholungen (von Ma,Pa)sind.

BTW:
Man muss hier keinen strengen shannonschen Infogehalt verwenden.
Anschaulicher waere der Begriff des "Sprachaufwands", den ich im folgenden als Sa bezeichne.
Sa ist eine Funktion der Haeufigkeit der Wahrscheinlichkeitsklasse Sa(p(k)).
Ein Wort, dass man schon sehr oft benutzt hat ist auch mit weit geringerem Aufwand aus dem Gedaechtnis abrufbar als ein seltenes Wort.
Und auch hier kein Zufall , dass Stotterlaute wie dadada oft aus der Kindersprache stammen.
Warum ist aehhh ? eigentlich so beliebt ?
Empirisch koennte man angelehnt an Shannon folgendes Maß angeben :
Pa(p)= c*ln(1/p) + f(Wortlaenge) + g(anderer Aspekte)

Weitere Entwicklung der Sprache :
Der naechste Schritt wird es sein zwei unterschiedliche Phoneme zu verbinden :
"Auto" oder laengere Phoneme zu verwenden : "Haus, Maus"

Mit zunehmendem Alter steigt der zu uebermittelnde Informationsgehalt und damit wird auch der Aufwand der Codierung steigen.
Es werden auch seltenere, speziellere Woerter und nach 1) damit aufwendigere Woerter verwendet.
Dies ist etwas anders als bei der Vereinbarung eines Computercodes.
Hier steht die Aufgabenstellung der Shan. Infogehalt von vornerein schon fest.
http://evolutionslehrbuch.wort-und-wissen.de/index2.php?artikel=teil-4/kapitel-08-02-z01.html
Wobei aber auch der Aspekt des Aufwandes auch hier beruecksichtigt wird :
Das Ziel ist, einen Code zu finden, mit dem die Zeichenkette mit so wenig Binärzeichen wie möglich übertragen werden kann. Man kann sich dabei zunutze machen, dass nicht alle Zeichen gleich häufig auftreten und man für Zeichen, die seltener auftreten, deshalb auch längere Sequenzen verwenden kann, wenn es dafür möglich ist, für ein Zeichen, das häufiger vorkommt, eine kürzere Codesequenz zu verwenden.
In der Sprache ergibt sich dieses Ziel schon aufgrund der evolutionaeren Lernvorganges.
Es waere nicht effizient bereits erlernte Woerter wieder zu vergessen und die Codierung zu aendern.

Und damit enthaelt eine Sprache keine gleichverteilten Wortwahrscheinlichkeiten. Die kurzen haeufigen Phoneme der Kindersprache werden beibehalten. Un dies ist praktisch, denn diese enthalten wenig Informationsgehalt und das bei geringem Aufwand Sa(p) Im Prozess des Erlernens der Sprache kommen immer mehr neue Haufigkeitsklassen hinzu, mit abnehmender Auftrittswahrscheinlichkeit.

Beim Leistungsspektrum physikalischer Vorgaenge folgt die 1/f Verteilung hauptsaechlich auch aus der konstanten Leistung pro Oktav, Frequenzverhaeltnis.
S(f)=c*Integral(1/f df) = c*ln(f2) - ln(f1) = c*ln(f2/f1)

Im Gegensatz dazu sind Haeufigkeitsklassen der Sprache disketisiert.

Berechnungen dazu in Kuerze ....

richy
21.09.08, 21:15
Einige Ergebnisse.
Das sich diskret komplizierte Funktionen ergeben, schreibe ich diese nicht explizit an.
Darstellung des Pareto oder 80/20 Gesetzes :
Im Folgenden ist die Summe ueber die diskrete Verteilung c/k in Abhaengigkeit der Anzahl von Klassen dargestellt :

http://home.arcor.de/richardon/2008/kummu.gif


Das 80/20 Gesetzt gilt somit nur in etwa fuer Klaessenzahlen zwischen 1000 und 2000. Genau bei 1744.
http://www.ephorie.de/das_80-20_prinzip.htm
Es ist durchaus moeglich, dass manche Wirschaftswissenschaftler von einer falschen Annahme ausgehen. Allerdings ist in obiger Darstellugng nicht erfasst wieviele Elemente
eine Klasse tatsaechlich enthaelt.
Die kummukitave Wahrscheiblichkeit kann man auch als Nutzen betrachten ueber die prozentuale Betrachtung der Bearbeitung einer Gesamtaufgabe.

Formell:

m:=sum(1/(i),i=1..N);m:=1/m;
d:=sum(m/p,p=1..x*N);
d=1/(Psi(N+1)+gamma)*Psi(x*N+1)+1/(Psi(N+1)+gamma)*gamma
Dies unterscheidet sich vom kontinuierlichen Fall.

Der Gesamtaufwand , Information, Entropie : a:=sum(log(p/m),p=1..x*N)
waechst bei einer c/k Verteilung in etwa linear :

http://home.arcor.de/richardon/2008/aufwand.gif

Iteressant ist auch die Darstellung des Nutzens pro Aufwand
http://home.arcor.de/richardon/2008/nuztauf.gif

Spaetestens ab 0.2 also 20% einer erldedigten Aufgabe wird der Nutzen pro Aufwand immer geringer.
Das ist auch die Erklaerung, warum man z.B. beim Erlernen eines instrumentes Anfangs
schnell recht weit kommt und ab einem gewissen Level der Fortschritt stagniert.

Weitere interessante Beispiele der Zipf Verteilung sind uebrigends Lawinen und die Form von Sandhaufen.

richy
22.09.08, 22:14
Korrektur :
Das Programm predic.c in numerical reicipes in C ist leider doch keine vollstaendige Implementation des Burg Algorithmus, sondern benutzt nur dessen Predictor Routine.
Die Second Edition ist auch eher etwas fuer C Puristen des ANSI C-Codes.

Die PDF Dateien des Buches meiner Meinung nach jedoch dennoch eine Goldgrube. Fuer die third Edition zahlt man inzwischen 120 EUR !
http://www.fizyka.umk.pl/nrbook/bookcpdf.html

Kostenlos, Freeware ist dagegen dieses eigenstaendige Programm "Rainbow" fuer
Spektralschaetzung !
http://www.digitalcalculus.com/page/593045
Es enthaelt gleich 13 Methoden ! moderner und traditioneller Spektralschaetzung, inclusive Burg Algorithmus, aus dem Buch
"Modern Spectral Estimation: Theory and Application"
http://www.amazon.com/gp/offer-listing/0130151599/ref=dp_olp_2
Schlappe 200 USD. Wahnsinn was gute Buecher heute kosten :-(
Das Programm ist recht maechtig und praktisch, aber nicht sonderlich gut durchdacht.
So werden aktuelle Einstellungen nur uebernommen wenn man diese in einer Datei
speichert.
Am besten man erzeugt zunaechst eine Muelleimerdatei, mit der man die ganzen sinnlosen
erwarteten Speichervorgaenge erledigt.
Das Programm verfuegt auch ueber keine Fehlerabfangroutinen.
Schade ansonsten ein wirklich super Programm.


MAPLE Dateiroutine fuer den Datentrasfer via Textdatei zu Rainbow:
**************************************************

> restart;
> N:=2^8; .................................Anzahl Abtastwerte
> for i from 1 to N do
> f[i]:=evalf(sin(8*Pi*i/N)); ........ Beispielfunktion
> od:
>
> druck:=seq([i,f[i]],i=1..N): ....... Nur zur Kontrolle :
> plot([druck]); ........................ Ausdruck der Funktion

> # SPEICHERN IM TEXTFORMAT :
> # **********************
> filename:=`C:/od-tools/Rainbow/User/richy.txt`;
> fd:= fopen(`filename`,WRITE,TEXT);
> for i from 1 to N do
> fprintf(`fd`,`%g %f\n`,i,f[i]):
> od:
> fclose(fd);

In Mathlab ist der Burg Algorithmus uebrigends auch implementiert.

richy
23.09.08, 16:33
Spektralschaetzung der logistischen Gleichung


r=3.825
http://home.arcor.de/richardon/2008/burg1.gif
1024 Abtastwerte (nicht mittelwertfrei)

Burg Algorithmus 10 ter Ordnung :
http://home.arcor.de/richardon/2008/burg2.jpg

Burg Algorithmus 10 ter Ordnung fuer mittelwertfreie Daten :
http://home.arcor.de/richardon/2008/burg3.jpg

Im Bereich der Frequenzen 5-10 sieht man einen linearen Abfall jedoch vom -6 dB.
Ansonsten kann ich hier keine 1/f Beziehung erkennen.

richy
23.09.08, 21:36
Vergleich des Periodorgamms mit dem Burg Algorithmus

Im folgenden wurden 1024 zufaellige Abstatswerte verwendet, denen eine Sinusschwingung gleicher Amplitude ueberlagert ist.
Hier das Ergebnis der Spektralschaetzung

Periodogramm mit Rechteckfenster
http://home.arcor.de/richardon/2008/rec.gif

Periodogramm mit Barlettfenster
http://home.arcor.de/richardon/2008/barlett.gif

Burg Algorithmus
http://home.arcor.de/richardon/2008/burg.gif

Dabei ist zu beachten, dass der Burg Algorithmus die absoluten Werte der spektralen Leistungsdichte nur unvollkommen wiedergibt.
Wie man sieht liefert er jedoch ein glattes Spektrum.
Die Schwankungen im Periodogramm geben die konstante Leistungsdichte des Zufallssignals dagegen nur sehr schlecht wieder.

Hamilton
27.09.08, 17:24
Hm, also nachwievor denke ich, dass ein 1/f-Spektrum etwas anderes ist als eine 1/x Verteilung. Ich finde außerdem, dass dieser Thread zu unaufgeräumt geworden ist. Der Abstecher in die Spektralschätzer ist ja ganz nett, gehört hier aber nicht rein, das ist nur ein technisches Problem.

2)
Es muss sowohl eine untere Grenzfrequenz fu als auch eine obere Grenzfrequenz fo geben, da die Leistung nicht unbegrenzt sein kann.

3)
Da der ln fuer grosse Argumente von allen Verteilungen am langsamsten waechst, ist die 1/f Verteilung enegetisch am guenstigsten zur Ueberdeckung grosser Frequenzbereiche
Die Fiktion wieisses Rauschen natuerlich ausgeschlossen.
=>
Steht einem physikalischen System ein begrenzter Energievorrat zu Verfuegung und wird dieser ueber einen grossen Frequenzbereich verteilt, so ist mit 1/f Rauschen zu rechnen. Unter Beachtung von 2.

Ich halte die Behauptung, dass ein 1/f-Spektrum Energieminimierend sein soll nichts. Das Leistungsspektrum sagt nur, in welchen Frequenzen wieviel Energie abgestrahlt wird. Da ist nichts minimal.
Das Integral über 1/f konvergiert nicht, wie du richtig bemerkt hast- also muss es irgendwelche harten Grenzen geben- nach oben und nach unten- das halte ich nicht für plausibel. Und- wenn das so wäre, warum hält sich z.B. ein schwarzer Strahler nicht daran? Und woraus leitest du die Grenzen ab?
Das ist einfach zuviel gewollt. Manchmal sieht man Dinge, nur weil man sie sehen will- aber das hier ist einfach nicht zu sehen.

Das Ziel ist, einen Code zu finden, mit dem die Zeichenkette mit so wenig Binärzeichen wie möglich übertragen werden kann. Man kann sich dabei zunutze machen, dass nicht alle Zeichen gleich häufig auftreten und man für Zeichen, die seltener auftreten, deshalb auch längere Sequenzen verwenden kann, wenn es dafür möglich ist, für ein Zeichen, das häufiger vorkommt, eine kürzere Codesequenz zu verwenden.

Auch hier muss ich widersprechen, ich weiß, es ist nicht von dir.
Shannon selbst schrieb in seinem berühmten Paper, dass gerade das nicht das Ziel von Sprache ist mit möglichst kurzen Wörtern auszukommen.
Natürlich könnten wir alle Kombinationen von Buchstaben als Wörter zulassen, z.b. aa, ab, ac, ad, ae ... zx, zy, zz
Das ist vielleicht das Ziel von Datenkompression, aber bei Fehlübertragung von Sprache würde es dazu führen, dass ein bei der Übertragung verändertes Wort, nicht als falsch erkannt werden würde, weil es dann ein anderes Wort wäre. Übertrage ich "Bahnhof" und bekomme "Bahmhaf", erkenne ich, dass es ein Fehler ist und kann evtl. auf das korrekte Wort rückschließen, das geht aber nicht mehr, wenn "Bahmhaf" ein eigenes Wort ist.
Womit wir dabei wären, dass Sprache im Shannonsinne redundant ist und anstatt der Maximierung der Informationsdichte eher die Übertragungssicherheit im Vordergrund steht.

Übrigens: Ich finde es ein bisschen unfair, dass du behauptest, dieser Thread wäre ein Selbstgespräch. Ich mach mir nicht die Mühe, deinen Kram zu lesen und darauf zu antworten um dann als Hintergrundrauschen empfunden zu werden.

richy
29.09.08, 19:39
Hi Hamilton
Hm, also nachwievor denke ich, dass ein 1/f-Spektrum etwas anderes ist als eine 1/x Verteilung.

Also mir gehts im Prinzip genauso. Warum serioese Quelle dann aber vom Lesitungsdichtespektrum von Musik. Sprache, DNA Sequenzen, Herzrhytmus und insbesonders in der logistischen Gleichung sprechen ist mir bischen raetselhaft.
Bei Musik koennte doch das Audiosignal gemeint sein. Das ist sicherlich 1/f verteilt. Ebenso bei Sprache.

Ich halte die Behauptung, dass ein 1/f-Spektrum Energieminimierend sein soll nichts. Das Leistungsspektrum sagt nur, in welchen Frequenzen wieviel Energie abgestrahlt wird. Da ist nichts minimal.
Das Zitat ist nicht von mir sondern dem Buch rauschen, dessen Bucheinblick leider nicht mehr verfuegbar ist. Es ging da vor allem un das 1/f also Funkelrauschen von Halbleitern.

Ich meine eines ist klar :
Wenn ein breitbandiger Uebertragungskanal zur Verfuegung steht, dann waere es toericht diesen nicht zu nutzen.
Je breitbandiger der Kanal ist, umso mehr Information kann ich darin uebertragen.
Blos warum ich dann keine Gleichverteilung benutzen soll ist mir auch nicht klar.
Wenn das Leistungsdichtesprktrum mit c/f abfaellt wie sieht es dann mit der Energie aus ?
Ist die dann nicht konstant ueber die Frequenz ?

Und woraus leitest du die Grenzen ab?

Die Frage ist leicht zu beantworten.
Aus der physikalischen Bandbegrenzug des Kanals.
Eine Geige strahlt sicherlich keinen 1 Mhz oder 10 Hz Ton ab.

Das ist einfach zuviel gewollt. Manchmal sieht man Dinge, nur weil man sie sehen will- aber das hier ist einfach nicht zu sehen.

Da verweise ich wiederum an die Autoren meiner Zitate. Ich will in dem Fall nichts sehen. Nur das 1/x und 1/f Verteilungen ausgezeichnet sind.
Und das will ich nicht sehen, sondern dem ist so.
Den Rosa (1/f) Rauschgenerator im EQ gibt es nicht zum Vergnuegen.
Und das Zipfsche Gesetz oder 80/20 Prinzip findet man ueberall. Selbst auf dem Teppich.

Womit wir dabei wären, dass Sprache im Shannonsinne redundant ist und anstatt der Maximierung der Informationsdichte eher die Übertragungssicherheit im Vordergrund steht.

Ja, demstimme ich zu.,Und danke fuer die Erklaerung. Aber du vergisst die Entwicklung einer Sprache dabei.
Soll man die Codierung aendern weil man mehr zu uebertragen hat.
Also die ganzen haeufigen woerter wie "der die das ein eine" weglassen ?
Nur Mittellange Woerter ? Wurde natuerlich schon gehen.

Der Abstecher in die Spektralschätzer ist ja ganz nett, gehört hier aber nicht rein, das ist nur ein technisches Problem.

Der war zwingend notwendig. Ich habe eben keine Bilder von Spektraldichten gefunden die einen beschriebenen 1/x-1/f auch konkret belegen. Und daher musste ich selber messen.
Und wenn ich das schon tue mache ich das moeglichst genau.

Sorry wegen dem Hintergrundrauschen. Hoffe mal wenigstens 1/f. :-)
Das war nicht auf dich bezogen sondern, dass es gibt eben kaum einen Thread hier in dem wirklich nur 2 Leute diskutieren.
Dialog waere also richtig gewesen.

Hamilton
29.09.08, 20:02
Also mir gehts im Prinzip genauso. Warum serioese Quelle dann aber vom Lesitungsdichtespektrum von Musik. Sprache, DNA Sequenzen, Herzrhytmus und insbesonders in der logistischen Gleichung sprechen ist mir bischen raetselhaft.
Bei Musik koennte doch das Audiosignal gemeint sein. Das ist sicherlich 1/f verteilt. Ebenso bei Sprache.
Naja, man kann ja das Spektrum berechnen, aber es ist eben was anderes als die Verteilung von Features.
Bei einem zeitkontinuierlichem Signal (data), kann man sowohl das Spektrum ( bei matlab periodogram(data) oder psd(data) ) bestimmen oder eben auch die Verteilung im Sinne von Aufenthaltswahrscheinlichkeit ( hist(data) )
Das sind aber eben komplett verschiedene Dinge. Für die Entropie benutzt du das Histogram als Schätzer für die W'keitsdichte, nicht das Spektrum.

Die Frage ist leicht zu beantworten.
Aus der physikalischen Bandbegrenzug des Kanals.
Eine Geige strahlt sicherlich keinen 1 Mhz oder 10 Hz Ton ab.

Na so einfach ist das nicht. Nehmen wir statt 'ner Geige mal 'ne einzelne Saite. Die kann einen Grundton f und alle Obertöne nf, n=1,2,3...
Die werden natürlich mit wachsendem n immer schwächer, aber es gibt kein n_max, wo noch was kommt und dann ist plötzlich Schluss.
Geht die Leistungsdichte statt mit 1/f mit 1/f² oder exp(-f), kovergiert das Integral und du brauchst keine scharfen Grenzen einführen.

richy
29.09.08, 20:43
Das sind aber eben komplett verschiedene Dinge. Für die Entropie benutzt du das Histogram als Schätzer für die W'keitsdichte, nicht das Spektrum.
Denke auch, dass da einige "Experten" sich falsch ausgedrueckt haben oder zu wenig nachgedacht haben. Aber es kann doch nicht allen der selbe Fehler unterlaufen.
*schulterzuck
Ich kann das Histogramm ueber eine Abbildung so veraendern, dass zwar die Histogramm Verteilung veraendert wird aber nicht die AKF der Zeitfunktion wenn ich die Abbildung auf die Zufallsvariable ausfuehre.
Dann wenn in die Abbildung keine vergangenen Werte eingehen.
Und damit kann gar kein eindeutiger Zusammenhang uwischen 1/f und 1/x bestehen.

Na so einfach ist das nicht. Nehmen wir statt 'ner Geige mal 'ne einzelne Saite. Die kann einen Grundton f und alle Obertöne nf, n=1,2,3...
Die werden natürlich mit wachsendem n immer schwächer, aber es gibt kein n_max, wo noch was kommt und dann ist plötzlich Schluss.

Das ist nur Theorie. Es gibt keinen idealen Saegezahn oder Rechteck.
Das waeren unstetige Funktionen. Die gibt es real nicht. Spruenge oder Knicke von Zeitfunktionen sind immer abgerundet.
Jeder Kanal, jedes System ist bandbegrenzt.
Du hoerst von 20 bis 16 000 Hz. Das ist der begrenzte Kanal.
Uebrigends in etwa mit einem 1/f Frequenzgang.

Und selbst die Bandbegrenzung kann kein ideales Rechteckfenster sein.
Das ist sie auch nicht.

Geht die Leistungsdichte statt mit 1/f mit 1/f² oder exp(-f), kovergiert das Integral und du brauchst keine scharfen Grenzen einführen.

Sag das mal Mutter Natur :-)
( 1/f^2 ?)

In einem hast du aber recht.
Die Bandbegrenzung wird zum Beispiel eine Gaussform aufweisen. Und daher
das ganze Spektrum am Rand nicht 1/f verteilt sein. Ideales 1/f gibt es natuerlich nicht.
Die Aussage gilt daher auch nur innerhalb eines Intervalls um die Mitte des bandbegrenzten Kanals. Das kann aber ein sehr weiter Bereich sein.

rene
29.09.08, 23:40
Zitat:
Über das Wiener-Chintschin-Kolmogorow-Theorem eines Zufallsprozesses werden die selbstähnlichen Funktionen durch eine Fourier-Transformation gebildet.
Das ist in dem Thread auch ausfuehrlich besprochen. Warum selbstaehnlich ?
FT eignet sich praktisch nicht so sehr fuer stochastische Signale.

Akustisch ist ein Zufallsprozess mit 1/f Leistungsdichte rosa Rauschen.
Und dieses Spektrum kommt in der Natur sehr haeufug vor.
Da ware die Frage. Warum genau ?
Ist die Energiedichte dann ueber die Frequenz konstant ?

Und die zweite Frage :
Gibt es bei einem zeitlichen diskreten Zufallsprozess einen Zusammenhang zwischen der 1/f Verteilung und dem 1/k Histogramm ?

Will keine Off Topic Diskussion hier starten, obwohl der ganze Zipf Thread natuerlich schon etwas mit der Wirtschaftskrise zu tun hat. Daher nur kurz die Frage :
Was bedeutet ein 1/f Leistungsdichtespektrum energetisch ?

Hi richy

Ja, ist ein wenig off topic im Systemkrise-Thread, deshalb weiche ich hier aus.

(Auto-) Korrelativ statt selbstähnlich wäre wohl der bessere Ausdruck.
Die Energie E=int(¦|X f()²|)*df in der 1/f-Verteilung scheint über den gesamten Frequenzbereich annähernd gleich und somit auch die Leistung als Energie pro Zeit. Auch unser Gehör hat einen 1/f-Rauschfilter und wir nehmen die höheren Töne bis zu einer physiologisch bedingten Frequenz von etwa 20kHz anteilsmässig stärker wahr, sodass das rosa Rauschen über alle hörbaren Frequenzen gleich stark empfunden wird.
Die 2. Frage lässt sich vermutlich nicht so einfach beantworten. Ich sehe allenfalls eine gewisse Ähnlichkeit mit der Poisson-Verteilung für Warteschlangenprobleme, wobei zuerst ein Anstieg bis zum Erwartungswert der Verteilung stattfindet, um dann mit der 1/f-Verteilung im Histogramm konform zu gehen.

Ich war wohl nicht eine besondere Hilfe!

Grüsse, rene

Hamilton
07.10.08, 20:40
Ich hab mal eben was berechnen lassen.
Dies ist das Histogram des Songs Useless von Depeche Mode.

Zur besseren Vergleichbarkeit habe ich den Song vorher auf Varianz=1 und Mittelwert=0 gebracht.

96
Das geübte Auge erkennt sicher sofort, dass dies eine logarithmierte Darstellung ist.

Hier kommt nun der Spektralschätzer nach der Welch-Methode
95
Frequency 1 entspricht ca. 22050 Hz (Datei hatte CD-Qualität)

1/f hat das Spektrum mit gutem Willen im Bereich von f=0.1 bis 0.4
(bitte bedenken, Darstellung ist wieder logarithmisch)

richy
08.10.08, 22:28
Hi Hamilton
Danke fuer die Muehe. Wie hast du das erste Bild erstellt ?
Die Spannungswerte aus einer wav Datei ?

Naja 1/f sieht man tatsaechlich nicht viel. Auffaellig auch die Absenkung
im Mittenbereich. Das ist aber auch ein typisches Spektrum von Pop Musik.
Loudness Sound.
Mit klassischer Musik oder einem einzelnen Instrument wuerde das Ergebnis anders ausfallen.
Depeche Mode benutzt ja nicht gerade akustische natuerliche Instrumente :-)
Und die Aufnahem ist sicherlich mit EQ berbeitet. Mittenabsenkung.
Die Frequenzskala ist mir auch nicht klar. Ist die logarithmisch ?
Welche Werte entsprechen einer Oktav ?

Fuer das Ausrauschen einer Halle wird rosa Rauschen verwendet, also ein 1/f Spektrum. Sicherlkich kein Zufall.
Und auch am physik. Institut der Uni Karlruhe gibt es den 1/f Hinweis bei klassischer Musik, Vogelgezwitscher und dem Wasserstand des Nils :-).

Im Programm Nero gibt es einen FFT Analyzer. Ich werd da auch mal nachschauen.
...
Habs grad mal mit Puccini Turandot ausprobiert.
Das ist in log log Darstellung ganz klar ein linear fallendes Spektrum. Also 1/f^n
Allerdings stimmen die -3 dB/Okt nicht.
Es sind mindestens -6dB/Okt. Das entspraeche 1/f^2- Eher -10dB/Okt
Bei dir scheinen das auch -10 dB
Aber das wuerde sogar passen. Denn das Gehoer empfindet nicht doppelte Leistung als
doppelt so lat. Sondern 10 sone. Und das entspricht etwa 10 dB.
Also hundertfacher Leistung.
Fuer den physiologischen Hoereindruck entspraechen somit -10dB einem 1/f Speltrum.
Wuerde mich aber wundern dass man dies dann nicht explizit betont.

Ich habe nen eher maessigen mp3 verwendet.
mp3 verzerrt das ganze Spektrum, aber ob da die -10dB herkommen ?
Werde daher das Ganze noch mal mit einer Klassik CD messen.


Gruesse