CPUfreq Diagramm (mal wieder)

Post Reply
silvio
Posts: 29
Joined: May 22nd, 2009, 12:07 pm

CPUfreq Diagramm (mal wieder)

Post by silvio » April 17th, 2019, 9:13 am

Hallo,

da ich bisher kein System mit auslesbarer Frequenz hatte bin ich jetzt über das Problem gestolpert.
Die Meldung ist:
"Die Grafik https://192.168.2.1:444/cgi-bin/system.cgi?cpufreq?day kann nicht angezeigt werden, weil sie Fehler enthält."

Ich habe die Lösungsansätze von:
viewtopic.php?t=21119
durchprobiert und bisher keine Lösung gefunden.

Ich kann die von /etc/init.d/collectd abgefragten Files (/sys/devices/system/cpu/cpu0/cpufreq/scaling_cur_freq) für alle CPUs finden und im collectd.conf wird das CPUFreq Plugin als zu laden aufgeführt:
LoadPlugin cpufreq
Die rrds Files für die einzelnen CPUs werden auch erzeugt und unter /var/log/rrd/collectd/localhost/cpufreq abgelegt und aktualisiert:
[root@ipfire cpufreq]# ls -la
total 3656
drwxr-xr-x 2 root root 4096 Apr 16 14:59 .
drwxr-xr-x 77 root root 4096 Apr 11 20:12 ..
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-0.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-10.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-11.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-12.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-13.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-14.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-15.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-16.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-17.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-18.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-19.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-1.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-20.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-21.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-22.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-23.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-2.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-3.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-4.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-5.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-6.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:01 cpufreq-7.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-8.rrd
-rw-r--r-- 1 root root 154888 Apr 17 11:02 cpufreq-9.rrd
Im ersten Schritt habe ich collectd gestopt und den rrd Folder komplett geleert.
Alle rrds und Graphen wurden neu erzeugt außer der CPUFreq Graph.

Gibt es eventuell Limits was die Anzahl der CPUs angeht oder gibt es etwas anderes was ich noch testen kann?

Grüße

Silvio

silvio
Posts: 29
Joined: May 22nd, 2009, 12:07 pm

Re: CPUfreq Diagramm (mal wieder)

Post by silvio » April 17th, 2019, 1:36 pm

Im Zusammenhang mit der Suche nach der Ursache ist mir gerade folgendes aufgefallen.

Ich habe auf dem Server gerade das Hyper-Threading abgeschaltet.
Dadurch minimiert sich die Anzahl virtuell verfügbarer Kerne.
Um sicher zu gehen das es keine Probleme mit den vorher gewonnen Daten gibt habe ich das rrd Verzeichnis vorher geleert.

Nach dem reboot habe ich jedoch nur noch von 4 CPU Kernen die cpufreq rrd Files im rrd Verzeichnis obwohl 12 CPUs erkannt werden.
[root@ipfire localhost]# ls -la
total 204
drwxr-xr-x 51 root root 4096 Apr 17 15:06 .
drwxr-xr-x 3 root root 4096 Apr 17 15:05 ..
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-0
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-1
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-10
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-11
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-2
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-3
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-4
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-5
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-6
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-7
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-8
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpu-9
drwxr-xr-x 2 root root 4096 Apr 17 15:05 cpufreq

[root@ipfire localhost]# cd cpufreq/
[root@ipfire cpufreq]# ls -la
total 768
drwxr-xr-x 2 root root 4096 Apr 17 15:05 .
drwxr-xr-x 51 root root 4096 Apr 17 15:06 ..
-rw-r--r-- 1 root root 154888 Apr 17 15:18 cpufreq-0.rrd
-rw-r--r-- 1 root root 154888 Apr 17 15:17 cpufreq-1.rrd
-rw-r--r-- 1 root root 154888 Apr 17 15:17 cpufreq-2.rrd
-rw-r--r-- 1 root root 154888 Apr 17 15:18 cpufreq-3.rrd
-rw-r--r-- 1 root root 154888 Apr 17 15:18 cpufreq-4.rrd
Bei der Suche nach der möglichen Ursache fiel folgendes auf.
Der Core Nr. 6 hat unter /sys/devices/system/cpu/cpu5 keinen cpufreq Link in das entsprechende policy Verzeichnis.
Die darauf folgenden Cores haben diese aber wieder.

Zwei Dinge die mich wundern:
1. Warum wird nach dem abschalten von HT an dem Core die CPU Frequenz nicht mehr erkannt/geregelt?
2. Warum hört collectd bei diesem Core auf die Daten zu erfassen und ignoriert alle Daten der Cores die nachfolgend kommen?

Nach einem weiterem Reboot war der Core Nr. 7 ohne cpufreq Link und die Daten im collectd Verzeichnis wurden bis cpufreq-6.rrd aufgeführt.
Somit scheint collectd wirklich immer die Abfrage nach Daten an dem betroffenen Core abzubrechen.

Das Problem mit der (nicht) Darstellung hat sich durch diese Änderung übrigens nicht gelöst.

Silvio

Post Reply