Asus Radeon RX550 amdgpu kernel panic

also es scheint so als sei dies ein 14 problem. ich habe versucht mein system auf 14.1 zu updaten und nun habe ich wieder dieses problem...... und ich habe kein backup gemacht
 

Irgendwas ist mit 6.1, wobei es bei mir aber grundsätzlich bis auf den logspam funktioniert.
 
ich habe versucht mein system auf 14.1 zu updaten und nun habe ich wieder dieses problem...... und ich habe kein backup gemacht
vielleicht kannst du noch eines der automatisch von freebsd-update angelegten boot-environments nutzen? Ansonsten den letzten snap zurück rollen?
Meine Erfahrung ist sehr bescheiden damit, aber ich habe nun zwei PCs auf 14.1 laufen. Einer steht auf latest und hat nvidia drin und hier bin ich insgesamt drei mal gescheitert (aus unterschiedlichen Gründen) und weil keine Lust zu suchen, brauchte ich auch einen rollback. Die boot-environments haben mir persönlich bisher noch nicht helfen können.
Der besagte PC ließ sich nun nahezu ohne Hürden diese Woche komplett in einem Rutsch updaten.
Frag mich, wieso?
Vermutlich, weil es immer etwas dauert, bis verschiedene Kernel-Module tatsächlich angepasst sind und besonders mit latest, muss dann eher schon mal Hand angelegt werden (was ich diesmal jedoch vermieden habe).
Der zweite PC ist ein alter Laptop mit Intel-Grafik und steht auf quarterly. Er hatte alles auf Anhieb erledigt, steht aber noch auf drm-kmod 515. Ich sehe damit keinerlei Fehler.

Bei beiden liefen die VMs in VirtualBox nicht mehr und hier musste virtualbox-ose-kmod oder so ähnlich neu gebaut werden.
Weil der Laptop gar keine Ports drauf hat, kopierte ich die Module einfach von Hand auf diesen PC.
Dies ist kein neues Problem und es könnte vielleicht auch bei anderen Problemen helfen, die jeweiligen Treiber/Module aus den Ports zu probieren.
 
es lag am drm-kmod. der normale drm treiber in 14 ist fehlerhaft, ich habe aus denn ports drm-61-kmod installiert und alles läuft
 
nur, um zu allgemeiner Verwirrung bei zu tragen, möchte ich meine Erfahrungen der letzten Tage beisteuern.
Der PC hat eine nvidia und läuft auf 14.1-P6.
Weil ich ja nun gelesen hatte, dass es den drm-61-kmod gibt, wollte ich natürlich diesen einbauen und wegen der Information aus dem Thread auch aus den Ports bauen. Anschließend wurde der Treiber nicht geladen, weil die Version nicht zum nvidia-Treiber passte, weshalb ich dann auch diesen aus den Ports gebaut habe.
Zuvor hatte ich keine Probleme und nun auch nicht.
Code:
> kldstat | grep nvidia
14    2 0xffffffff8338d000   126678 nvidia-modeset.ko
15    2 0xffffffff83600000  314e420 nvidia.ko
16    1 0xffffffff834b4000    10980 nvidia-drm.ko

> pkg info drm-61-kmod
drm-61-kmod-6.1.92_2
Name           : drm-61-kmod
Version        : 6.1.92_2
Installed on   : Fri Nov  1 12:19:12 2024 CET
Origin         : graphics/drm-61-kmod
Architecture   : FreeBSD:14:amd64
Prefix         : /usr/local
Categories     : kld graphics
Licenses       : MIT and GPLv2 and BSD2CLAUSE
Maintainer     : x11@FreeBSD.org
WWW            : https://github.com/freebsd/drm-kmod/
Comment        : DRM drivers modules

> pkg info nvidia-drm-61-kmod
nvidia-drm-61-kmod-550.127.05_1
Name           : nvidia-drm-61-kmod
Version        : 550.127.05_1
Installed on   : Fri Nov  1 12:19:25 2024 CET
Origin         : graphics/nvidia-drm-61-kmod
Architecture   : FreeBSD:14:amd64
Prefix         : /usr/local
Categories     : kld graphics
Licenses       : NVIDIA
Maintainer     : ashafer@badland.io
WWW            : https://www.nvidia.com/object/unix.html
Comment        : NVIDIA DRM Kernel Module

> pkg info nvidia-driver
nvidia-driver-550.127.05
Name           : nvidia-driver
Version        : 550.127.0
Nun dachte ich mir selbst: woher sollten eigentlich auch Probleme kommen, denn wird überhaupt drm bei mir benutzt?
Mir sind auf Anhieb keine echten Anwendungsfälle eingefallen, wo meine Grafik es brauchen würde. Ich habe keinen modernen Composite-Manager, kein Wayland, kein Sway, keine Spiele usw. Was mir auf die Schnelle nur einfiel: mpv:
Code:
 > mpv -vo=help
Available video outputs:
  gpu              Shader-based GPU Renderer
  gpu-next         Video output based on libplacebo
  vdpau            VDPAU with X11
  wlshm            Wayland SHM video output (software scaling)
  xv               X11/Xv
  dmabuf-wayland   Wayland dmabuf video output
  x11              X11 (software scaling)
  libmpv           render API for libmpv
  null             Null video output
  image            Write video frames to image files
  tct              true-color terminals
  drm              Direct Rendering Manager (software scaling)
  kitty            Kitty terminal graphics protocol
Also, da gibt es einen drm-Output, den ich aber noch nie probiert hatte.
Nun startete ich einen Film darüber und nichts passierte. Nach einer Weile brach ich mit STRG+C ab und schlagartig bootete mein PC neu.
Das wiederholte ich noch einmal und seither lasse ich die Finger davon.

Auf dem zweiten Rechner mit älteren Versionen und anderer GraKa gab es nur eine Fehlermeldung, dass drm nicht auf das modesetting zugreifen könne, wegen fehlender Rechte.
Also egal, wo auch immer der Fehler nun liegen mag, es kommt mir dies durchaus nicht so ganz geheuer vor bei den neuesten Versionen mit drm.

Ich erzähle das ausführlich, falls jemand vielleicht mehr Lust am Testen hat und mehr Wissen, um da Fehler zu finden.
Aber die anschließende Frage ist ganz einfach: wozu will ich / brauche ich denn eigentlich den drm-kmod überhaupt?

Also, wenn ich damit Probleme hätte, wie es in diesem Thread ja aussieht, dann würde ich drm einfach mal weg lassen.
Bei mir zumindest zeigt das überhaupt gar keinen Unterschied, den ich wahrnehmen könnte.
 
Der PC hat eine nvidia und läuft auf 14.1-P6.
Weil ich ja nun gelesen hatte, dass es den drm-61-kmod gibt, wollte ich natürlich diesen einbauen
[S]drm-kmod[/S] deckt nur Intel, alte Radeons (radeonkms) und neue AMDs (amdgpu) ab.
Für nvidia:
[S]nvidia-driver[/S]
Ups, nvidia-drm-61-kmod ist mir jetzt auch neu. :)
 
drm-kmod deckt nur Intel, alte Radeons (radeonkms) und neue AMDs (amdgpu) ab.
Für nvidia: nvidia-drivers
das ist mehr oder weniger das Gleiche, wenn ich das richtig sehe. Die nvidia Treiber installieren auch automagisch die amd-Treiber und bauen auch darauf auf.
Aber natürlich habe ich für die nvidia-Karte auch die passenden Treiber installiert, falls ich das irgendwo falsch dargestellt haben sollte.
 
falls ich das irgendwo falsch dargestellt haben sollte
Es las sich für mich plump so, als wolltest du den nvidia-driver mit drm-kmod ersetzen. ;)

Du kannst beim mpv ein Info-Overlay mit SHIFT+I einblenden. Da siehst du dann den renderer und (hoffentlich) auch keinerlei frame drops.

Eine GPU-beschleunigte Wiedergabe kannst du in /.config/mpv/mpv.conf so freischalten:
Code:
hwdec=auto
hwdec-codecs=all
vo=gpu-next
gpu-api=vulkan
vd-lavc-film-grain=gpu

Die letzten drei Zeilen sind optional und für nicht uralte Hardware gedacht, sollten aber auch nicht schaden.
Klappt alles, braucht mpv dann vielleicht eine Bedenksekunde mehr für den Start/Cachefill, aber der meiste Videoabspiel"ballast" läuft dann über die GPU und entlastet die CPU. Gerade bei neueren, hochauflösenden Codecs wie HEVC/AV1 eine Wohltat. Mit SHIFT+I solltest du dann auch den anderern renderer sehen.
 
Heute morgen hing mein X, die Maus bewegte sich noch, doch der Rest war eingefroren.
Als ich auf ttyv0 blickte, sah ich die nachfolgenden Fehler, logte mich als root auf ttyv1 ein und versuchte, den drm.ko zu kldunloaden.
Danach blickte ich auf X, die Maus verschwand und der PC startete neu.
Dies ist zum ersten Mal passiert. Erst seit wenigen Tagen benutze ich den drm.61.
Code:
pcib4: Correctable PCIe error reported by APEI
pcib4: status 0x00000040 mask 0x00000000
[drm ERROR :nv_drm_master_set] [nvidia-drm] [GPU ID 0x00004100] Failed to grab modeset ownership
[drm ERROR :nv_drm_master_set] [nvidia-drm] [GPU ID 0x00004100] Failed to grab modeset ownership
pcib4: Correctable PCIe error reported by APEI
pcib4: status 0x00000040 mask 0x00000000
2024-11-05T07:14:17.160159+01:00 Mifcom.Pit login 8766 - - login on ttyv1 as root
2024-11-05T07:14:17.160188+01:00 Mifcom.Pit login 8766 - - ROOT LOGIN (root) ON ttyv1
<6>[drm] [nvidia-drm] [GPU ID 0x00004100] Unloading driver
Warning: can't remove non-dynamic nodes (dri)!
Warning: memory type drm_managed leaked memory on destroy (9 allocations, 576 bytes leaked).
iic0: detached
iicbus0: <unknown card> at addr 0
Warning: memory type debugfsint leaked memory on destroy (2 allocations, 80 bytes leaked).
 
Danach blickte ich auf X, die Maus verschwand und der PC startete neu.
Dies ist zum ersten Mal passiert. Erst seit wenigen Tagen benutze ich den drm.61.
Oh je. In dem Fall würde ich einfach wieder nach drm515 (oder welchen Treiber du auch immer vorher benutzt hast) wechseln... Merkwürdig, hier scheinen in letzter Zeit einige ernsthafte Probleme mit drm61 zu haben... Da kann ich es ja fast als Glück bezeichnen, dass ich verschont geblieben bin.
 
n dem Fall würde ich einfach wieder nach drm515 (oder welchen Treiber du auch immer vorher benutzt hast) wechseln.
auf diesem PC hatte ich offenbar aus Versehen zuvor gar keinen drm benutzt und ich würde das auch eher wieder ohne machen, wenn sich Probleme häufen.

Vor dem Fehler hatte ich mit picom, meinem compsite-manager gespielt und einige Einstellungen ziemlich wild verändert, ohne die man-page zu lesen. Deshalb vermute ich eher hier eine Unverträglichkeit, beobachte die Sache aber noch.

Trotzdem sollte drm nicht abstürzen und Speicherverletzungen erzeugen und deshalb habe ich das mal hier gepostet. Wenn ich aber die zahlreichen Bemerkungen zu diesem Thema lese, finde ich häufig die Aussage, dass Nvidia offenbar nicht mehr gut mit FreeBSD zusammen arbeitet und es deshalb gar keinen eigenen drm-Support für FreeBSD (also zb inklusive CUDA) gibt, sondern nur offenbare Notlösungen, die man aus Linux ableitet.

Wie gesagt: ich sehe für mich keinen so großen Vorteil mit drm, als dass ich das unbedingt haben müsste.
 
Deshalb vermute ich eher hier eine Unverträglichkeit, beobachte die Sache aber noch.
Ja, mit der 6.1 ist irgendwas unkoscher. Ich hab dem ganzen etwas hinterhergegoogelt, aber es erschläute mich nicht. Mal die nächsten Versionen austesten.

dass Nvidia offenbar nicht mehr gut mit FreeBSD zusammen arbeitet
Nein, der nvidia-driver funktioniert immer noch bestens...

also zb inklusive CUDA
...es ist nur so, dass Nvidia kein CUDA unter FreeBSD bietet.

https://wiki.freebsd.org/Graphics sagt:
nvidia-drm-kmod indirectly provides a kernel module for use with: NVIDIA graphics hardware

Aus diesem indirectly kann ich mir nichts ableiten, da in meiner rc.conf z.B. kld_list="nvidia-modeset" drinsteht, wie es der Treiber damals wollte. Kein Update beschwerte sich seitdem, ggf. kann das jemand aufdröseln.

Ohne jetzt mehr zu wissen, bleibe ich daher bei der Empfehlung nvidia=nvidia-driverAMD/Intel=drm-kmod/drm-61-kmod
 
ggf. kann das jemand aufdröseln.
ob ich das kann, werden wir vielleicht sehen. Aber ich will nicht alle Dokumentationen zu dem Thema nun wieder zusammen suchen, sondern erzähle grad so, als wenn wir zusammen am Lagerfeuer säßen und Abenteuergeschichten austauschen.
Der Nvidia-kmod ist eine Ergänzung zum Nvidia Treiber.
Nach der Installation muss man das neu erzeugte Modul auch laden, es benötigt dazu die Modesets, die mit dem Nvidia-Treiber kommen.
Bei mir steht deshalb in der rc.conf u.a. in der kld_list="...nvidia-modeset nvidia-drm..." und ich habe den Verdacht, dass dies auch genügt, habe aber in der /boot/loader.conf auch noch drin: hw.nvidiadrm.modeset=1 , weil ich das in einer Anleitung (zu einem älteren drm) so gefunden hatte.

Wenn der X-Server startet, macht der ein drm-Gerät, das dem DRI zur Verfügung steht (aus der Xorg.0.log):
Code:
[ 27557.226] (II) xfree86: Adding drm device (/dev/dri/card0)
[ 27557.226] (II) Platform probe for /dev/dri/card0
[ 27557.226] (**) OutputClass "nvidia" ModulePath extended to "/usr/local/lib/nvidia/xorg,/usr/local/lib/xorg/modules,/usr/local/lib/xorg/modules"
[ 27557.226] (**) OutputClass "nvidia" setting /dev/dri/card0 as PrimaryGPU
Danach lädt dann der X-Server die diversen Beschleunigungsmodule und sucht den besten Treiber, falls der nicht schon in einer .config manuell auf nvidia festgelegt wurde. Man braucht diese Festlegung nicht und merkt auch keinen echten Unterschied, wenn zuvor noch VESA und SCFB und so getestet werden. Auch der nv (ich denke mal nouveau) wird probiert, aber dann der nvidia genommen und alle anderen verworfen.
Der X-Server teilt nun den diversen Beschleunigern mit, dass es ein drm-Gerät gibt und die benutzen dann das entsprechende Gerät, eben über das geladene drm-Modul.

Gibt es kein drm-Modul, fehlt eben das drm-Gerät und die diversen Beschleuniger benutzen es dann eben nicht.
Der Nvidia-Treiber wird aber geladen und baut auf die Modesets und lädt auch alle weiteren Beschleuniger, ich nenne die mal 2D-Beschleuniger.
 
Zurück
Oben