[Linuxtrent] Re: bug nel kernel

  • From: "Roberto A. Foglietta" <roberto.foglietta@xxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Tue, 05 Oct 2004 11:57:27 +0200

Flavio Stanchina wrote:

Roberto A. Foglietta wrote:

Ho isolato il problema, conosco in quali situazioni accade, so che altri lo hanno rilevato ma non isolato altrettanto bene (usando google).

Si presenta quando il supporto su cui è scritto il file/partizione cramfs è su un dispositivo ad accesso lento [...]


Scrivi al maintainer del cramfs (hint: quinlan@xxxxxxxxxxxxxxxxxxxxx) e metti in CC linux-kernel@xxxxxxxxxxxxxxx, descrivendo con la massima precisione le tue osservazioni. Se qualcuno pensa che le tue indicazioni siano utili, ti risponderà chiedendo di fare altre prove o di applicare qualche patch preparata al volo.

Se riesci a riprodurre regolarmente il problema, cerca di buttare giù uno script shell che automatizza il processo.


Grazie dell'aiuto. Il problema l'ho reso riproducibile in maniera deterministica ma non credo sia possibile farne uno script perchè alcune cose potrebbero cambiare da macchina a macchina


Verificato: il baco si presenta anche in se copio l'immagine cramfs in tmpfs e poi la uso da lì quindi con access time ridottissimo.

Ancora da verificare se la lentezza della CPU è un parametro fondamentale, essendo compressa potrebbe scadere un timeout sulla richiesta di read da parte del kernel di un grosso file (ho mplayer su quella partizione e va in oops quando lo uso) perchè richiede un tempo di decompressione elevato. In particolare va in OOPS appena dopo montata la partizione e subito chiamo un grosso applicativo su di essa.
La richiesta di lettura ritornerebbe un NULL pointer che manderebbe il kernel in OOPS (il msg è appunto legato all'impossibilità di gestire un NULL pointer).


Ovviamente sono ancora ipotesi da verificare. Ma piano piano vedo di togliere tutte le variabili irrilevanti al verificarsi del problema in maniera da fare un report quanto più preciso possibile. Perchè temo sia il grande numero di variabili coinvolte che abbiano reso il bug finora non individuabile. Infatti è scritto che si sa che capita ma che è da verificarne ancora l'esistenza.
Dopo aver tolto il sync dalla partizione e prima di togliere la preemption nel kernel in effetti il problema appariva essere di natura random, cioè non riproducibile.




 Ciao,
--
Roberto A. Foglietta
Analista Programmatore GNU/Linux
SAD Trasporto Locale S.p.a.
Corso Italia 13/N
39100 BOLZANO (I)

Tel.    +39/0471-450.261
Fax     +39/0471-450.253

--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: