Ciao, stai per caso usando un RAID per la cache di squid? Questo messaggio sembrerebbe un timeout da parte di un controller raid hardware.. 2015-01-15 9:38 GMT+01:00 Ezio Paglia <ezio@xxxxxxxxxxxxxxx>: > Riccardo Bicelli ha scritto: > > Ciao Ezio, > può succedere che il kernel vada in panic ma la macchina continui a > rispondere al ping. > La prima cosa che farei è abilitare il coredump (mi sembra che in debian sia > il package corekeeper), così in caso di crash del kernel hai a disposizione > un log per capire che è successo, sempre che di crash del kernel si tratti. > > Ciao. > Da wheezy-backports (sembra che non sia in wheezy) ho preso corekeeper. > Il settaggio di ulimit per il sistema, tutti gli utenti, per tutti i > processi, non ha evitato il blocco che si è verificato, puntalmente, in un > momento di apparente scarsa richiesta per il sistema. > La novità è che sono riuscito ad entrare anche in ssh sul sistema (entrerei > anche in console) e posso visionare i log. > > Da dmesg a macchina stallata (che non risponde a richieste proxy utente) > vedo queste righe che si riferiscono al prima e al dopo l'errore: > > ... > [ 9.435777] ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready > [ 18.832043] eth1: no IPv6 routers present > [ 19.768051] eth0: no IPv6 routers present > [14520.500031] INFO: task jbd2/cciss!c0d0:155 blocked for more than 120 > seconds. > [14520.500048] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables > this message. > [14520.500060] jbd2/cciss!c0d0 D ffff88011bc12780 0 155 2 > 0x00000000 > [14520.500068] ffff8801138a9740 0000000000000046 ffffffff00000000 > ffffffff8160d020 > [14520.500076] 0000000000012780 ffff880113921fd8 ffff880113921fd8 > ffff8801138a9740 > [14520.500083] ffff880113921b20 0000000113921b20 ffff880113e6ea60 > ffff88011bc12fd0 > [14520.500091] Call Trace: > [14520.500105] [<ffffffff810b5267>] ? lock_page+0x20/0x20 > ... > > Credo che la diagnosi sia che il sistema non riesce in tempo utile a > scrivere sui dischi. > Questo spiega anche il fatto che, dopo il boot, il syslog non presenta > errori. > > Probabilmente debbo muovermi verso un sistema completamente o quasi no > caching e comincerei a ridurre i parametri (già bassi) di caching. > > Concordate ? Avete altri suggerimenti ? > Grazie > Ezio > > > -- Francesco -- Per iscriversi (o disiscriversi), basta spedire un messaggio con OGGETTO "subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx