[Linuxtrent] Re: Problema in squid o altro ? Fantasmi ?

  • From: Kinkie <gkinkie@xxxxxxxxx>
  • To: LinuxTrent ML <linuxtrent@xxxxxxxxxxxxx>
  • Date: Thu, 15 Jan 2015 10:51:49 +0100

Ciao,
   stai per caso usando un RAID per la cache di squid? Questo
messaggio sembrerebbe un timeout da parte di un controller raid
hardware..

2015-01-15 9:38 GMT+01:00 Ezio Paglia <ezio@xxxxxxxxxxxxxxx>:
> Riccardo Bicelli ha scritto:
>
> Ciao Ezio,
> può succedere che il kernel vada in panic ma la macchina continui a
> rispondere al ping.
> La prima cosa che farei è abilitare il coredump (mi sembra che in debian sia
> il package corekeeper), così in caso di crash del kernel hai a disposizione
> un log per capire che è successo, sempre che di crash del kernel si tratti.
>
> Ciao.
> Da wheezy-backports (sembra che non sia in wheezy) ho preso corekeeper.
> Il settaggio di ulimit per il sistema, tutti gli utenti, per tutti i
> processi, non ha evitato il blocco che si è verificato, puntalmente, in un
> momento di apparente scarsa richiesta per il sistema.
> La novità è che sono riuscito ad entrare anche in ssh sul sistema (entrerei
> anche in console) e posso visionare i log.
>
> Da dmesg a macchina stallata (che non risponde a richieste proxy utente)
> vedo queste righe che si riferiscono al prima e al dopo l'errore:
>
> ...
> [    9.435777] ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
> [   18.832043] eth1: no IPv6 routers present
> [   19.768051] eth0: no IPv6 routers present
> [14520.500031] INFO: task jbd2/cciss!c0d0:155 blocked for more than 120
> seconds.
> [14520.500048] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables
> this message.
> [14520.500060] jbd2/cciss!c0d0 D ffff88011bc12780     0   155      2
> 0x00000000
> [14520.500068]  ffff8801138a9740 0000000000000046 ffffffff00000000
> ffffffff8160d020
> [14520.500076]  0000000000012780 ffff880113921fd8 ffff880113921fd8
> ffff8801138a9740
> [14520.500083]  ffff880113921b20 0000000113921b20 ffff880113e6ea60
> ffff88011bc12fd0
> [14520.500091] Call Trace:
> [14520.500105]  [<ffffffff810b5267>] ? lock_page+0x20/0x20
> ...
>
> Credo che la diagnosi sia che il sistema non riesce in tempo utile a
> scrivere sui dischi.
> Questo spiega anche il fatto che, dopo il boot, il syslog non presenta
> errori.
>
> Probabilmente debbo muovermi verso un sistema completamente o quasi no
> caching e comincerei a ridurre i parametri (già bassi) di caching.
>
> Concordate ? Avete altri suggerimenti ?
> Grazie
> Ezio
>
>
>



-- 
    Francesco
--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: