Fix/investigate Nc après MaJ 22
Investigation, pourquoi ça coince:
-
Regarder les 500 dans les containers web - SlowLog php fpm - ajouter des capabilities docker..
- log les requêtes >60s
- aujourd'hui timeout 600s
- augmente log level php
- augmente log level Nc
-
trouver un mechanism pour pouvoir debugger la prochaine fois que ça arrive
Comment mitiger/Améliorer:
- stickiness
- comment faire qu'un user soit dirigé:
- vers un seul LB
- puis un seul ingress
- puis un seul pod web/app
- comment faire qu'un user soit dirigé:
- configurer max_request
à faire:
-
avoir un seul pod web/app -
readiness -
liveness -
virer le healthcheck php (qui ne fonctionne pas à cause de ce bug k8s
En attendant pour monitorer: https://grafana.liiib.re/d/a5715fa98ed2077a4a3962c831a7df573d54202a/kubernetes-compute-resources-namespace-pods?from=now-1h&orgId=1&to=now&var-cluster=&var-datasource=default&var-interval=4h&var-namespace=liiib-re&refresh=10s