Bonjour,
Vous avez du remarquer, depuis quelques jours (même peut-être 10 ou 15, en fait), que les performances sur Lexpage sont loin d'être au beau fixe. Je suspectais quelque chose du coté de la database vu que ces lenteurs avaient tendance à se provoquer essentiellement sur les pages "lourdes" (accueil, listing des billets, listing des discussions, ...) mais cela semble concerner aussi bien la partie Python (Lexpage) que PHP (Piwik analytics).
Je copie-colle mon message à Tchou (qui m'a remonté un complément d'information aujourd'hui) :
J'ai rebooté le serveur, cela n'a rien changé. J'ai des workers uwsgi qui spawn comme il faut, même si à chaque requête, cela bouffe un peu de CPU (environ 30 à 40%), rien de dramatique. Je vois dans les logs de Supervisor que ces workers prennent leur temps pour répondre aux requêtes (jusqu'à 3000ms sur le json du minichat). J'ai vérifié du coté d'uwsg et Django, sans rien voir d'anormal. Surtout que cela n'expliquerait pas les performances limitées du coté PHP aussi.
La DB n'est pas en surcharge non plus, j'ai 8 connexions simultanées autorisées, et baisser le timeout (pour les faire crasher plus rapidement) n'a rien changé. Ce n'est donc pas de là que ça vient.
J'ai lancé quelques tests, notamment sur des pages servies par PHP et n'utilisant pas de base de données (notamment la page d'accueil de PhpMyAdmin, qui est relativement légère), et j'ai des performances moyennes correctes, mais avec des gros pics par moment. J'en déduis donc que c'est quelque chose d'externe à ces outils...
En parallèle, j'ai pu constater des gros freezes dans ma connexion SSH avec le VPS. A nouveau, un top ne m'a pas permis d'identifier quoique ce soit, mais dans les logs du reboot de la machine, j'ai pas mal d'erreurs qui s'affichent (j'ai pas encore tout regardé). Je suspecte un potentiel problème matériel chez OVH, ou alors un abus de ressources de la part d'un autre client. Le hic, c'est que ça ne risque pas de s'arranger, vu mes expériences passées avec OVH, je sais de source sûre qu'ils vont m'envoyer vers un plan plus cher en rejetant la faute sur moi, plutôt que d'investiguer (ou même de surveiller leurs logs).
On verra comment ça se comporte à l'avenir, en croisant les doigts pour que ça soit une panne matériel, et que le matériel concerné lâche rapidement