Bon, allez, pour la postérité, je le mets ici tout de même
J'ai mis en place une nouvelle technique d'analyse de séries temporelles, à grande échelle. Il faut encore la valider du point de vue statistique, mais dans les grandes lignes, l'idée est de regrouper une approche par lag (typiquement utilisée pour les auto-corrélations) avec des alignements multiples. En gros, l'idée est d'analyser la co-variance des dérivés premières par paire de séries temporelles (plus fin, mais nécessite une correction de Bonferonni pour être statistiquement représentatif : un test de Spearman ou, si les données suivent une loi normale, de Pearson). Le lag s'introduit progressivement dans la seconde série (par symétrie : dans la première) sous l'hypothèse que les deux séries sont échantillonnées de la même façon (cela se ré-échantillonne dans le cas contraire).
On obtient donc un ensemble de valeur de covariance pour différentes valeurs de lag. On peut alors facilement représenter, pour chaque valeur de lag, la distribution des covariances et en déduire la corrélation, avec ou sans lag, entre les séries temporelles.
Y en a qui sont arrivés jusqu'à la fin de ce message ?
Pour donner une idée, cela permet d'avoir facilement ce
genre de visualisation qui permet notamment, dans mon cas, de voir que les corrélations sont les plus marquées sans décalage (ce qui va faciliter la suite des analyses) et que le cas 2e ligne / 1ere colonne a une corrélation inverse fortement marquée (ce qui nous intéresse davantage que la corrélation positive que l'on retrouve pratiquement partout ailleurs, sauf la 2e et la 6e case où c'est un peu différent).
Ce message a été modifié 1 fois.
Dernière modification : 29 septembre 2015
à 19:47 par
Guybrush.