Wrap up ADW Talk #3 — Data x Fashion

Source: Deep Learning on Medium

Wrap up ADW Talk #3 — Data x Fashion

Le Head of Data Science d’Heuritech nous a présenté le business model et les méthodes utilisées par la start-up pour prédire les tendances mode de demain. Jean Liénard nous a aussi donné ses tips pour entretenir un état d’esprit créatif quand on est data scientist.

Jean Liénard, Head of Data Science d’Heuritech

Aujourd’hui, trois achats sur quatre sont influencés par les réseaux sociaux (source FrenchWeb), notamment dans le monde de la fashion. Et si l’industrie de la mode et du luxe se porte bien en ligne et IRL, elle est devenue ultra concurrentielle et pointée du doigt pour le gâchis qu’elle génère.

Dans un contexte d’accélération des cycles de développement de produits avec une latence toujours forte, comprendre et anticiper ce qui va plaire dans un futur plus ou moins proche permet de limiter la casse :

  • En termes de manque à gagner : attention aux produits trop désirés dont les stocks ne suivent pas
  • En termes de gaspillage : des ventes trop faibles entraînent un surstockage qui mène droit à de la destruction

Le pari réussi d’Heuritech depuis sa création il y a 6 ans ? S’appuyer sur une technologie d’intelligence artificielle in-house pour aider les marques à mieux produire en faisant émerger signaux faibles et courbes de tendances à partir de l’analyse des contenus des images postées sur Instagram et Weibo. Au quotidien, ça donne 3 millions d’images analysées sur un nombre de détails allant jusqu’à 2 000 (motifs, formes, produits…) Jean Liénard, le Head of Data Science de la jeune pousse, a partagé avec nous ce qui se passe en coulisses…

1. Prédire les tendances : quelles approches ?

👉 Comment partir des images pour arriver à de la data ?

D’abord un point sur le cadre conceptuel : les tendances se fondent sur des vagues successives de personnes aux profils différents qui portent la mode. On passe des fashionistas, qui créent des looks de niche uniques, aux influenceurs, qui jouent le rôle de caisse de résonance et démocratisent les tenues ou les pièces, avant d’atteindre le marché de masse.

L’analyse des images postées sur les réseaux sociaux permet de capturer le cycle de vie d’une tendance dans son intégralité. A l’instar d’un institut de sondage, les données sont prélevées sur un échantillon non biaisé de la population. Des graphes sont utilisés pour choisir les influenceurs, parfois également repérés par des équipes expertes.

Les algorithmes de deep learning d’Heuritech vont à la fois décrire les caractéristiques de l’image et associer des régions de celle-ci à des labels. Un réseau de neurones vient segmenter l’image par région d’intérêt, puis utilise un module par géométrie d’objet (exemple pour un sac : forme et texture) et par marque.

La qualité du jeu de données est essentielle, il doit être extensif et exhaustivement labellisé. Pour faire face à la pénurie de dataset, Heuritech une méthodologie de fusion de datasets qui permet d’unifier des jeux de données contenant images très qualifiées, sectorielles, et d’autres plus représentatives des photos postées sur les réseaux sociaux (https://arxiv.org/abs/1812.02611).

Source Heuritech

👉 Comment les images labellisées peuvent aider à prédire les tendances ?

Pour basculer des données brutes aux prédictions, Heuritech a recours à des méthodes innovantes et hybrides, inspirées des tests de séries temporelles rupturistes de la compétition M4 de 2018.

Deux d’entre elles sont employées par la start-up aujourd’hui :

  • Un modèle mixte de lissage exponentiel et de réseau deep learning
  • FFORMA, une base d’ensembling qui comprend des points de mixage experts sur la base des caractéristiques des séries temporelles

Grâce au modèle hybride, la prédiction peut être reconstruite en pratiquant le lissage exponentiel de la time series et en procédant à une succession de couches LSTM. Pour pouvoir prédire le futur d’une série temporelle, tout le contexte est nécessaire (quels profils : fashionistas ou influenceurs ?), afin d’intégrer les signaux faibles et d’être en mesure de de comparer influenceurs et masse.

Il est illusoire de vouloir faire disparaître tout le bruit autour des données. Alors pour corriger les erreurs, la stratégie est d’augmenter la taille des panels. Finalement, plutôt que de contrôler les données captées, il vaut mieux capter plus de signaux, sans chercher à les contrôler. Cela afin de capitaliser sur un des grands avantages de l’approche deep-learning : intégrer un grand nombre de signaux prédictifs pour améliorer le modèle, même lorsque les liens individuels de chaque signal faible avec la variable d’intérêt est limité.

2. Rester créatif quand on est data scientist : quelles astuces ?

Le métier de data scientist fait briller les yeux de plus en plus de monde. Pour ces passionnés qui ont soif d’apprendre et de concevoir, comment ne pas perdre en inventivité au fil des projets qui s’enchaînent ? C’est simple, chez Heuritech, tous les jeudis, c’est « exploration day ». Chacun choisit un projet sur lequel il veut travailler, en lien avec les données ou les algorithmes de la start-up. Pas d’autres règles que la liberté et l’envie.

Trois enjeux se cachent derrière cette invitation à la créativité débridée :

  • Revisiter le jeu de données existant, le manipuler et en sortir des analyses inédites, utiles pour le secteur et pour l’interne
  • Faire monter en compétences les membres de l’équipe, leur donner l’occasion d’acquérir de nouvelles méthodo, d’acquérir de nouvelles stacks techniques
  • Garder la motivation au plus haut !

Un exemple de dossier sorti tout droit des « exploration days » : les hashtags sont-ils pertinents pour récolter des données et prédire des tendances ?

A côté de ces journées spéciales idées, les salariés d’Heuritech en consacrent une par semaine au Lab, une initiative qui lie la mode et l’environnement dans une perspective durable.

Après la fashion, découverte de la food pour les ADW 🙂

Avec toutes ces infos délivrées en moins d’1h, on dit bravo à notre speaker Jean pour son sens du rythme, et merci à nos meetupers pour leur écoute active et participative. C’est tout ce qu’on aime ❤

Merci aussi à Fabernovel pour le lieu, estampillé grève-proof avec la ligne 14 à quelques pas !

On se retrouve en début d’année prochaine avec un nouvel invité. D’ailleurs, si tu veux prendre la parole, tu nous dis ?

hello@anonymous-data-workers.org

D’ici là, on reste en contact ici

💌 Newsletter

👋 Meetup

👔 Linkedin

👍 Facebook

L’équipe ADW