Bienvenue sur gdn.Witted.tech

Vous êtes sur une plate-forme d'analyse automatique des contributions au Grand Débat National, développée et mise à disposition de façon gratuite et indépendante par Witted.tech.

Afin de pouvoir l'utiliser, veuillez activer javascript puis recharger cette page.

De quoi s'agit-il ?

Les questionnaires du Grand Débat National ont permis de récolter des contributions numériques sur quatre grands thèmes. Il s'agit principalement de questions ouvertes donnant lieu à des réponses en texte libre. Celles-ci se comptant par millions c'est un vériable enjeu que de les analyser, que ce soit automatiquement ou manuellement.

La présente plate-forme donne accès aux résultats d'une analyse 100% automatique de ces contributions.

Méthodologie

En bref, notre analyse consiste à extraire des contributions les concepts les plus représentatifs. Les concepts sont élaborés automatiquement à partir de l'ensemble des termes extraits des verbatims.

Chaque concept est formé par un ensemble de termes sémantiquement proches. Par exemple, les termes suivants seront automatiquement rapprochés comme équivalents, et regroupés en un seul et même concept :

Sur cette base, différentes analyses sont proposées de façon à naviguer dans les concepts, les mots-clefs, le verbatims, les caractéristiques de contributeurs, etc.

Comment les concepts / termes / mots-clefs sont-ils choisis ?

Aucun élément de vocabulaire n'a été fixé a priori, et il n'y a strictement aucune manipulation manuelle. Tout est généré automatiquement à partir des textes.

Plus généralement, aucune connaissance a priori n'a été introduite dans le système : les rapprochements sémantiques sont uniquement basés sur des algorithmes d'intelligence artificielle qui apprennent automatiquement à partir des contributions elles-mêmes. Ces algorithmes disposent seulement de quelques règles, en l'occurrence ultra-minimales, sur le fonctionnement général de la langue, mais aucune sur les sujets ou les thèmes particulièrement abordés dans les données. Nous avons volontairement laissé de côté une grande partie de nos algorithmes qui, bien qu'ils apportent une plus grande finesse dans les résultats, risquent d'introduire involontairement des effets indésirables en termes de transparence.

Cette approche garantit qu'aucun bais n'est introduit dans l'analyse, et que les concepts extraits ne traduisent rien d'autre que ce qui est inscrit dans les contributions.

Qui sommes nous, et pourquoi cette plate-forme ?

Witted.tech est une initiative privée spécialisée dans l'intelligence artificielle (ou "AI") et plus particulièrement dans le traitement du langage naturel (ou "NLP"). Elle est totalement indépendante et n'a strictement aucun lien avec des instances étatiques, des partis politiques, les organisateurs du Grand Débat, ni aucune autre structure privée ou publique.

Le présent site est une application particulière de la technologie Witted, et ne représente bien-sûr pas la totalité de ses possibilités. Sans être spécialistes des "civic-techs", il nous a juste paru intéressant d'apporter une contribution à ce sujet bouillonnant. Nous avons réalisé ce travail de notre propre initiative, et sans aucune demande ni soutien extérieur d'aucune sorte, avec les motivations suivantes :

D'où proviennent les données analysées ?

Les données numériques recueillies dans le cadre du Grand Débat sont publiquement et grauitement disponibles sur la page Open Data du site consacré.

Ce sont ces données que nous avons utilisées, en récupérant les fichiers JSON disponibles pour chaque thématique. Aucune autre donnée n'a été insérée dans le système.

Quels algorithmes ont été utilisés ?

La plate-forme logicielle de Witted.tech implémente des algorithmes d'apprentissage automatique et de traitement du langage naturel. Cette plate-forme a été utilisée pour cette application sans modification ni orientation particulière (à l'exclusion bien-sûr de la présente restitution des données).

Certains de ces algorithmes basés sur l'état de l'art actuel du domaine, d'autres sont totalement originaux.

Dans le cadre de cette application nous nous sommes volontairement limités à des algorithmes d'apprentissage endogènes et non supervisés, afin de n'injecter aucune connaissance a priori qui serait de nature à biaiser les résultats. Quelques connaissances générales sur la langue à traiter (en l'occurrence le français), principalement d'ordre morpho-syntaxique, sont bien-sûr utilisées.

N'hésitez pas à nous contacter (cf. ci-dessous) si vous souhaitez avoir plus d'informations sur notre technologie et la méthodologie employée pour cette étude.

Puis-je obtenir plus de données ? Puis-je les exploiter ?

En tant que telles, les données brutes du Grand Débat sont disponibles à tous (cf. ci-dessus).

L'exploitation des données extraites par Witted.tech est soumise à un accord préalable. Merci de nous contacter pour obtenir plus de détails (cf. ci-dessous). La présente plate-forme ne présente qu'une partie des données extraites et nous nous tenons à votre disposition si vous souhaitez en obtenir plus, ou si vous êtes intéressées par des analyses spécifiques.