Dans la suite de mes explorations du corpus de discours officiels du site vie-publique, je me suis intéressé au glissement de lexique entre "immigré" et "migrant". Si la distinction est claire dans l'absolu, entre le processus (migrer/migrant) et l'état (immigré), elle l'est moins dans le contexte des discours politiques pour lesquels l'immigration est essentiellement considérée … Lire la suite Migrants ou immigrés ?
Analyser automatiquement les discours politiques, première étape
J'avais présenté, dans un précédent article, le site vie-publique.fr et la façon d'en collecter le contenu. J'ai depuis continué à le collecter de façon régulière, il se déverse toutes les nuits dans un index ElasticSearch et je commence à "scraper" des sites politiques ou de news. Il est temps maintenant de voir ce que l'on … Lire la suite Analyser automatiquement les discours politiques, première étape
Doit-on dire Le ou La COVID ?
Pas de question, tout le monde dit "le covid", sauf l'Académie Française, suivie par quelques ministres qui l'emploient au féminin. Ce féminin va-t-il s'installer dans la parole officielle ? Premier cas d'usage de l'analyse des discours gouvernementaux. Revenons sur un peu d'histoire récente: le 11 Février 2020, l'OMS décide de donner un nom explicite à … Lire la suite Doit-on dire Le ou La COVID ?
Scraper les discours politiques
Scraper, ça veut dire, en bon français, "extraire le contenu d'une page web ou d'un site", sachant qu'on ne désire pas tout collecter, mais seulement le contenu intéressant. Et qu'on s'intéresse plutôt à un site qu'à une seule page (sinon autant le faire à la main). Pourquoi scraper un contenu ? Pour l'analyser, en extraire … Lire la suite Scraper les discours politiques
Les ordinateurs peuvent-ils tricher ?
Ça semble racoleur, comme titre, mais c'est une question que j'ai récemment entendue, à la télévision le 17 Mars, dans une émission sérieuse, C Politique sur France 5, d'autant plus sérieuse que Michel Serres en était l'invité. Le sujet portait essentiellement sur le Grand Débat (on me pardonnera cette monomanie que j'espère passagère). La discussion … Lire la suite Les ordinateurs peuvent-ils tricher ?
Le Grand Débat, la suite
Mon ami Alain Garnier a eu la gentillesse de me mentionner dans son billet video hebdomadaire. Il a même érigé mon précédent billet sur l'analyse automatique du grand débat en "polémique". Je suis plutôt flatté de ce qualificatif, à vrai dire, même si je ne faisais que poser les limites de l'analyse automatique, comme je … Lire la suite Le Grand Débat, la suite
Le Grand Débat ou le syndrome du réverbère
EDIT du 24/2/2019: précisions sur le processus mis en oeuvre par Qwam et ajout des initiatives de myriadisation. Je suis depuis un moment à l'affut des informations sur le Grand Débat. Qu'il s'agisse du site internet ou des contributions fournies par tous les rapporteurs de grands débats locaux, médiatisés ou non, tout cela forme un … Lire la suite Le Grand Débat ou le syndrome du réverbère
NLP… ça a à voir avec la langue ?
Voici quelques semaines, j'intervenais en cours de M1 de Linguistique Informatique, pour présenter ma marotte (qui plaît beaucoup aux universitaires), à savoir les aspects industriels du Traitement Automatique des Langues. J'ai donc fait un exposé sur les applications métier de la génération automatique de textes. La professeure m'a proposé de rester pour la suite de … Lire la suite NLP… ça a à voir avec la langue ?
TAL et Deep-Learning
Vered Schwarz vient de publier un excellent post sur son blog (dont je vous recommande la lecture en général) à propos du deep-learning utilisé dans le TAL. Après une longue et didactique présentation des diverses techniques de DL et des utilisations, elle en vient aux soucis que pose cette approche (malgré l'insolente efficacité de ces … Lire la suite TAL et Deep-Learning
Le lego des algorithmes
J'ai eu à produire voilà quelque temps une (seconde) expertise pour un papier de recherche proposé à une conférence internationale sur le Traitement Automatique des Langues. Son contenu, très semblable à bien d'autres, m'a paru très typique de la tendance actuelle autour de l'IA, du deep-learning et autres mots à la mode. Et aussi très … Lire la suite Le lego des algorithmes