Vers un modèle de
langage dédié aux
applications fiscales

La recherche ouverte sur le traitement automatique du langage naturel
dédiée à la matière fiscale.

MacBook Mockup
Screenshot

Cabinets d'avocats, directions fiscales ou PME, les modèles de langage pourront, demain, simplifier la rédaction de documents juridiques, la création de modèles de simulation fiscale et la recherche documentaire afin de se concentrer sur des aspects plus stratégiques de leur travail.

Contact

Une recherche
soutenue par
Microsoft for Startups

Ce projet est réalisé à l'aide de ressources matérielles fournies par le programme Microsoft for Startups et ses partenaires tels que MongoDB, Azure OpenAI Service ou LinkedIn, afin de soutenir la recherche en fiscalité française.

Partenaires de confiance Lemone
  • Parameter-Efficient Fine-Tuning (PEFT)

    Réduction considérableles besoins de stockage pour les grands modèles de langage adaptés à des tâches spécifiques et transition efficace entre les tâches lors du déploiement, le tout sans introduire de latence lors de l'inférence.

  • Quantification sur 8 bits

    La quantification sur 8 bits permet aux modèles à l'échelle de plusieurs milliards de paramètres de s'adapter à des matériaux plus compacts sans dégrader les performances.

  • L'extraction d'information, plus performante que jamais

    Fondée sur Docutron ToolKit 2, l'analyse de documents juridiques n'a jamais été aussi précise. Peu important les formats soumis pour extraction.

  • Vers un modèle pour les fiscalistes, par les fiscalistes

    Nous pensons que les outils métiers ne peuvent provenir que d'acteurs implantés sur le secteurs.

Open source et
démocratisation
des données

L'ia générative a le potentiel pour révolutionner la fiscalité, mais cette opportunité ne doit pas être laissée aux mains de modèles clos. Lemone publie des bases de données fiscales sur Hugging Face à destination des producteurs de modèles.

  • Code général des impôts et livre des procédures fiscales

    Afin de rendre le droit disponible est intégrable, Lemone publie une base de données pour les codes fiscaux à jour de décembre 2023.

  • Premier producteur d'une base de données d'instructions sur la directive DAC6

    Constituée de 414 instructions diverses sur le contenu de la norme, ce projet vise à fournir un jeu d'entrainement pour le développement des futurs modèles de langage fiscaux.

  • mBERT adapté pour la pratique fiscale

    Distributeur d'une version entrainée de BERT sur le Code général des Impôts, le livre des procédures fiscales et le Codes des douanes.

Avec le soutien
de Google Cloud
for IA startups

Lemone bénéficie des infrastructures de la Google Cloud Platform pour ses projets de recherche en intelligence artificielle, afin de tirer parti de l'une des meilleures puissances de calcul disponibles sur le marché.

Une recherche conduite par Louis Brulé Naudet

Diplômé du Master 2 Fiscalité de l'Entreprise (parcours 221) de l'Université Dauphine-PSL.

Spécialisation dans la conception d'interfaces de programmation dédiées au Machine Learning, l'informatique appliquée à la fiscalité, la conception d’architectures itératives pour la production de documents complexes, le pré-traitement multimodal, la similarité par indices composés et l'intelligence artificielle générative.

Ordinateur de présentation Lemone