Contribution Open-Source
Développé par Quinten en 2022, AliBERT est un modèle spécialisé dans le langage biomédical français. Une version a été mise à disposition en open-source sur la plateforme Huggingface, constituant ainsi une contribution majeure au domaine du traitement naturel du langage (NLP) dans le secteur de la santé. Cette démarche d’accès libre favorise une culture d’innovation et de collaboration au sein de la communauté de recherche mondiale, pour mieux répondre aux besoins des professionnels de la santé et des chercheurs.
Applications principales d’AliBERT
AliBERT affiche des performances de pointe dans plusieurs domaines clés, notamment :
- Extraction de concepts biomédicaux : pour soutenir la recherche et la pratique clinique, en particulier en oncologie.
- Détection des dosages médicamenteux : pour garantir une prise en charge précise des patients.
- Pseudonymisation des rapports patients : pour préserver la confidentialité.
- Codification des termes biomédicaux (CIM-10) : pour simplifier l’organisation des dossiers médicaux et en faciliter l’accès et l’analyse.
La reconnaissance des contributions d’AliBERT au domaine biomédical a été renforcée par une publication lors de la conférence de l’Association for Computational Linguistics (ACL) en 2023, mettant en lumière ses applications innovantes et son impact.
Développement et amélioration continus
Entre-temps, le DataLab de Quinten se consacre au développement et à la diversification continus de l’écosystème du modèle AliBERT. Cet engagement en faveur de l’amélioration continue vise non seulement à augmenter les fonctionnalités d’AliBERT et à découvrir de nouvelles applications dans le domaine de la santé, mais aussi à garantir l’accès aux versions les plus sophistiquées d’AliBERT, spécialement affinées pour des usages avancés. En améliorant sans cesse AliBERT, nous assurons son statut de solution de NLP de pointe, répondant avec précision aux exigences complexes du traitement du langage biomédical français.