Liste de Mots BIP39 : Les 10 Langues Officielles Expliquees (2026)
Table des matières
Lorsque vous creez un portefeuille de cryptomonnaies, les 12 ou 24 mots que vous notez ne sont pas tires d'un dictionnaire quelconque. Ils proviennent d'une liste de mots soigneusement elaboree definie par le standard BIP39. La plupart des gens rencontrent la liste anglaise --- 2 048 mots de "abandon" a "zoo" --- mais la specification definit en realite des listes de mots dans 10 langues. Chaque liste a ete concue avec les memes contraintes : exactement 2 048 mots, aucune ambiguite, et une structure qui minimise les erreurs de transcription.
Ce guide couvre chaque liste officielle de mots BIP39, explique les principes de conception derriere chacune, et discute les implications critiques de compatibilite liees au choix d'une liste non anglaise.
Pourquoi 10 Langues ?¶
Le BIP39 a ete concu pour rendre les sauvegardes de cryptomonnaies accessibles a un public mondial. La specification originale (publiee en 2013) n'incluait que l'anglais, mais des contributeurs du monde entier ont propose des listes de mots supplementaires dans les annees suivantes. L'objectif etait de permettre aux locuteurs natifs de langues majeures de noter des seed phrases en utilisant des mots qu'ils pouvaient facilement reconnaitre, epeler et verifier.
Chaque liste de mots doit satisfaire les memes contraintes fondamentales :
- Exactement 2 048 mots. C'est non negociable. Chaque mot represente 11 bits de donnees (2^11 = 2 048), et les mathematiques de la conversion entropie-vers-mnemonique dependent de ce nombre exact.
- Les 4 premiers caracteres de chaque mot doivent etre uniques. Cela permet aux utilisateurs (et aux portefeuilles materiels avec de petits ecrans) d'identifier n'importe quel mot a partir de ses quatre premiers caracteres seulement.
- Les mots doivent etre courants et facilement reconnaissables. Un vocabulaire obscur augmente le risque d'erreurs de transcription.
- Les mots visuellement et phonetiquement similaires doivent etre evites. "Woman" et "women" seraient une mauvaise paire. De meme que "accept" et "except".
Ces contraintes sont plus difficiles a satisfaire dans certaines langues que d'autres, c'est pourquoi certaines listes ont mis des annees a etre finalisees tandis que d'autres ont ete adoptees rapidement.
Les 10 listes officielles de mots BIP39 sont : Anglais, Japonais, Coreen, Chinois Simplifie, Chinois Traditionnel, Espagnol, Francais, Italien, Tcheque et Portugais.
Anglais : Le Standard Universel¶
La liste de mots en anglais est le standard de facto. Pratiquement tous les portefeuilles --- materiels, logiciels et web --- la prennent en charge. Si vous utilisez Bitcoin, Ethereum, Solana ou toute autre chaine compatible BIP39, la liste anglaise est celle que votre portefeuille utilisera sauf si vous en selectionnez explicitement une autre.
Proprietes de Conception¶
- 2 048 mots de "abandon" a "zoo".
- Aucun mot de moins de 3 caracteres. Les mots les plus courts sont "add", "age", "ago", "aim", "air" et des termes courants similaires.
- Les 4 premiers caracteres sont uniques. "Abou" identifie de maniere unique "about". "Abso" identifie de maniere unique "absorb". C'est pourquoi certains portefeuilles materiels ne demandent que les quatre premieres lettres.
- Pas d'homophones ou quasi-homophones. Des mots comme "know" et "no", ou "their" et "there", sont exclus.
- Tri alphabetique. La recherche binaire dans la liste est triviale.
Le large support de la liste anglaise en fait le choix le plus sur pour le stockage a long terme. Si vous devez recuperer votre portefeuille dans 10 ans avec un logiciel qui n'existe pas encore, la liste de mots anglaise sera tres probablement prise en charge. Pour une explication technique complete de la facon dont ces mots encodent votre entropie, consultez BIP39 Explique.
Listes CJK : Japonais, Coreen, Chinois¶
Les listes de mots CJK (Chinois, Japonais, Coreen) presentent des defis et des opportunites uniques. Ces langues utilisent des ecritures logographiques ou syllabiques plutot que l'alphabet latin, ce qui modifie fondamentalement les contraintes de conception.
Japonais¶
La liste de mots en japonais utilise exclusivement des caracteres hiragana. Chaque mot est un terme japonais courant ecrit en syllabaire hiragana, le rendant lisible sans connaissance des kanji.
- Ecriture : Hiragana uniquement (pas de katakana, pas de kanji).
- Separateur : La specification recommande des espaces ideographiques (U+3000) plutot que des espaces ASCII standards entre les mots. C'est une source courante de bugs d'implementation.
- Unicite : Chaque mot est unique dans ses 4 premiers caracteres hiragana. Comme chaque caractere hiragana encode plus d'information qu'une lettre latine, cette contrainte est plus facile a satisfaire.
La liste japonaise a ete l'une des premieres listes non anglaises proposees et beneficie d'un support relativement large, notamment parmi les exchanges et applications de portefeuille japonais.
Coreen¶
La liste de mots en coreen utilise le hangul --- le systeme d'ecriture phonetique coreen. Chaque mot est un mot coreen courant ecrit entierement en hangul.
- Ecriture : Hangul uniquement.
- Proprietes des caracteres : Les caracteres hangul coreens sont composes de jamo (consonnes et voyelles) arranges en blocs syllabiques. La distinction visuelle de ces blocs aide a reduire les erreurs de transcription.
- Selection des mots : Les mots courants du quotidien ont ete preferes. La liste evite les emprunts sino-coreens qui pourraient etre peu familiers aux jeunes locuteurs.
Le support des portefeuilles pour le coreen est plus limite que pour l'anglais ou le japonais. Si vous choisissez d'utiliser la liste de mots coreenne, verifiez que votre logiciel de portefeuille prefere la prend explicitement en charge avant de generer une seed phrase.
Chinois Simplifie et Chinois Traditionnel¶
Le BIP39 definit deux listes de mots chinoises separees : une pour le Chinois Simplifie (utilise en Chine continentale, a Singapour et en Malaisie) et une pour le Chinois Traditionnel (utilise a Taiwan, Hong Kong et Macao).
- Ecriture : Chaque liste utilise exclusivement son jeu de caracteres respectif.
- Nombre de caracteres : Les caracteres chinois encodent plus d'information par caractere que les lettres latines. Chaque mot dans les listes chinoises fait typiquement 1 a 2 caracteres, rendant la seed phrase visuellement plus compacte.
- Chevauchement : Certains mots apparaissent dans les deux listes avec des significations identiques. D'autres existent dans l'une mais pas dans l'autre, refletant la divergence naturelle entre les jeux de caracteres simplifies et traditionnels.
- Contrainte d'unicite : La regle des 4 premiers caracteres s'applique differemment ici car de nombreux mots ne font que 1 a 2 caracteres. La specification exige qu'aucun mot d'un seul caractere ne partage le meme premier caractere.
Les listes chinoises sont bien prises en charge dans les portefeuilles populaires des regions sinophones mais peuvent ne pas etre disponibles dans les logiciels de portefeuille occidentaux.
Langues Europeennes : Espagnol, Francais, Italien, Tcheque, Portugais¶
Cinq langues europeennes completent les listes officielles de mots BIP39. Chacune utilise l'alphabet latin avec des signes diacritiques specifiques a la langue (accents, tildes, cedilles).
Espagnol¶
La liste de mots en espagnol inclut du vocabulaire espagnol courant, avec les signes diacritiques inclus comme partie du mot. Par exemple, les mots avec des accents aigus sont des entrees distinctes. Les implementations de portefeuilles doivent gerer correctement l'Unicode pour eviter de traiter les caracteres accentues comme leurs equivalents non accentues.
- Diacritiques : Les caracteres accentues (a, e, i, o, u) sont inclus et significatifs.
- Neutralite regionale : La liste evite les mots specifiques a un seul pays hispanophone. "Computadora" (Amerique latine) et "ordenador" (Espagne) pourraient tous deux etre evites au profit d'une alternative universellement comprise.
Francais¶
La liste de mots en francais suit des principes similaires a la liste espagnole, avec une attention aux caracteres accentues.
- Diacritiques : Entierement significatifs. "Resume" et "resume" avec accent sont des chaines differentes.
- Ligatures : La liste evite des caracteres comme ae et oe qui pourraient ne pas s'afficher de maniere coherente d'un systeme a l'autre.
Italien¶
La liste italienne est relativement simple parmi les listes europeennes. L'italien utilise moins de signes diacritiques que le francais ou l'espagnol, et le pool de vocabulaire est assez grand pour trouver 2 048 mots non ambigus sans difficulte.
Tcheque¶
La liste de mots en tcheque est notable car le tcheque utilise un ensemble etendu de signes diacritiques : haceks (caron), carons et accents aigus. Des caracteres comme c, r, z, s et d'autres sont consideres comme distincts de leurs formes de base.
- Diacritiques : Essentiels et structurels. Supprimer les diacritiques creerait de l'ambiguite.
- Risque d'implementation : Un logiciel qui normalise l'Unicode de maniere aggressive (en supprimant les accents, en convertissant en ASCII) corrompra les seed phrases en tcheque. C'est le plus grand risque avec les listes de mots non anglaises.
Portugais¶
La liste en portugais est l'ajout le plus recent a la specification officielle BIP39. Elle utilise des signes diacritiques courants en portugais (tildes, accents aigus, accents circonflexes) et tente d'etre neutre entre le portugais bresilien et europeen.
Impact sur la Compatibilite : Restez sur Une Seule Langue¶
C'est la conclusion pratique la plus importante de tout ce guide : votre choix de liste de mots est un engagement permanent. Une seed phrase generee avec la liste de mots japonaise ne peut pas etre recuperee en utilisant la liste de mots anglaise. Les mots ne sont pas des traductions les uns des autres --- ce sont des mappages entierement differents de la meme entropie binaire vers des sequences de mots differentes.
Le Mappage est Specifique a la Langue¶
Lorsque votre portefeuille genere une seed phrase, il prend 128 ou 256 bits d'entropie, calcule un checksum, divise le resultat en segments de 11 bits, et recherche chaque segment dans la liste de mots. L'index 0 dans la liste anglaise est "abandon". L'index 0 dans la liste japonaise est un mot completement different. Les donnees binaires sont les memes ; la representation lisible est differente.
Cela signifie :
- Vous ne pouvez pas melanger des mots de listes differentes.
- Vous ne pouvez pas "traduire" une seed phrase en cherchant l'index de chaque mot et en trouvant le mot correspondant dans une autre langue.
- En realite, vous pouvez effectuer cette traduction mecaniquement (chercher l'index de chaque mot anglais, puis trouver le mot au meme index dans la liste japonaise), et le resultat sera une seed phrase valide en japonais qui derive le meme portefeuille. Mais aucun logiciel de portefeuille standard ne propose cette fonctionnalite, et le faire manuellement est source d'erreurs.
Le Support des Portefeuilles n'est pas Universel¶
Alors que l'anglais est pris en charge par tous les portefeuilles compatibles BIP39, les listes non anglaises ont des niveaux de support variables :
| Langue | Niveau de Support |
|---|---|
| Anglais | Universel |
| Japonais | Large (portefeuilles majeurs) |
| Chinois Simplifie | Modere (portefeuilles region CJK) |
| Chinois Traditionnel | Modere (portefeuilles region CJK) |
| Coreen | Limite |
| Espagnol | Modere |
| Francais | Modere |
| Italien | Limite a Modere |
| Tcheque | Limite |
| Portugais | Limite |
Si vous generez une seed phrase avec la liste de mots en tcheque et devez la recuperer 5 ans plus tard sur un portefeuille materiel qui ne prend en charge que l'anglais, vous serez bloque. La seule solution est de trouver un logiciel qui prend en charge le BIP39 en tcheque, recuperer le portefeuille et transferer les fonds vers un nouveau portefeuille genere avec la liste anglaise.
Normalisation Unicode¶
Les listes de mots non anglaises introduisent la normalisation Unicode comme un point de defaillance potentiel. La specification BIP39 exige la normalisation NFKD (Normalization Form Compatibility Decomposition) avant que le mnemonique ne soit alimente dans PBKDF2. C'est particulierement pertinent pour :
- Espaces ideographiques (japonais) : Le caractere d'espace entre les mots japonais devrait etre U+3000, pas l'espace ASCII (U+0020). Certains portefeuilles utilisent l'un, d'autres l'autre. Si l'etape de normalisation gere cela incorrectement, la graine derivee sera differente.
- Caracteres accentues (francais, espagnol, tcheque, portugais) : Un caractere comme "e" avec accent peut etre represente comme un seul codepoint Unicode ou comme "e" + accent aigu combinant. La normalisation NFKD est censee resoudre cela, mais des implementations buguees existent.
- Variantes de caracteres chinois : Certains caracteres chinois ont plusieurs representations Unicode. La liste de mots utilise des formes canoniques, mais l'entree utilisateur peut utiliser des formes variantes.
Ces problemes sont rares, mais lorsqu'ils surviennent, ils sont catastrophiques. Votre seed phrase semble correcte, mais elle derive un portefeuille different a cause d'une difference Unicode invisible.
La Recommandation¶
Sauf si vous avez une raison imperative d'utiliser une liste de mots non anglaise, utilisez l'anglais. Il beneficie d'un support universel des portefeuilles, sans complications de signes diacritiques et sans pieges de normalisation Unicode. La liste de mots anglaise a ete eprouvee sur des millions de portefeuilles depuis plus d'une decennie.
Si vous choisissez une liste non anglaise, documentez quelle liste vous avez utilisee avec votre sauvegarde de seed phrase. Conservez une copie de la liste de mots elle-meme (les 2 048 mots) avec votre sauvegarde. Et testez la recuperation sur au moins deux portefeuilles differents avant de confier des fonds importants a cette configuration.
Recherche de Mots BIP39 sur SafeSeed¶
Les generateurs de seed phrases de SafeSeed --- pour Bitcoin, Ethereum et Solana --- utilisent la liste de mots BIP39 en anglais par defaut, garantissant une compatibilite maximale entre les portefeuilles et les appareils materiels.
Les outils affichent chaque mot genere avec son index dans la liste de mots BIP39 (0 a 2 047). Cette transparence vous permet de verifier que le mappage mot-index est correct et de le croiser avec la liste officielle de mots BIP39 en anglais publiee dans le depot BIP de Bitcoin.
Toute la generation se fait entierement dans votre navigateur en utilisant la Web Crypto API pour l'obtention de l'entropie. Aucune recherche de liste de mots, aucune donnee de graine et aucune cle privee ne quittent jamais votre appareil. Vous pouvez vous deconnecter d'Internet avant de generer et travailler en isolation complete. Pour mieux comprendre pourquoi cela est important, consultez Securite des Generateurs de Seed en Ligne.
Le systeme de listes de mots BIP39 est l'un des composants les plus soigneusement concus de la pile cryptomonnaie. Il transforme l'entropie binaire brute en quelque chose qu'un humain peut ecrire sur un morceau de papier, relire sans erreur, et utiliser pour recuperer un portefeuille des annees plus tard sur du materiel qui n'a pas encore ete invente. La disponibilite de 10 options linguistiques rend ce systeme accessible dans le monde entier. Mais cette accessibilite s'accompagne d'une responsabilite : choisissez votre langue deliberement, comprenez les implications de compatibilite, et alignez votre strategie de sauvegarde avec l'ecosysteme de portefeuilles sur lequel vous comptez.