Список слов BIP39: все 10 языков с пояснениями (2026)
Содержание
Когда вы создаёте криптовалютный кошелёк, 12 или 24 слова, которые вы записываете, берутся не из произвольного словаря. Они взяты из тщательно составленного списка слов, определённого стандартом BIP39. Большинство людей сталкиваются с английским списком --- 2 048 слов от "abandon" до "zoo" --- но спецификация определяет списки на 10 языках. Каждый список создан с одинаковыми ограничениями: ровно 2 048 слов, отсутствие неоднозначности и структура, минимизирующая ошибки при записи.
Это руководство охватывает каждый официальный список слов BIP39, объясняет принципы проектирования каждого из них и обсуждает важнейшие последствия для совместимости при выборе неанглийского списка.
Почему 10 языков?¶
BIP39 был разработан, чтобы сделать резервные копии криптовалют доступными для мировой аудитории. Первоначальная спецификация (опубликованная в 2013 году) включала только английский, но участники со всего мира предлагали дополнительные списки слов в последующие годы. Цель состояла в том, чтобы носители основных языков могли записывать seed-фразы словами, которые они легко узнают, могут правильно записать и проверить.
Каждый список слов должен соответствовать одним и тем же основным требованиям:
- Ровно 2 048 слов. Это не обсуждается. Каждое слово представляет 11 бит данных (2^11 = 2 048), и математика преобразования энтропии в мнемонику зависит от этого точного числа.
- Первые 4 символа каждого слова должны быть уникальными. Это позволяет пользователям (и аппаратным кошелькам с маленькими экранами) идентифицировать любое слово по первым четырём символам.
- Слова должны быть распространёнными и легко узнаваемыми. Редкая лексика увеличивает вероятность ошибок при записи.
- Визуально и фонетически похожие слова должны быть исключены. "Woman" и "women" --- плохая пара. Как и "accept" и "except."
Эти ограничения в одних языках выполнить сложнее, чем в других, поэтому некоторые списки разрабатывались годами, тогда как другие были приняты быстро.
10 официальных списков слов BIP39: Английский, Японский, Корейский, Китайский упрощённый, Китайский традиционный, Испанский, Французский, Итальянский, Чешский и Португальский.
Английский: универсальный стандарт¶
Английский список слов является стандартом де-факто. Практически каждый кошелёк --- аппаратный, программный и веб-кошелёк --- его поддерживает. Если вы используете Bitcoin, Ethereum, Solana или любую другую BIP39-совместимую сеть, ваш кошелёк будет использовать английский список, если вы явно не выберете другой.
Свойства дизайна¶
- 2 048 слов от "abandon" до "zoo."
- Нет слов короче 3 символов. Самые короткие слова --- "add," "age," "ago," "aim," "air" и подобные распространённые термины.
- Первые 4 символа уникальны. "Abou" однозначно определяет "about." "Abso" --- "absorb." Поэтому некоторые аппаратные кошельки требуют ввода только первых четырёх букв.
- Нет омофонов и квази-омофонов. Слова вроде "know" и "no" или "their" и "there" исключены.
- Алфавитная сортировка. Бинарный поиск по списку тривиален.
Широкая поддержка английского списка делает его самым безопасным выбором для долгосрочного хранения. Если вам потребуется восстановить кошелёк через 10 лет с помощью ПО, которого ещё не существует, английский список слов будет поддержан с подавляющей вероятностью. Полное техническое объяснение того, как слова кодируют энтропию, смотрите в статье BIP39 простым языком.
CJK-списки: японский, корейский, китайский¶
CJK-списки (китайский, японский, корейский) представляют уникальные трудности и возможности. Эти языки используют логографические или слоговые системы письма вместо латинского алфавита, что кардинально меняет проектные ограничения.
Японский¶
Японский список использует исключительно символы хирагана. Каждое слово --- распространённый японский термин, записанный хираганой, читаемый без знания кандзи.
- Письменность: Только хирагана (без катаканы, без кандзи).
- Разделитель: Спецификация рекомендует идеографические пробелы (U+3000) вместо стандартных ASCII-пробелов между словами. Это частая причина ошибок в реализациях.
- Уникальность: Каждое слово уникально по первым 4 символам хирагана. Поскольку каждый символ хирагана кодирует больше информации, чем латинская буква, это ограничение легче выполнить.
Японский список был одним из первых неанглийских списков и имеет относительно широкую поддержку кошельков, особенно среди японских бирж и приложений-кошельков.
Корейский¶
Корейский список использует хангыль --- корейскую фонетическую систему письма. Каждое слово --- распространённое корейское слово, полностью записанное хангылем.
- Письменность: Только хангыль.
- Свойства символов: Корейские символы хангыль состоят из чамо (согласных и гласных), организованных в слоговые блоки. Визуальная различимость этих блоков помогает снизить ошибки при записи.
- Выбор слов: Предпочтение отдано повседневным словам. Список избегает синокорейских заимствований, которые могут быть незнакомы молодым носителям языка.
Поддержка корейского списка кошельками более ограничена, чем английского или японского. Если вы хотите использовать корейский список, убедитесь, что ваше кошельковое ПО явно его поддерживает, прежде чем генерировать seed-фразу.
Китайский упрощённый и китайский традиционный¶
BIP39 определяет два отдельных китайских списка: для упрощённого китайского (используется в материковом Китае, Сингапуре и Малайзии) и для традиционного китайского (используется в Тайване, Гонконге и Макао).
- Письменность: Каждый список использует исключительно свой набор иероглифов.
- Количество символов: Китайские иероглифы кодируют больше информации на символ, чем латинские буквы. Каждое слово в китайских списках обычно содержит 1--2 символа, что делает seed-фразу визуально более компактной.
- Пересечение: Некоторые слова присутствуют в обоих списках с идентичным значением. Другие существуют только в одном, отражая естественное расхождение упрощённого и традиционного наборов иероглифов.
- Условие уникальности: Правило первых 4 символов применяется здесь иначе, так как многие слова состоят из 1--2 символов. Спецификация требует, чтобы два слова не имели одинакового первого символа среди односимвольных слов.
Китайские списки хорошо поддерживаются кошельками, популярными в китаеязычных регионах, но могут быть недоступны в западном кошельковом ПО.
Европейские языки: испанский, французский, итальянский, чешский, португальский¶
Пять европейских языков завершают список официальных списков слов BIP39. Каждый использует латинский алфавит с языковыми диакритическими знаками (акценты, тильды, седили).
Испанский¶
Испанский список включает распространённую испанскую лексику с диакритическими знаками как частью слова. Реализации кошельков должны корректно обрабатывать Unicode, чтобы не приравнивать акцентированные символы к их безударным аналогам.
- Диакритические знаки: Акцентированные гласные включены и значимы.
- Региональная нейтральность: Список избегает слов, специфичных для одной испаноязычной страны.
Французский¶
Французский список следует принципам, аналогичным испанскому, с учётом акцентированных символов.
- Диакритические знаки: Полностью значимы.
- Лигатуры: Список избегает символов, которые могут отображаться непоследовательно в разных системах.
Итальянский¶
Итальянский список относительно прост среди европейских. Итальянский использует меньше диакритических знаков, чем французский или испанский, и словарный запас достаточно велик, чтобы найти 2 048 недвусмысленных слов без затруднений.
Чешский¶
Чешский список примечателен тем, что чешский язык использует обширный набор диакритических знаков: гачеки (карон), акуты. Символы вроде c, r, z, s с диакритикой считаются отличными от их базовых форм.
- Диакритические знаки: Существенные и несущие нагрузку. Удаление диакритики создаст неоднозначность.
- Риск реализации: ПО, агрессивно нормализующее Unicode (удаление акцентов, преобразование в ASCII), повредит чешские seed-фразы. Это самый большой риск при использовании неанглийских списков.
Португальский¶
Португальский список --- самое позднее дополнение к официальной спецификации BIP39. Он использует характерные для португальского диакритические знаки (тильды, акуты, циркумфлексы) и стремится к нейтральности между бразильским и европейским португальским.
Влияние на совместимость: придерживайтесь одного языка¶
Это главный практический вывод всего руководства: выбор списка слов --- это постоянное обязательство. Seed-фразу, сгенерированную с японским списком, нельзя восстановить с помощью английского списка. Слова --- это не переводы друг друга, а совершенно разные отображения одной и той же двоичной энтропии в различные последовательности слов.
Отображение специфично для языка¶
Когда кошелёк генерирует seed-фразу, он берёт 128 или 256 бит энтропии, вычисляет контрольную сумму, делит результат на 11-битные сегменты и ищет каждый сегмент в списке слов. Слово с индексом 0 в английском списке --- "abandon." Слово с индексом 0 в японском списке --- совершенно другое. Двоичные данные одинаковы; человекочитаемое представление различается.
Это означает:
- Нельзя смешивать слова из разных списков.
- Нельзя «перевести» seed-фразу, просто найдя индекс каждого слова и подставив соответствующее слово из другого языка.
- На самом деле это механически возможно (найти индекс каждого английского слова, затем взять слово с тем же индексом из японского списка), и результат будет валидной японской seed-фразой, порождающей тот же кошелёк. Но ни одно стандартное кошельковое ПО не предоставляет такой функции, а ручная процедура чревата ошибками.
Поддержка кошельков не универсальна¶
В то время как английский поддерживается каждым BIP39-совместимым кошельком, неанглийские списки имеют разный уровень поддержки:
| Язык | Уровень поддержки |
|---|---|
| Английский | Универсальный |
| Японский | Широкий (основные кошельки) |
| Китайский упрощённый | Средний (CJK-региональные кошельки) |
| Китайский традиционный | Средний (CJK-региональные кошельки) |
| Корейский | Ограниченный |
| Испанский | Средний |
| Французский | Средний |
| Итальянский | Ограниченный — средний |
| Чешский | Ограниченный |
| Португальский | Ограниченный |
Если вы сгенерируете seed-фразу с чешским списком, а через 5 лет вам понадобится восстановить её на аппаратном кошельке, поддерживающем только английский, вы окажетесь в тупике. Единственное решение --- найти ПО с поддержкой чешского BIP39, восстановить кошелёк и перевести средства в новый кошелёк, созданный с английским списком.
Нормализация Unicode¶
Неанглийские списки слов вводят нормализацию Unicode как потенциальную точку отказа. Спецификация BIP39 требует NFKD-нормализацию (Normalization Form Compatibility Decomposition) перед передачей мнемоники в PBKDF2. Это особенно актуально для:
- Идеографические пробелы (японский): Пробел между японскими словами должен быть U+3000, а не ASCII-пробелом (U+0020). Одни кошельки используют один вариант, другие --- другой. Если нормализация обработает это некорректно, полученный seed будет другим.
- Акцентированные символы (французский, испанский, чешский, португальский): Символ вроде акцентированного "e" может быть представлен как один Unicode-кодовый пункт или как "e" + комбинирующий акут. NFKD-нормализация должна это разрешить, но ошибочные реализации встречаются.
- Варианты китайских иероглифов: У некоторых китайских иероглифов есть несколько Unicode-представлений. Список слов использует канонические формы, но пользовательский ввод может использовать вариантные формы.
Эти проблемы редки, но когда возникают --- катастрофичны. Ваша seed-фраза выглядит правильно, но порождает другой кошелёк из-за невидимого различия в Unicode.
Рекомендация¶
Если у вас нет веских причин использовать неанглийский список, используйте английский. Он имеет универсальную поддержку кошельков, никаких сложностей с диакритическими знаками и никаких подводных камней нормализации Unicode. Английский список проверен более чем десятилетием использования в миллионах кошельков.
Если вы выбираете неанглийский список, задокументируйте, какой именно вы использовали, вместе с резервной копией seed-фразы. Храните копию самого списка (все 2 048 слов) вместе с бэкапом. И протестируйте восстановление как минимум в двух разных кошельках, прежде чем доверять этой конфигурации значительные суммы.
Поиск слов BIP39 на SafeSeed¶
Генераторы seed-фраз SafeSeed --- для Bitcoin, Ethereum и Solana --- по умолчанию используют английский список слов BIP39, обеспечивая максимальную совместимость с кошельками и аппаратными устройствами.
Инструменты отображают каждое сгенерированное слово вместе с его индексом в списке BIP39 (0--2 047). Эта прозрачность позволяет вам убедиться в правильности соответствия слова индексу и сверить результат с официальным английским списком BIP39, опубликованным в репозитории Bitcoin BIP.
Вся генерация происходит полностью в вашем браузере с использованием Web Crypto API в качестве источника энтропии. Никакие данные списка слов, seed-данные и приватные ключи никогда не покидают ваше устройство. Вы можете отключиться от интернета перед генерацией и работать в полной изоляции. Подробнее о том, почему это важно, читайте в статье Безопасность онлайн-генераторов seed-фраз.
Система списков слов BIP39 --- одна из наиболее продуманных компонент криптовалютного стека. Она преобразует двоичную энтропию в нечто, что человек может записать на бумаге, прочитать без ошибок и использовать для восстановления кошелька спустя годы на оборудовании, которого ещё не существует. Наличие 10 языковых вариантов делает систему доступной по всему миру. Но эта доступность несёт ответственность: выбирайте язык осознанно, понимайте последствия для совместимости и согласуйте стратегию резервного копирования с экосистемой кошельков, на которую вы полагаетесь.