BIP39ワードリスト:全10言語を徹底解説(2026年版)
目次
暗号資産ウォレットを作成する際に書き留める12語または24語は、任意の辞書から取られたものではありません。BIP39規格で定義された慎重に選定されたワードリストから来ています。ほとんどの人が目にするのは英語リスト --- 「abandon」から「zoo」までの2,048語 --- ですが、仕様書では実際に10言語のワードリストが定義されています。各リストは同じ制約で設計されています:正確に2,048語、あいまいさなし、書き写しエラーを最小化する構造。
このガイドでは、すべての公式BIP39ワードリストを取り上げ、各リストの設計原則を説明し、英語以外のリストを選択する際の重要な互換性への影響について議論します。
なぜ10言語なのか?¶
BIP39は暗号資産のバックアップをグローバルなユーザーがアクセスできるように設計されました。オリジナルの仕様(2013年公開)には英語のみが含まれていましたが、その後数年間で世界中の貢献者が追加言語のワードリストを提案しました。目標は、主要言語のネイティブスピーカーが容易に認識、綴り、検証できる単語でシードフレーズを書き留められるようにすることでした。
各ワードリストは同じコア制約を満たす必要があります:
- 正確に2,048語。 これは交渉の余地がありません。各単語は11ビットのデータを表し(2^11 = 2,048)、エントロピーからニーモニックへの変換の数学がこの正確な数に依存します。
- 各単語の最初の4文字がユニーク。 これにより、ユーザー(および小さな画面のハードウェアウォレット)が最初の4文字だけで任意の単語を識別できます。
- 単語は一般的で認識しやすいこと。 難解な語彙は書き写しエラーの可能性を高めます。
- 視覚的・音声的に類似した単語は避ける。 「woman」と「women」は悪いペアです。「accept」と「except」も同様です。
これらの制約は一部の言語では他の言語より満たすのが困難であり、そのため一部のワードリストは確定に数年かかり、他は素早く採用されました。
10の公式BIP39ワードリストは:英語、日本語、韓国語、中国語簡体字、中国語繁体字、スペイン語、フランス語、イタリア語、チェコ語、ポルトガル語です。
英語:ユニバーサルなデフォルト¶
英語のワードリストは事実上の標準です。ほぼすべてのウォレット --- ハードウェア、ソフトウェア、Webベース --- がサポートしています。Bitcoin、Ethereum、Solana、または他のBIP39互換チェーンを使用する場合、明示的に別の言語を選択しない限り、ウォレットが使用するのは英語リストです。
設計特性¶
- 2,048語、「abandon」から「zoo」まで。
- 3文字未満の単語なし。 最も短い単語は「add」「age」「ago」「aim」「air」などの一般的な用語です。
- 最初の4文字がユニーク。「Abou」は「about」を一意に識別します。「Abso」は「absorb」を一意に識別します。これが一部のハードウェアウォレットで最初の4文字だけ入力すればよい理由です。
- 同音異義語や類似同音異義語なし。「know」と「no」、「their」と「there」のような単語は除外されています。
- アルファベット順にソート。 バイナリサーチが容易です。
英語リストの広範なサポートにより、長期保管に最も安全な選択肢となっています。まだ存在しないウォレットソフトウェアで10年後にウォレットを復元する必要がある場合、英語ワードリストがサポートされている可能性は圧倒的に高いです。これらの単語がエントロピーをどのようにエンコードするかの完全な技術的説明は、BIP39徹底解説をご覧ください。
CJKワードリスト:日本語、韓国語、中国語¶
CJK(中国語、日本語、韓国語)のワードリストは、ユニークな課題と機会を提示します。これらの言語はラテンアルファベットではなく表語文字または音節文字を使用するため、設計制約が根本的に変わります。
日本語¶
日本語のワードリストはひらがな文字のみを使用します。各単語はひらがなの音節文字で書かれた一般的な日本語の用語であり、漢字の知識なしに読めます。
- 文字体系: ひらがなのみ(カタカナなし、漢字なし)。
- 区切り文字: 仕様では、単語間に標準ASCIIスペースではなく全角スペース(U+3000)を推奨しています。これは実装バグの一般的な原因です。
- 一意性: 各単語は最初の4つのひらがな文字でユニークです。各ひらがな文字はラテン文字より多くの情報をエンコードするため、この制約はより容易に満たされます。
日本語リストは最も早く提案された非英語リストの一つであり、特に日本の取引所やウォレットアプリケーションの間で比較的広いウォレットサポートを受けています。
韓国語¶
韓国語のワードリストはハングル --- 韓国の表音文字体系を使用します。各単語は完全にハングルで書かれた一般的な韓国語の単語です。
- 文字体系: ハングルのみ。
- 文字特性: 韓国語のハングル文字は字母(子音と母音)が音節ブロックに配置されて構成されます。これらのブロックの視覚的な区別性は、書き写しエラーの低減に役立ちます。
- 単語選択: 一般的で日常的な単語が優先されました。リストは若い話者に馴染みのない可能性がある漢字語を避けています。
韓国語のウォレットサポートは英語や日本語より限定的です。韓国語ワードリストの使用を選択する場合、シードフレーズを生成する前に、お好みのウォレットソフトウェアがこれを明示的にサポートしているか確認してください。
中国語簡体字と中国語繁体字¶
BIP39は2つの別々の中国語ワードリストを定義しています:簡体字中国語(中国本土、シンガポール、マレーシアで使用)と繁体字中国語(台湾、香港、マカオで使用)。
- 文字体系: 各リストはそれぞれの文字セットのみを使用します。
- 文字数: 中国語の文字はラテン文字より1文字あたり多くの情報をエンコードします。中国語リストの各単語は通常1〜2文字で、シードフレーズが視覚的にコンパクトです。
- 重複: 一部の単語は両リストに同じ意味で出現します。他の単語は簡体字と繁体字の文字セット間の自然な分岐を反映して、一方にのみ存在します。
- 一意性制約: 多くの単語が1〜2文字しかないため、最初の4文字ルールはここでは異なる方法で適用されます。仕様では、1文字の単語の場合、2つの単語が同じ最初の文字を共有しないことを要求しています。
中国語リストは中国語圏で人気のあるウォレットでよくサポートされていますが、欧米のウォレットソフトウェアでは利用できない場合があります。
欧州言語:スペイン語、フランス語、イタリア語、チェコ語、ポルトガル語¶
5つの欧州言語が公式BIP39ワードリストを完成させます。各言語は、言語固有の発音区別符号(アクセント、チルダ、セディーユ)を持つラテンアルファベットを使用します。
スペイン語¶
スペイン語のワードリストには、単語の一部として発音区別符号を含む一般的なスペイン語の語彙が含まれています。ウォレットの実装は、アクセント付き文字をアクセントなしの等価物として扱わないよう、Unicodeを正しく処理する必要があります。
- 発音区別符号: アクセント付き文字が含まれ、有意です。
- 地域中立性: リストは特定のスペイン語圏の国に固有の単語を避けています。
フランス語¶
フランス語のワードリストはスペイン語リストと同様の原則に従い、アクセント付き文字に注意を払っています。
- 発音区別符号: 完全に有意です。
- 合字: システム間で一貫してレンダリングされない可能性がある文字を避けています。
イタリア語¶
イタリア語のリストは欧州言語リストの中では比較的シンプルです。イタリア語はフランス語やスペイン語より少ない発音区別符号を使用し、困難なく2,048のあいまいでない単語を見つけるのに十分な語彙プールがあります。
チェコ語¶
チェコ語のワードリストは、チェコ語が広範な発音区別符号セットを使用するため注目に値します:ハーチェク(キャロン)、鋭アクセントなど。発音区別符号を除去するとあいまいさが生じます。
- 発音区別符号: 必須で核心的です。発音区別符号を除去するとあいまいさが発生します。
- 実装リスク: Unicodeを積極的に正規化する(アクセントを除去、ASCIIに変換する)ソフトウェアはチェコ語のシードフレーズを破損させます。これが非英語ワードリストの最大のリスクです。
ポルトガル語¶
ポルトガル語リストは公式BIP39仕様への最も最近の追加です。ポルトガル語で一般的な発音区別符号(チルダ、鋭アクセント、曲折アクセント)を使用し、ブラジルポルトガル語とヨーロッパポルトガル語の間で中立を保とうとしています。
互換性への影響:一つの言語を守る¶
このガイド全体で最も重要な実用的なポイントは以下です:ワードリストの選択は永続的なコミットメントです。日本語のワードリストで生成されたシードフレーズは、英語のワードリストを使用して復元できません。単語はお互いの翻訳ではありません --- 同じバイナリエントロピーから異なる単語シーケンスへの完全に異なるマッピングです。
マッピングは言語固有¶
ウォレットがシードフレーズを生成するとき、128ビットまたは256ビットのエントロピーを取り、チェックサムを計算し、結果を11ビットのセグメントに分割し、ワードリストで各セグメントを検索します。英語リストの単語インデックス0は「abandon」です。日本語リストの単語インデックス0はまったく別の単語です。バイナリデータは同じですが、人間が読める表現は異なります。
これは以下を意味します:
- 異なるリストの単語を混ぜることはできません。
- 各単語のインデックスを調べ、別の言語の対応する単語を見つけてシードフレーズを「翻訳」することはできません。
- 実際には、そのような翻訳を機械的に行うことは可能です(各英語の単語のインデックスを調べ、日本語リストの同じインデックスの単語を見つければ)。結果は同じウォレットを導出する有効な日本語のシードフレーズになります。しかし、標準的なウォレットソフトウェアはこの機能を提供しておらず、手動で行うとエラーが発生しやすいです。
ウォレットサポートは普遍的ではない¶
英語はすべてのBIP39互換ウォレットでサポートされていますが、非英語リストのサポートレベルは様々です:
| 言語 | ウォレットサポートレベル |
|---|---|
| 英語 | 普遍的 |
| 日本語 | 広範(主要ウォレット) |
| 中国語簡体字 | 中程度(CJK地域ウォレット) |
| 中国語繁体字 | 中程度(CJK地域ウォレット) |
| 韓国語 | 限定的 |
| スペイン語 | 中程度 |
| フランス語 | 中程度 |
| イタリア語 | 限定的〜中程度 |
| チェコ語 | 限定的 |
| ポルトガル語 | 限定的 |
チェコ語のワードリストでシードフレーズを生成し、5年後に英語のみをサポートするハードウェアウォレットで復元する必要がある場合、困った状況に陥ります。唯一の回避策は、チェコ語BIP39をサポートするソフトウェアを見つけてウォレットを復元し、英語リストで生成した新しいウォレットに資金を移すことです。
Unicode正規化¶
非英語ワードリストは、Unicode正規化を潜在的な障害点として導入します。BIP39仕様では、ニーモニックをPBKDF2に供給する前にNFKD(正規化形式互換性分解)正規化を要求しています。これは特に以下に関連します:
- 全角スペース(日本語): 日本語の単語間のスペース文字はASCIIスペース(U+0020)ではなくU+3000であるべきです。一部のウォレットは一方を、一部は他方を使用します。正規化ステップがこれを誤って処理すると、導出されるシードが異なります。
- アクセント文字(フランス語、スペイン語、チェコ語、ポルトガル語): アクセント付き文字は単一のUnicodeコードポイントまたは基本文字+結合アクセントとして表現できます。NFKD正規化がこれを解決するはずですが、バグのある実装が存在します。
- 中国語文字の変形: 一部の中国語文字には複数のUnicode表現があります。ワードリストは正規形式を使用しますが、ユーザー入力は変形形式を使用する可能性があります。
これらの問題はまれですが、発生すると致命的です。シードフレーズは正しく見えますが、見えないUnicodeの違いにより異なるウォレットが導出されます。
推奨事項¶
非英語ワードリストを使用する明確な理由がない限り、英語を使用してください。普遍的なウォレットサポート、発音区別符号の問題なし、Unicode正規化の落とし穴なしです。英語ワードリストは10年以上にわたり数百万のウォレットで実戦テストされています。
非英語リストを選択する場合、シードフレーズのバックアップと一緒にどのリストを使用したかを記録してください。ワードリスト自体(2,048語すべて)のコピーをバックアップと一緒に保管してください。そして、重要な資金を預ける前に、少なくとも2つの異なるウォレットで復元をテストしてください。
SafeSeedのBIP39ワード検索¶
SafeSeedのシードフレーズジェネレーター --- Bitcoin、Ethereum、Solana --- はデフォルトで英語のBIP39ワードリストを使用し、ウォレットおよびハードウェアデバイス間の最大互換性を確保しています。
ツールは生成された各単語をBIP39ワードリストのインデックス(0〜2,047)とともに表示します。この透明性により、単語からインデックスへのマッピングが正しいことを確認し、Bitcoin BIPリポジトリで公開されている公式BIP39英語ワードリストと照合できます。
すべての生成はエントロピーのソーシングにWeb Crypto APIを使用して、完全にブラウザ内で行われます。ワードリストの検索、シードデータ、秘密鍵がデバイスから出ることはありません。生成前にインターネットから切断し、完全に隔離された状態で作業できます。なぜこれが重要かについて詳しくは、オンラインシードジェネレーターの安全性をご覧ください。
BIP39ワードリストシステムは、暗号資産スタックで最も思慮深く設計されたコンポーネントの一つです。生のバイナリエントロピーを、人間が紙に書き、エラーなく読み返し、まだ発明されていないハードウェアで何年も後にウォレットを復元するために使用できるものに変換します。10の言語オプションの利用可能性は、このシステムを世界中でアクセス可能にします。しかし、そのアクセシビリティには責任が伴います:意図的に言語を選択し、互換性への影響を理解し、バックアップ戦略を依存するウォレットエコシステムと一致させてください。