Guides ·

BIP39 शब्द सूची: सभी 10 भाषाओं की व्याख्या (2026)


जब आप क्रिप्टोकरेंसी वॉलेट बनाते हैं, तो जो 12 या 24 शब्द आप लिखते हैं, वे किसी मनमाने शब्दकोश से नहीं आते। वे BIP39 मानक द्वारा परिभाषित सावधानीपूर्वक तैयार की गई शब्द सूची से आते हैं। अधिकांश लोगों को अंग्रेजी सूची मिलती है --- "abandon" से "zoo" तक 2,048 शब्द --- लेकिन विनिर्देशन वास्तव में 10 भाषाओं में शब्द सूचियाँ परिभाषित करता है। प्रत्येक सूची समान बाधाओं के साथ डिज़ाइन की गई थी: ठीक 2,048 शब्द, कोई अस्पष्टता नहीं, और एक संरचना जो लिखने की गलतियों को कम करती है।

यह गाइड हर आधिकारिक BIP39 शब्द सूची को कवर करती है, प्रत्येक के पीछे के डिज़ाइन सिद्धांतों की व्याख्या करती है, और गैर-अंग्रेजी सूची चुनने के महत्वपूर्ण संगतता प्रभावों पर चर्चा करती है।

10 भाषाएँ क्यों?

BIP39 को क्रिप्टोकरेंसी बैकअप को वैश्विक दर्शकों के लिए सुलभ बनाने के लिए डिज़ाइन किया गया था। मूल विनिर्देशन (2013 में प्रकाशित) में केवल अंग्रेजी शामिल थी, लेकिन दुनिया भर के योगदानकर्ताओं ने बाद के वर्षों में अतिरिक्त शब्द सूचियाँ प्रस्तावित कीं। लक्ष्य था कि प्रमुख भाषाओं के मूल वक्ता उन शब्दों का उपयोग करके seed phrases लिख सकें जिन्हें वे आसानी से पहचान, लिख और सत्यापित कर सकें।

प्रत्येक शब्द सूची को समान मूल बाधाओं को पूरा करना चाहिए:

  1. ठीक 2,048 शब्द। यह गैर-परक्राम्य है। प्रत्येक शब्द 11 bits डेटा दर्शाता है (2^11 = 2,048), और entropy से mnemonic रूपांतरण की गणित इसी सटीक संख्या पर निर्भर करती है।
  2. प्रत्येक शब्द के पहले 4 अक्षर अद्वितीय होने चाहिए। यह उपयोगकर्ताओं (और छोटी स्क्रीन वाले hardware wallets) को केवल पहले चार अक्षरों से किसी भी शब्द की पहचान करने देता है।
  3. शब्द सामान्य और आसानी से पहचाने जाने योग्य होने चाहिए। अस्पष्ट शब्दावली लिखने की गलतियों की संभावना बढ़ाती है।
  4. दृष्टिगत और ध्वनिगत रूप से समान शब्दों से बचना चाहिए। "Woman" और "women" एक बुरी जोड़ी होगी। "accept" और "except" भी।

ये बाधाएँ कुछ भाषाओं में अन्य की तुलना में पूरा करना कठिन हैं, यही कारण है कि कुछ शब्द सूचियों को अंतिम रूप देने में वर्षों लगे जबकि अन्य को शीघ्र अपनाया गया।

10 आधिकारिक BIP39 शब्द सूचियाँ हैं: अंग्रेजी, जापानी, कोरियाई, सरलीकृत चीनी, पारंपरिक चीनी, स्पेनिश, फ्रेंच, इतालवी, चेक, और पुर्तगाली

अंग्रेजी: सार्वभौमिक डिफ़ॉल्ट

अंग्रेजी शब्द सूची वास्तविक मानक है। लगभग हर वॉलेट --- hardware, software, और वेब-आधारित --- इसका समर्थन करता है। यदि आप Bitcoin, Ethereum, Solana, या कोई अन्य BIP39-संगत chain उपयोग करते हैं, तो अंग्रेजी सूची ही आपका वॉलेट उपयोग करेगा जब तक आप स्पष्ट रूप से अन्यथा नहीं चुनते।

डिज़ाइन गुण

  • 2,048 शब्द "abandon" से "zoo" तक।
  • 3 अक्षरों से छोटा कोई शब्द नहीं। सबसे छोटे शब्द हैं "add," "age," "ago," "aim," "air" और इसी तरह के सामान्य शब्द।
  • पहले 4 अक्षर अद्वितीय हैं। "Abou" विशिष्ट रूप से "about" की पहचान करता है। "Abso" विशिष्ट रूप से "absorb" की पहचान करता है। यही कारण है कि कुछ hardware wallets केवल पहले चार अक्षर टाइप करने की आवश्यकता रखते हैं।
  • कोई समोच्चारण शब्द नहीं। "know" और "no," या "their" और "there" जैसे शब्द बाहर रखे गए हैं।
  • वर्णानुक्रम में क्रमबद्ध। सूची पर binary search करना सरल है।

अंग्रेजी सूची का व्यापक समर्थन इसे दीर्घकालिक भंडारण के लिए सबसे सुरक्षित विकल्प बनाता है। यदि आपको 10 साल बाद ऐसे वॉलेट सॉफ़्टवेयर में अपना वॉलेट पुनर्प्राप्त करने की आवश्यकता है जो अभी तक मौजूद नहीं है, तो अंग्रेजी शब्द सूची का समर्थित होना लगभग निश्चित है। इन शब्दों द्वारा आपकी entropy को कैसे एन्कोड किया जाता है, इसकी पूर्ण तकनीकी व्याख्या के लिए BIP39 Explained देखें।

CJK शब्द सूचियाँ: जापानी, कोरियाई, चीनी

CJK (चीनी, जापानी, कोरियाई) शब्द सूचियाँ अद्वितीय चुनौतियाँ और अवसर प्रस्तुत करती हैं। ये भाषाएँ Latin वर्णमाला के बजाय लोगोग्राफ़िक या सिलेबिक लिपियों का उपयोग करती हैं, जो डिज़ाइन बाधाओं को मूल रूप से बदलता है।

जापानी

जापानी शब्द सूची विशेष रूप से hiragana अक्षरों का उपयोग करती है। प्रत्येक शब्द hiragana syllabary में लिखा गया एक सामान्य जापानी शब्द है, जो kanji के ज्ञान के बिना पठनीय है।

  • लिपि: केवल Hiragana (कोई katakana नहीं, कोई kanji नहीं)।
  • विभाजक: विनिर्देशन शब्दों के बीच मानक ASCII स्पेस के बजाय ideographic स्पेस (U+3000) की सिफारिश करता है। यह कार्यान्वयन बग का एक सामान्य स्रोत है।
  • विशिष्टता: प्रत्येक शब्द अपने पहले 4 hiragana अक्षरों में अद्वितीय है।

जापानी सूची सबसे पहली गैर-अंग्रेजी सूचियों में से एक थी जो प्रस्तावित की गई और इसका अपेक्षाकृत व्यापक वॉलेट समर्थन है, विशेष रूप से जापानी एक्सचेंजों और वॉलेट एप्लिकेशन में।

कोरियाई

कोरियाई शब्द सूची hangul --- कोरियाई ध्वन्यात्मक लेखन प्रणाली --- का उपयोग करती है। प्रत्येक शब्द पूरी तरह से hangul में लिखा गया एक सामान्य कोरियाई शब्द है।

  • लिपि: केवल Hangul।
  • अक्षर गुण: कोरियाई hangul अक्षर jamo (व्यंजन और स्वर) से बने होते हैं जो syllable blocks में व्यवस्थित होते हैं। इन blocks की दृश्य विशिष्टता लिखने की गलतियों को कम करने में मदद करती है।
  • शब्द चयन: सामान्य, रोजमर्रा के शब्दों को प्राथमिकता दी गई। सूची Sino-Korean उधार शब्दों से बचती है जो युवा वक्ताओं के लिए अपरिचित हो सकते हैं।

कोरियाई वॉलेट समर्थन अंग्रेजी या जापानी की तुलना में अधिक सीमित है। यदि आप कोरियाई शब्द सूची का उपयोग करना चुनते हैं, तो seed phrase उत्पन्न करने से पहले सत्यापित करें कि आपका पसंदीदा वॉलेट सॉफ़्टवेयर स्पष्ट रूप से इसका समर्थन करता है।

सरलीकृत चीनी और पारंपरिक चीनी

BIP39 दो अलग-अलग चीनी शब्द सूचियाँ परिभाषित करता है: एक सरलीकृत चीनी (मुख्य भूमि चीन, सिंगापुर और मलेशिया में उपयोग) और एक पारंपरिक चीनी (ताइवान, हांगकांग और मकाऊ में उपयोग) के लिए।

  • लिपि: प्रत्येक सूची विशेष रूप से अपने संबंधित character set का उपयोग करती है।
  • अक्षर गणना: चीनी अक्षर प्रति अक्षर Latin अक्षरों से अधिक जानकारी एन्कोड करते हैं। चीनी सूचियों में प्रत्येक शब्द आमतौर पर 1-2 अक्षरों का होता है, जो seed phrase को दृष्टिगत रूप से अधिक कॉम्पैक्ट बनाता है।
  • ओवरलैप: कुछ शब्द दोनों सूचियों में समान अर्थ के साथ दिखाई देते हैं। अन्य एक में मौजूद हैं लेकिन दूसरे में नहीं।
  • विशिष्टता बाधा: पहले-4-अक्षर नियम यहाँ अलग ढंग से लागू होता है क्योंकि कई शब्द केवल 1-2 अक्षरों के हैं।

चीनी सूचियाँ चीनी-भाषी क्षेत्रों में लोकप्रिय wallets में अच्छी तरह से समर्थित हैं लेकिन पश्चिमी वॉलेट सॉफ़्टवेयर में उपलब्ध नहीं हो सकती हैं।

यूरोपीय भाषाएँ: स्पेनिश, फ्रेंच, इतालवी, चेक, पुर्तगाली

पाँच यूरोपीय भाषाएँ आधिकारिक BIP39 शब्द सूचियों को पूर्ण करती हैं। प्रत्येक Latin वर्णमाला का उपयोग करती है, भाषा-विशिष्ट विशेषक चिह्नों (accents, tildes, cedillas) के साथ।

स्पेनिश

स्पेनिश शब्द सूची में सामान्य स्पेनिश शब्दावली शामिल है, विशेषक चिह्न शब्द के भाग के रूप में शामिल हैं। वॉलेट कार्यान्वयन को accented अक्षरों को उनके unaccented समकक्षों के रूप में मानने से बचने के लिए Unicode को सही ढंग से संभालना चाहिए।

  • विशेषक चिह्न: Accented अक्षर शामिल और महत्वपूर्ण हैं।
  • क्षेत्रीय तटस्थता: सूची ऐसे शब्दों से बचती है जो किसी एक स्पेनिश-भाषी देश के लिए विशिष्ट हैं।

फ्रेंच

फ्रेंच शब्द सूची स्पेनिश सूची के समान सिद्धांतों का पालन करती है, accented अक्षरों पर ध्यान देते हुए।

  • विशेषक चिह्न: पूरी तरह से महत्वपूर्ण।
  • Ligatures: सूची ae और oe जैसे अक्षरों से बचती है जो सभी सिस्टम पर लगातार रेंडर नहीं हो सकते।

इतालवी

यूरोपीय सूचियों में इतालवी सूची अपेक्षाकृत सीधी है। इतालवी फ्रेंच या स्पेनिश की तुलना में कम विशेषक चिह्नों का उपयोग करती है।

चेक

चेक शब्द सूची उल्लेखनीय है क्योंकि चेक विशेषक चिह्नों का व्यापक सेट उपयोग करती है: haceks, carons, और acute accents।

  • विशेषक चिह्न: आवश्यक और भार-वहन करने वाले। विशेषक चिह्नों को हटाने से अस्पष्टता पैदा होगी।
  • कार्यान्वयन जोखिम: सॉफ़्टवेयर जो Unicode को आक्रामक रूप से normalize करता है (accents हटाना, ASCII में बदलना) चेक seed phrases को दूषित कर देगा। गैर-अंग्रेजी शब्द सूचियों के साथ यह सबसे बड़ा जोखिम है।

पुर्तगाली

पुर्तगाली सूची आधिकारिक BIP39 विनिर्देशन में सबसे हाल का जोड़ थी। यह पुर्तगाली में सामान्य विशेषक चिह्नों का उपयोग करती है और ब्राज़ीलियाई और यूरोपीय पुर्तगाली के बीच तटस्थ होने का प्रयास करती है।

संगतता प्रभाव: एक भाषा के साथ रहें

यह इस पूरी गाइड का सबसे महत्वपूर्ण व्यावहारिक निष्कर्ष है: आपकी शब्द सूची का चयन स्थायी प्रतिबद्धता है। जापानी शब्द सूची से उत्पन्न seed phrase को अंग्रेजी शब्द सूची का उपयोग करके पुनर्प्राप्त नहीं किया जा सकता। शब्द एक-दूसरे के अनुवाद नहीं हैं --- वे एक ही बाइनरी entropy से अलग-अलग शब्द अनुक्रमों के पूरी तरह से अलग मैपिंग हैं।

मैपिंग भाषा-विशिष्ट है

जब आपका वॉलेट seed phrase उत्पन्न करता है, तो यह 128 या 256 bits entropy लेता है, checksum की गणना करता है, परिणाम को 11-bit खंडों में विभाजित करता है, और प्रत्येक खंड को शब्द सूची में देखता है। अंग्रेजी सूची में शब्द index 0 "abandon" है। जापानी सूची में शब्द index 0 पूरी तरह से अलग शब्द है। बाइनरी डेटा समान है; मानव-पठनीय प्रतिनिधित्व अलग है।

इसका मतलब है:

  • आप अलग-अलग सूचियों के शब्दों को मिला नहीं सकते।
  • आप प्रत्येक शब्द के index को देखकर और दूसरी भाषा में संबंधित शब्द ढूँढकर seed phrase का "अनुवाद" नहीं कर सकते।
  • वास्तव में, आप यह अनुवाद यांत्रिक रूप से कर सकते हैं (प्रत्येक अंग्रेजी शब्द का index देखें, फिर जापानी सूची में उसी index पर शब्द खोजें), और परिणाम एक वैध जापानी-भाषा seed phrase होगा जो उसी वॉलेट को derive करता है। लेकिन कोई मानक वॉलेट सॉफ़्टवेयर यह सुविधा प्रदान नहीं करता, और इसे मैन्युअल रूप से करना गलती-प्रवण है।

वॉलेट समर्थन सार्वभौमिक नहीं है

जबकि अंग्रेजी हर BIP39-संगत वॉलेट द्वारा समर्थित है, गैर-अंग्रेजी सूचियों का समर्थन भिन्न स्तरों पर है:

भाषा वॉलेट समर्थन स्तर
अंग्रेजी सार्वभौमिक
जापानी व्यापक (प्रमुख wallets)
सरलीकृत चीनी मध्यम (CJK-क्षेत्र wallets)
पारंपरिक चीनी मध्यम (CJK-क्षेत्र wallets)
कोरियाई सीमित
स्पेनिश मध्यम
फ्रेंच मध्यम
इतालवी सीमित से मध्यम
चेक सीमित
पुर्तगाली सीमित

यदि आप चेक शब्द सूची के साथ seed phrase उत्पन्न करते हैं और फिर 5 साल बाद केवल अंग्रेजी का समर्थन करने वाले hardware wallet पर इसे पुनर्प्राप्त करने की आवश्यकता है, तो आप फँस गए हैं। एकमात्र उपाय है चेक BIP39 का समर्थन करने वाला सॉफ़्टवेयर खोजें, वॉलेट पुनर्प्राप्त करें, और फंड को अंग्रेजी सूची से उत्पन्न नए वॉलेट में स्थानांतरित करें।

Unicode Normalization

गैर-अंग्रेजी शब्द सूचियाँ Unicode normalization को विफलता के संभावित बिंदु के रूप में प्रस्तुत करती हैं। BIP39 विनिर्देशन mnemonic को PBKDF2 में डालने से पहले NFKD (Normalization Form Compatibility Decomposition) normalization की आवश्यकता रखता है। यह विशेष रूप से प्रासंगिक है:

  • Ideographic स्पेस (जापानी): जापानी शब्दों के बीच स्पेस अक्षर U+3000 होना चाहिए, ASCII स्पेस (U+0020) नहीं। कुछ wallets एक का उपयोग करते हैं, कुछ दूसरे का। यदि normalization चरण इसे गलत तरीके से संभालता है, तो derived seed अलग होगा।
  • Accented अक्षर (फ्रेंच, स्पेनिश, चेक, पुर्तगाली): एक accent वाला अक्षर एकल Unicode codepoint या base अक्षर + combining accent के रूप में दर्शाया जा सकता है। NFKD normalization को इसे हल करना चाहिए, लेकिन बग वाले कार्यान्वयन मौजूद हैं।
  • चीनी अक्षर variants: कुछ चीनी अक्षरों में कई Unicode प्रतिनिधित्व हैं।

ये समस्याएँ दुर्लभ हैं, लेकिन जब होती हैं, तो विनाशकारी होती हैं। आपका seed phrase सही दिखता है, लेकिन अदृश्य Unicode अंतर के कारण एक अलग वॉलेट derive करता है।

सिफारिश

जब तक आपके पास गैर-अंग्रेजी शब्द सूची का उपयोग करने का कोई सम्मोहक कारण न हो, अंग्रेजी का उपयोग करें। इसमें सार्वभौमिक वॉलेट समर्थन, कोई विशेषक चिह्न जटिलता, और कोई Unicode normalization समस्या नहीं है। अंग्रेजी शब्द सूची एक दशक से अधिक समय से लाखों wallets में परीक्षित है।

यदि आप गैर-अंग्रेजी सूची चुनते हैं, तो दस्तावेज करें कि आपने कौन सी सूची उपयोग की, अपने seed phrase बैकअप के साथ। शब्द सूची की एक प्रति (सभी 2,048 शब्द) अपने बैकअप के साथ स्टोर करें। और महत्वपूर्ण फंड के साथ सेटअप पर भरोसा करने से पहले कम से कम दो अलग-अलग wallets पर पुनर्प्राप्ति का परीक्षण करें।

SafeSeed का BIP39 शब्द लुकअप

SafeSeed के seed phrase generators --- Bitcoin, Ethereum, और Solana के लिए --- डिफ़ॉल्ट रूप से अंग्रेजी BIP39 शब्द सूची का उपयोग करते हैं, wallets और hardware devices में अधिकतम संगतता सुनिश्चित करते हुए।

टूल प्रत्येक उत्पन्न शब्द को BIP39 शब्द सूची (0--2,047) में उसके index के साथ प्रदर्शित करते हैं। यह पारदर्शिता आपको सत्यापित करने देती है कि शब्द-से-index मैपिंग सही है और Bitcoin BIP रिपॉजिटरी में प्रकाशित आधिकारिक BIP39 अंग्रेजी शब्द सूची के विरुद्ध क्रॉस-रेफ़रेंस करें।

सभी generation पूरी तरह से आपके ब्राउज़र में Web Crypto API का उपयोग करके entropy sourcing के लिए होती है। कोई शब्द सूची लुकअप, कोई seed डेटा, और कोई private keys कभी भी आपके डिवाइस से बाहर नहीं जाते। आप generate करने से पहले इंटरनेट से डिस्कनेक्ट कर सकते हैं और पूर्ण अलगाव में काम कर सकते हैं। यह क्यों मायने रखता है, इसकी गहरी समझ के लिए Online Seed Generator Safety देखें।

BIP39 शब्द सूची प्रणाली क्रिप्टोकरेंसी स्टैक के सबसे विचारपूर्वक डिज़ाइन किए गए घटकों में से एक है। यह कच्ची बाइनरी entropy को ऐसी चीज़ में बदलती है जिसे इंसान कागज पर लिख सकता है, बिना गलती के वापस पढ़ सकता है, और ऐसे hardware पर वर्षों बाद वॉलेट पुनर्प्राप्त कर सकता है जो अभी तक आविष्कार नहीं हुआ है। 10 भाषा विकल्पों की उपलब्धता इस प्रणाली को विश्वव्यापी रूप से सुलभ बनाती है। लेकिन वह पहुँच जिम्मेदारी के साथ आती है: अपनी भाषा सोच-समझकर चुनें, संगतता प्रभावों को समझें, और अपनी बैकअप रणनीति को उस वॉलेट इकोसिस्टम के अनुरूप रखें जिस पर आप भरोसा करते हैं।