Guides ·

Danh Sách Từ BIP39: Giải Thích Cả 10 Ngôn Ngữ (2026)


Khi bạn tạo ví tiền mã hóa, 12 hoặc 24 từ bạn ghi lại không được lấy từ một cuốn từ điển tùy ý. Chúng đến từ danh sách từ được chọn lọc cẩn thận theo tiêu chuẩn BIP39. Hầu hết mọi người gặp danh sách tiếng Anh --- 2.048 từ từ "abandon" đến "zoo" --- nhưng đặc tả thực tế định nghĩa danh sách từ trong 10 ngôn ngữ. Mỗi danh sách được thiết kế với cùng ràng buộc: đúng 2.048 từ, không nhập nhằng, và cấu trúc giảm thiểu lỗi sao chép.

Hướng dẫn này bao gồm mọi danh sách từ BIP39 chính thức, giải thích nguyên tắc thiết kế đằng sau mỗi danh sách, và thảo luận các hệ quả tương thích quan trọng khi chọn danh sách không phải tiếng Anh.

Tại Sao 10 Ngôn Ngữ?

BIP39 được thiết kế để giúp bản sao lưu tiền mã hóa tiếp cận được với đối tượng toàn cầu. Đặc tả gốc (công bố năm 2013) chỉ bao gồm tiếng Anh, nhưng những người đóng góp từ khắp nơi trên thế giới đã đề xuất thêm danh sách từ trong những năm tiếp theo. Mục tiêu là cho phép người bản ngữ của các ngôn ngữ lớn ghi lại seed phrase bằng những từ họ có thể dễ dàng nhận ra, viết đúng và xác minh.

Mỗi danh sách từ phải đáp ứng cùng các ràng buộc cốt lõi:

  1. Đúng 2.048 từ. Điều này không thể thương lượng. Mỗi từ đại diện cho 11 bit dữ liệu (2^11 = 2.048), và toán học của quá trình chuyển đổi entropy-sang-mnemonic phụ thuộc vào con số chính xác này.
  2. 4 ký tự đầu tiên của mỗi từ phải là duy nhất. Điều này cho phép người dùng (và ví phần cứng với màn hình nhỏ) nhận dạng bất kỳ từ nào chỉ từ bốn ký tự đầu.
  3. Các từ nên phổ biến và dễ nhận biết. Từ vựng khó hiểu tăng nguy cơ lỗi sao chép.
  4. Các từ tương tự về hình ảnh và phát âm nên được tránh. "Woman" và "women" sẽ là một cặp tệ. "Accept" và "except" cũng vậy.

Những ràng buộc này khó đáp ứng hơn ở một số ngôn ngữ so với ngôn ngữ khác, đó là lý do tại sao một số danh sách từ mất nhiều năm để hoàn thiện trong khi những danh sách khác được chấp nhận nhanh chóng.

10 danh sách từ BIP39 chính thức là: tiếng Anh, Nhật, Hàn, Trung Quốc Giản Thể, Trung Quốc Phồn Thể, Tây Ban Nha, Pháp, Ý, SécBồ Đào Nha.

Tiếng Anh: Mặc Định Toàn Cầu

Danh sách từ tiếng Anh là tiêu chuẩn thực tế. Hầu như mọi ví --- phần cứng, phần mềm và dựa trên web --- đều hỗ trợ nó. Nếu bạn sử dụng Bitcoin, Ethereum, Solana hoặc bất kỳ chain nào tương thích BIP39, danh sách tiếng Anh là những gì ví của bạn sẽ sử dụng trừ khi bạn chủ động chọn khác.

Đặc Tính Thiết Kế

  • 2.048 từ từ "abandon" đến "zoo."
  • Không từ nào ngắn hơn 3 ký tự. Các từ ngắn nhất là "add," "age," "ago," "aim," "air" và các thuật ngữ phổ biến tương tự.
  • 4 ký tự đầu là duy nhất. "Abou" xác định duy nhất "about." "Abso" xác định duy nhất "absorb." Đây là lý do một số ví phần cứng chỉ yêu cầu bạn nhập bốn chữ cái đầu.
  • Không có từ đồng âm. Các từ như "know" và "no," hoặc "their" và "there," bị loại trừ.
  • Sắp xếp theo thứ tự bảng chữ cái. Tìm kiếm nhị phân trên danh sách rất đơn giản.

Sự hỗ trợ rộng rãi của danh sách tiếng Anh khiến nó trở thành lựa chọn an toàn nhất cho lưu trữ dài hạn. Nếu bạn cần khôi phục ví 10 năm sau bằng phần mềm ví chưa tồn tại, danh sách từ tiếng Anh gần như chắc chắn được hỗ trợ. Để giải thích kỹ thuật đầy đủ về cách các từ này mã hóa entropy của bạn, xem BIP39 Giải Thích.

Danh Sách Từ CJK: Nhật, Hàn, Trung

Danh sách từ CJK (Trung, Nhật, Hàn) đặt ra những thách thức và cơ hội riêng. Các ngôn ngữ này sử dụng chữ tượng hình hoặc chữ âm tiết thay vì bảng chữ cái Latin, điều này thay đổi hoàn toàn các ràng buộc thiết kế.

Tiếng Nhật

Danh sách từ tiếng Nhật sử dụng toàn bộ ký tự hiragana. Mỗi từ là một thuật ngữ tiếng Nhật phổ biến viết bằng hệ chữ hiragana, giúp đọc được mà không cần biết kanji.

  • Chữ viết: Chỉ hiragana (không katakana, không kanji).
  • Dấu phân cách: Đặc tả khuyến nghị sử dụng khoảng trắng tượng hình (U+3000) thay vì khoảng trắng ASCII tiêu chuẩn giữa các từ. Đây là nguồn phổ biến gây ra lỗi triển khai.
  • Tính duy nhất: Mỗi từ là duy nhất trong 4 ký tự hiragana đầu tiên. Vì mỗi ký tự hiragana mã hóa nhiều thông tin hơn một chữ cái Latin, ràng buộc này dễ đáp ứng hơn.

Danh sách tiếng Nhật là một trong những danh sách không phải tiếng Anh sớm nhất được đề xuất và có sự hỗ trợ ví tương đối rộng, đặc biệt trong các sàn giao dịch và ứng dụng ví của Nhật.

Tiếng Hàn

Danh sách từ tiếng Hàn sử dụng hangul --- hệ chữ viết ngữ âm của Hàn Quốc. Mỗi từ là một từ tiếng Hàn phổ biến viết hoàn toàn bằng hangul.

  • Chữ viết: Chỉ hangul.
  • Đặc tính ký tự: Ký tự hangul Hàn Quốc được tạo thành từ jamo (phụ âm và nguyên âm) sắp xếp trong khối âm tiết. Sự khác biệt trực quan của các khối này giúp giảm lỗi sao chép.
  • Lựa chọn từ: Các từ phổ biến, hàng ngày được ưu tiên. Danh sách tránh các từ mượn Hán-Hàn có thể không quen thuộc với thế hệ trẻ.

Hỗ trợ ví tiếng Hàn hạn chế hơn tiếng Anh hoặc Nhật. Nếu bạn chọn sử dụng danh sách từ tiếng Hàn, hãy xác minh rằng phần mềm ví ưa thích của bạn hỗ trợ nó rõ ràng trước khi tạo seed phrase.

Trung Quốc Giản Thể Và Phồn Thể

BIP39 định nghĩa hai danh sách từ tiếng Trung riêng biệt: một cho Trung Quốc Giản Thể (sử dụng ở Trung Quốc đại lục, Singapore và Malaysia) và một cho Trung Quốc Phồn Thể (sử dụng ở Đài Loan, Hồng Kông và Ma Cao).

  • Chữ viết: Mỗi danh sách sử dụng bộ ký tự tương ứng của mình.
  • Số lượng ký tự: Ký tự Trung Quốc mã hóa nhiều thông tin hơn mỗi ký tự so với chữ cái Latin. Mỗi từ trong danh sách tiếng Trung thường là 1--2 ký tự, làm cho seed phrase nhỏ gọn hơn về mặt hình ảnh.
  • Trùng lặp: Một số từ xuất hiện trong cả hai danh sách với ý nghĩa giống nhau. Những từ khác tồn tại trong một danh sách nhưng không có trong danh sách còn lại, phản ánh sự phân hóa tự nhiên giữa bộ ký tự giản thể và phồn thể.
  • Ràng buộc tính duy nhất: Quy tắc 4-ký-tự-đầu áp dụng khác ở đây vì nhiều từ chỉ có 1--2 ký tự. Đặc tả yêu cầu không có hai từ nào có cùng ký tự đầu tiên trong các từ đơn ký tự.

Danh sách tiếng Trung được hỗ trợ tốt trong các ví phổ biến ở vùng nói tiếng Trung nhưng có thể không có sẵn trong phần mềm ví phương Tây.

Ngôn Ngữ Châu Âu: Tây Ban Nha, Pháp, Ý, Séc, Bồ Đào Nha

Năm ngôn ngữ châu Âu hoàn thiện danh sách từ BIP39 chính thức. Mỗi ngôn ngữ sử dụng bảng chữ cái Latin với các dấu phụ đặc trưng (dấu sắc, dấu ngã, dấu trầm).

Tiếng Tây Ban Nha

Danh sách từ tiếng Tây Ban Nha bao gồm từ vựng phổ biến, với dấu phụ được bao gồm như một phần của từ. Việc triển khai ví phải xử lý Unicode chính xác để tránh coi các ký tự có dấu như tương đương với ký tự không dấu.

  • Dấu phụ: Các ký tự có dấu sắc (a, e, i, o, u) được bao gồm và có ý nghĩa.
  • Tính trung lập vùng: Danh sách tránh các từ đặc trưng cho một quốc gia nói tiếng Tây Ban Nha duy nhất.

Tiếng Pháp

Danh sách từ tiếng Pháp tuân theo nguyên tắc tương tự danh sách tiếng Tây Ban Nha, chú ý đến các ký tự có dấu.

  • Dấu phụ: Hoàn toàn có ý nghĩa. Các từ có và không có dấu là các chuỗi khác nhau.
  • Ký tự ghép: Danh sách tránh các ký tự có thể không hiển thị nhất quán trên các hệ thống.

Tiếng Ý

Danh sách tiếng Ý tương đối đơn giản trong số các danh sách châu Âu. Tiếng Ý sử dụng ít dấu phụ hơn tiếng Pháp hoặc Tây Ban Nha, và nguồn từ vựng đủ lớn để tìm 2.048 từ không nhập nhằng.

Tiếng Séc

Danh sách từ tiếng Séc đáng chú ý vì tiếng Séc sử dụng một tập hợp dấu phụ phong phú: dấu háček (caron), dấu sắc. Các ký tự như c, r, z, s có dấu được coi là khác biệt với dạng cơ bản.

  • Dấu phụ: Thiết yếu và mang ý nghĩa. Bỏ dấu phụ sẽ tạo ra sự nhập nhằng.
  • Rủi ro triển khai: Phần mềm chuẩn hóa Unicode quá mạnh (bỏ dấu, chuyển sang ASCII) sẽ làm hỏng seed phrase tiếng Séc. Đây là rủi ro lớn nhất với danh sách từ không phải tiếng Anh.

Tiếng Bồ Đào Nha

Danh sách tiếng Bồ Đào Nha là bổ sung gần đây nhất vào đặc tả BIP39 chính thức. Nó sử dụng dấu phụ phổ biến trong tiếng Bồ Đào Nha (dấu ngã, dấu sắc, dấu mũ) và cố gắng trung lập giữa tiếng Bồ Đào Nha Brazil và châu Âu.

Tác Động Tương Thích: Gắn Bó Với Một Ngôn Ngữ

Đây là bài học thực tế quan trọng nhất từ toàn bộ hướng dẫn này: lựa chọn danh sách từ của bạn là cam kết vĩnh viễn. Seed phrase được tạo bằng danh sách từ tiếng Nhật không thể khôi phục bằng danh sách từ tiếng Anh. Các từ không phải là bản dịch của nhau --- chúng là ánh xạ hoàn toàn khác nhau từ cùng entropy nhị phân sang các chuỗi từ khác nhau.

Ánh Xạ Phụ Thuộc Ngôn Ngữ

Khi ví tạo seed phrase, nó lấy 128 hoặc 256 bit entropy, tính checksum, chia kết quả thành các đoạn 11 bit, và tra cứu mỗi đoạn trong danh sách từ. Chỉ mục từ 0 trong danh sách tiếng Anh là "abandon." Chỉ mục từ 0 trong danh sách tiếng Nhật là một từ hoàn toàn khác. Dữ liệu nhị phân giống nhau; biểu diễn mà con người đọc được thì khác nhau.

Điều này có nghĩa:

  • Bạn không thể trộn lẫn các từ từ các danh sách khác nhau.
  • Bạn không thể "dịch" seed phrase bằng cách tra cứu chỉ mục của mỗi từ và tìm từ tương ứng trong ngôn ngữ khác.
  • Thực tế, bạn có thể thực hiện việc dịch đó một cách máy móc (tra cứu chỉ mục của mỗi từ tiếng Anh, rồi tìm từ tại cùng chỉ mục trong danh sách tiếng Nhật), và kết quả sẽ là seed phrase tiếng Nhật hợp lệ tạo ra cùng ví. Nhưng không phần mềm ví tiêu chuẩn nào cung cấp tính năng này, và làm thủ công rất dễ sai.

Hỗ Trợ Ví Không Phổ Quát

Trong khi tiếng Anh được hỗ trợ bởi mọi ví tương thích BIP39, các danh sách không phải tiếng Anh có mức hỗ trợ khác nhau:

Ngôn ngữ Mức hỗ trợ ví
Tiếng Anh Phổ quát
Tiếng Nhật Rộng (các ví lớn)
Trung Quốc Giản Thể Trung bình (ví vùng CJK)
Trung Quốc Phồn Thể Trung bình (ví vùng CJK)
Tiếng Hàn Hạn chế
Tiếng Tây Ban Nha Trung bình
Tiếng Pháp Trung bình
Tiếng Ý Hạn chế đến Trung bình
Tiếng Séc Hạn chế
Tiếng Bồ Đào Nha Hạn chế

Nếu bạn tạo seed phrase bằng danh sách từ tiếng Séc rồi cần khôi phục nó 5 năm sau trên ví phần cứng chỉ hỗ trợ tiếng Anh, bạn sẽ bế tắc. Giải pháp duy nhất là tìm phần mềm hỗ trợ BIP39 tiếng Séc, khôi phục ví, và chuyển tiền sang ví mới được tạo bằng danh sách tiếng Anh.

Chuẩn Hóa Unicode

Danh sách từ không phải tiếng Anh đưa chuẩn hóa Unicode trở thành điểm có thể gây lỗi. Đặc tả BIP39 yêu cầu chuẩn hóa NFKD (Normalization Form Compatibility Decomposition) trước khi mnemonic được đưa vào PBKDF2. Điều này đặc biệt liên quan đến:

  • Khoảng trắng tượng hình (tiếng Nhật): Ký tự khoảng trắng giữa các từ tiếng Nhật nên là U+3000, không phải khoảng trắng ASCII (U+0020). Một số ví sử dụng cái này, một số sử dụng cái kia. Nếu bước chuẩn hóa xử lý sai, seed được tạo ra sẽ khác.
  • Ký tự có dấu (tiếng Pháp, Tây Ban Nha, Séc, Bồ Đào Nha): Một ký tự có dấu có thể được biểu diễn dưới dạng một codepoint Unicode duy nhất hoặc ký tự cơ bản + dấu kết hợp. Chuẩn hóa NFKD được cho là giải quyết vấn đề này, nhưng vẫn tồn tại các triển khai có lỗi.
  • Biến thể ký tự Trung Quốc: Một số ký tự Trung Quốc có nhiều biểu diễn Unicode. Danh sách từ sử dụng dạng chuẩn, nhưng đầu vào của người dùng có thể sử dụng dạng biến thể.

Những vấn đề này hiếm gặp, nhưng khi xảy ra, chúng mang tính thảm khốc. Seed phrase của bạn trông đúng, nhưng nó tạo ra ví khác vì sự khác biệt Unicode không nhìn thấy được.

Khuyến Nghị

Trừ khi bạn có lý do thuyết phục để sử dụng danh sách từ không phải tiếng Anh, hãy sử dụng tiếng Anh. Nó có sự hỗ trợ ví phổ quát, không có biến chứng dấu phụ, và không có cạm bẫy chuẩn hóa Unicode. Danh sách từ tiếng Anh đã được kiểm nghiệm thực tế qua hàng triệu ví trong hơn một thập kỷ.

Nếu bạn chọn danh sách không phải tiếng Anh, hãy ghi lại danh sách nào bạn đã sử dụng cùng với bản sao lưu seed phrase. Lưu trữ một bản sao của chính danh sách từ (tất cả 2.048 từ) cùng bản sao lưu. Và kiểm tra khôi phục trên ít nhất hai ví khác nhau trước khi tin tưởng thiết lập với số tiền đáng kể.

Tra Cứu Từ BIP39 Của SafeSeed

Các công cụ tạo seed phrase của SafeSeed --- cho Bitcoin, EthereumSolana --- sử dụng danh sách từ BIP39 tiếng Anh theo mặc định, đảm bảo khả năng tương thích tối đa giữa các ví và thiết bị phần cứng.

Các công cụ hiển thị mỗi từ được tạo cùng với chỉ mục trong danh sách từ BIP39 (0--2.047). Sự minh bạch này cho phép bạn xác minh rằng ánh xạ từ-sang-chỉ-mục là chính xác và đối chiếu với danh sách từ BIP39 tiếng Anh chính thức được công bố trong kho BIP của Bitcoin.

Tất cả quá trình tạo diễn ra hoàn toàn trong trình duyệt sử dụng Web Crypto API làm nguồn entropy. Không tra cứu danh sách từ, không dữ liệu seed, và không private key nào rời khỏi thiết bị của bạn. Bạn có thể ngắt kết nối internet trước khi tạo và làm việc trong sự cô lập hoàn toàn. Để hiểu sâu hơn tại sao điều này quan trọng, xem An Toàn Khi Sử Dụng Online Seed Generator.

Hệ thống danh sách từ BIP39 là một trong những thành phần được thiết kế chu đáo nhất của hạ tầng tiền mã hóa. Nó biến đổi entropy nhị phân thô thành thứ mà con người có thể viết trên một tờ giấy, đọc lại mà không sai, và sử dụng để khôi phục ví nhiều năm sau trên phần cứng chưa được phát minh. Sự có sẵn của 10 tùy chọn ngôn ngữ khiến hệ thống này trở nên dễ tiếp cận trên toàn thế giới. Nhưng khả năng tiếp cận đó đi kèm với trách nhiệm: chọn ngôn ngữ một cách có chủ đích, hiểu các hệ quả tương thích, và giữ chiến lược sao lưu phù hợp với hệ sinh thái ví mà bạn dựa vào.