如何使用自定义字母集进行 base64 编码?

安全

我正在尝试使用 python3 中的自定义字符集进行 base64 编码。我在 SO 中看到的大多数示例都与 Python 2 相关,因此我不得不对代码进行一些小的调整。我现在面临的问题是,我替换的字符/_,但它仍然与印刷/我的代码是:这只是一个例子,我不想只使用 urlsafe 字符的 base64。custom可以是任何长度正确的东西。

import base64

data = 'some random? data'
print(base64.b64encode(data.encode()))

std_base64chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
custom = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-_"

data = data.translate(str.maketrans(custom, std_base64chars)).encode()

print(base64.b64encode(data))

# Both prints
b'c29tZSByYW5kb20/IGRhdGE='
b'c29tZSByYW5kb20/IGRhdGE='

我怎样才能让翻译工作,以便/正确地替换_?

编辑

我应该明确指出,我并不是要在这里只执行一种类型的 base64 编码,例如 urlsafe,而是任何可能的字符集。这将是一个函数,用户可以传递他们自己的字符集。我正在寻找一个字符一个字符的映射,而不是字符串切片。

编辑

因为我的问题的清晰度有些混乱,所以我尝试添加更多细节。

我正在尝试编写一个可以从用户那里获取任意字符集的函数,然后在 base64 编码之前单独映射它们。大多数答案都是围绕操作altchars或字符串切片和替换,但这并不能解决所有需求。

例如,itoa64 字符集是:./0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz=或 unix crypt 格式是./0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz. 答案虽然正确,但并未解决这些情况。

CDJB

如果您要切换的唯一字符是+and \,则可以使用base64.urlsafe_b64encode分别替换为-_

>>> base64.urlsafe_b64encode(data.encode())
b'c29tZSByYW5kb20_IGRhdGE='

或者,您可以使用base64.b64encode的可选参数将这些字符替换为您自己选择的字符

>>> base64.b64encode(data.encode(), '*&'.encode())
b'c29tZSByYW5kb20&IGRhdGE='

如果您需要使用全新的字母表,您可以这样做

import base64

data = 'some random? data'
print(base64.b64encode(data.encode()))

std_base64chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
custom = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_"


x = base64.b64encode(data.encode())
print(bytes(str(x)[2:-1].translate(str(x)[2:-1].maketrans(std_base64chars, custom)), 'utf-8'))

哪些输出:

b'c29tZSByYW5kb20/IGRhdGE='
b'C29TzsbYyw5KB20_igrHDge='

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章