我正在尝试使用 python3 中的自定义字符集进行 base64 编码。我在 SO 中看到的大多数示例都与 Python 2 相关,因此我不得不对代码进行一些小的调整。我现在面临的问题是,我替换的字符/
用_
,但它仍然与印刷/
。我的代码是:这只是一个例子,我不想只使用 urlsafe 字符的 base64。custom
可以是任何长度正确的东西。
import base64
data = 'some random? data'
print(base64.b64encode(data.encode()))
std_base64chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
custom = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-_"
data = data.translate(str.maketrans(custom, std_base64chars)).encode()
print(base64.b64encode(data))
# Both prints
b'c29tZSByYW5kb20/IGRhdGE='
b'c29tZSByYW5kb20/IGRhdGE='
我怎样才能让翻译工作,以便/
正确地替换_
?
我应该明确指出,我并不是要在这里只执行一种类型的 base64 编码,例如 urlsafe,而是任何可能的字符集。这将是一个函数,用户可以传递他们自己的字符集。我正在寻找一个字符一个字符的映射,而不是字符串切片。
因为我的问题的清晰度有些混乱,所以我尝试添加更多细节。
我正在尝试编写一个可以从用户那里获取任意字符集的函数,然后在 base64 编码之前单独映射它们。大多数答案都是围绕操作altchars
或字符串切片和替换,但这并不能解决所有需求。
例如,itoa64 字符集是:./0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz=
或 unix crypt 格式是./0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
. 答案虽然正确,但并未解决这些情况。
如果您要切换的唯一字符是+
and \
,则可以使用base64.urlsafe_b64encode分别替换为-
和_
。
>>> base64.urlsafe_b64encode(data.encode())
b'c29tZSByYW5kb20_IGRhdGE='
或者,您可以使用base64.b64encode的可选参数将这些字符替换为您自己选择的字符:
>>> base64.b64encode(data.encode(), '*&'.encode())
b'c29tZSByYW5kb20&IGRhdGE='
如果您需要使用全新的字母表,您可以这样做
import base64
data = 'some random? data'
print(base64.b64encode(data.encode()))
std_base64chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
custom = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_"
x = base64.b64encode(data.encode())
print(bytes(str(x)[2:-1].translate(str(x)[2:-1].maketrans(std_base64chars, custom)), 'utf-8'))
哪些输出:
b'c29tZSByYW5kb20/IGRhdGE='
b'C29TzsbYyw5KB20_igrHDge='
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句