PHP日语字符串与Unicode的比较

BluBb_mADe 发表于 Dev

BluBb_mADe

我已经看到了多个与此问题有关的主题，但是没有一个主题在PHP中得到解决。我必须在数据库中找到一个字符串。问题是我要查找的字符串是日语编码的，即使它们相等也与数据库条目不匹配。

搜索字符串：

Ｆｒｅｅ！

数据库中的字符串：

Free!

编辑：这两个字符串都以UTF-8编码。您可以清楚地看到它们之间的区别。是否有可能从这两个字符串中识别平等？

如果没有解决问题的编程方法，有人知道我可以用来手动转换字符串的字符数据库吗？

你好

BluBb_mADe

苗家ris

尝试使用此功能（或类似的想法...）首先将全角（“日语”）字母转换为半角（这是我们每天看到的普通字母）。希望这可以帮助。:)

function makeSemiWidth($str) 
{ 
$arr = array('０' => '0', 
             '１' => '1', 
             '２' => '2', 
             '３' => '3', 
             '４' => '4', 
             '５' => '5',  
             '６' => '6',  
             '７' => '7',  
             '８' => '8',  
             '９' => '9',  
             'Ａ' => 'A',  
             'Ｂ' => 'B',  
             'Ｃ' => 'C',  
             'Ｄ' => 'D',  
             'Ｅ' => 'E', 
             'Ｆ' => 'F',  
             'Ｇ' => 'G',  
             'Ｈ' => 'H',  
             'Ｉ' => 'I',  
             'Ｊ' => 'J',  
             'Ｋ' => 'K',  
             'Ｌ' => 'L',  
             'Ｍ' => 'M',  
             'Ｎ' => 'N',  
             'Ｏ' => 'O', 
             'Ｐ' => 'P',  
             'Ｑ' => 'Q',  
             'Ｒ' => 'R',  
             'Ｓ' => 'S',  
             'Ｔ' => 'T', 
             'Ｕ' => 'U',  
             'Ｖ' => 'V',  
             'Ｗ' => 'W',  
             'Ｘ' => 'X',  
             'Ｙ' => 'Y', 
             'Ｚ' => 'Z',  
             'ａ' => 'a',  
             'ｂ' => 'b',  
             'ｃ' => 'c',  
             'ｄ' => 'd', 
             'ｅ' => 'e',  
             'ｆ' => 'f',  
             'ｇ' => 'g',  
             'ｈ' => 'h',  
             'ｉ' => 'i', 
             'ｊ' => 'j',  
             'ｋ' => 'k',  
             'ｌ' => 'l',  
             'ｍ' => 'm',  
             'ｎ' => 'n', 
             'ｏ' => 'o',  
             'ｐ' => 'p',  
             'ｑ' => 'q',  
             'ｒ' => 'r',  
             'ｓ' => 's',  
             'ｔ' => 't',  
             'ｕ' => 'u',  
             'ｖ' => 'v',  
             'ｗ' => 'w',  
             'ｘ' => 'x',  
             'ｙ' => 'y',  
             'ｚ' => 'z', 
             '（' => '(',  
             '）' => ')',  
             '〔' => '[',  
             '〕' => ']',  
             '【' => '[', 
             '】' => ']',  
             '〖' => '[',  
             '〗' => ']',  
             '“' => '[',  
             '”' => ']', 
             '‘' => '[',  
             '\'' => ']',  
             '｛' => '{',  
             '｝' => '}',  
             '《' => '<', 
             '》' => '>', 
             '％' => '%',  
             '＋' => '+',  
             '—' => '-',  
             '－' => '-',  
             '～' => '-', 
             '：' => ':',  
             '。' => '.',  
             '、' => ',',  
             '，' => '.',  
             '、' => '.',  
             '；' => ',',  
             '？' => '?',  
             '！' => '!',  
             '…' => '-',  
             '‖' => '|',  
             '”' => '"',  
             '\'' => '`',  
             '‘' => '`',  
             '｜' => '|',  
             '〃' => '"','　 
             ' => ' '); 
return strtr($str, $arr); 
}

或者，您也可以尝试以相反的方式进行转换，此功能将能够从全角（“日语”）转换为半角（我们的英语），再从半角转换为全角。

<?PHP
function makeSemiWidth($str,$args2=1) { //halfwidth <-> fullwidth conversion function, set the 2nd parameter to 0 for converting halfwidth (English) to fullwidth (Japanese); set it to 1 for converting fullwidth to halfwidth
$DBC = Array(
'０' , '１' , '２' , '３' , '４' , 
'５' , '６' , '７' , '８' , '９' ,
'Ａ' , 'Ｂ' , 'Ｃ' , 'Ｄ' , 'Ｅ' , 
'Ｆ' , 'Ｇ' , 'Ｈ' , 'Ｉ' , 'Ｊ' ,
'Ｋ' , 'Ｌ' , 'Ｍ' , 'Ｎ' , 'Ｏ' , 
'Ｐ' , 'Ｑ' , 'Ｒ' , 'Ｓ' , 'Ｔ' ,
'Ｕ' , 'Ｖ' , 'Ｗ' , 'Ｘ' , 'Ｙ' , 
'Ｚ' , 'ａ' , 'ｂ' , 'ｃ' , 'ｄ' ,
'ｅ' , 'ｆ' , 'ｇ' , 'ｈ' , 'ｉ' , 
'ｊ' , 'ｋ' , 'ｌ' , 'ｍ' , 'ｎ' ,
'ｏ' , 'ｐ' , 'ｑ' , 'ｒ' , 'ｓ' , 
'ｔ' , 'ｕ' , 'ｖ' , 'ｗ' , 'ｘ' ,
'ｙ' , 'ｚ' , '－' , '　'  , '：' ,
'．' , '，' , '／' , '％' , '＃' ,
'！' , '＠' , '＆' , '（' , '）' ,
'＜' , '＞' , '＂' , '＇' , '？' ,
'［' , '］' , '｛' , '｝' , '＼' ,
'｜' , '＋' , '＝' , '＿' , '＾' ,
'￥' , '￣' , '｀'
);
$SBC = Array( //halfwidth
'0', '1', '2', '3', '4', 
'5', '6', '7', '8', '9',
'A', 'B', 'C', 'D', 'E', 
'F', 'G', 'H', 'I', 'J',
'K', 'L', 'M', 'N', 'O', 
'P', 'Q', 'R', 'S', 'T',
'U', 'V', 'W', 'X', 'Y', 
'Z', 'a', 'b', 'c', 'd',
'e', 'f', 'g', 'h', 'i', 
'j', 'k', 'l', 'm', 'n',
'o', 'p', 'q', 'r', 's', 
't', 'u', 'v', 'w', 'x',
'y', 'z', '-', ' ', ':',
'.', ',', '/', '%', '#',
'!', '@', '&', '(', ')',
'<', '>', '"', '\'','?',
'[', ']', '{', '}', '\\',
'|', '+', '=', '_', '^',
'$', '~', '`'
);
if($args2==0)
return str_replace($SBC,$DBC,$str);  //halfwidth -> fullwidth
if($args2==1)
return str_replace($DBC,$SBC,$str);  //fullwidth -> halfwidth
else
return false;
}
/*
$str = "alskdf";
echo $str;
echo "<br>";
echo makeSemiWidth($str,0);
echo makeSemiWidth($str,1);
*/
?>

您可能还想使用正则表达式来做到这一点，

$str = preg_replace('/\xa3([\xa1-\xfe])/e', 'chr(ord(\1)-0x80)', $str);

\ xa3 [\ xa1- \ xfe]代表GB2312全角（“日语”）字符集，我们接受它并减去第二个字节0x80（十进制为128），这给出了相应的半角字符（我们的普通英语）。

但是，使用UTF-8编码有时将无法正常工作。因此，我们需要先将其转换为GBK，为此，请使用下面的代码，

$str = iconv('utf-8', 'gbk//IGNORE', $str);

// IGNORE用于忽略UTF-8中存在的某些特殊的有趣字符，但GBK中不存在。

因此，如果我们将它们放在一起，结果将会到来。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-6

我来说两句

0 条评论

登录后参与评论

PHP字符串中的Unicode字符

检测Java字符串中的日语字符

如何通过ajax从php接收unicode字符串

numpy中的Unicode逐元素字符串比较

php json请求：json_decode Unicode字符串

问题比较日语字符

如何在PHP中比较日期和字符串

比较数组与字符串PHP

字符串比较，与PHP顺序无关

JS拆分为日语字符串

在Python中将字符串解码为日语字符

比较unicode字符串和字节字符串

如何从unicode字符串中获取单个字符并进行比较，打印？

Django模板unicode字符串比较

PHP中字符串“ 0”的比较

字符串比较无法使用php

两个unicode字符串的无用比较

PHP多字符串比较

PHP比较字符串错误

PHP-将字符串转换为unicode

比较字符串

如何将字符串与unicode词典进行比较？

解决文件中unicode输入字符串与unicode数据的比较

基于通配符的PHP字符串比较

如何正确比较PHP中的字符串和整数？

PHP字符串与特殊字母的比较

比较 PHP 中的 2 个字符串

在python中比较字符串与unicode字符

字符串与字符串的比较

TOP 榜单

文章

PHP日语字符串与Unicode的比较

PHP日语字符串与Unicode的比较

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用