审查

一种基于unicode和OCR的过审技巧

已知，字形相近但是大小、形状不完全相同的文字在unicode中的编码是不同的，但过审后人眼结合上下文很容易就能看出来要表达的是什么。

那么通过对敏感词中的字母文字进行替换，可以增加审查系统的工作量，即使最后过不了审，也可以极大消损审查系统所依附的硬件。

举几个常见的例子，
字母A，在拉丁字母、西里尔字母、希腊字母中，就有
ÀÁÂÃÄÅĀ这么多相近表示
那么党的英文party，就可以有
PĀRTY
PÅRTY
PÄRTY
等等表示

字母C有
Ç℃这么多近似的表示，就可以有
℃PC
ÇP℃
等表示

文字才有
日本假名ォ，就可以有
徐ォ厚这样的表示

0

分享 2026-02-22

7 个评论

rowlandheights 回复天下无贼

>> 有的输入法支持“火星文”，效果就类似。不过其实也很好破，关键字对比是最简单的审查方式，无非是把...

正则表达式：

徐[才ォ]厚
[pP][aÀÁÂÃÄÅĀ][rR][tT][yY]

要发言请先登录或注册

一种基于unicode和OCR的过审技巧

7 个评论

发起人

相关主题

状态

一种基于unicode和OCR的过审技巧

7 个评论

发起人

相关主题

推荐

状态