一种基于unicode和OCR的过审技巧

已知,字形相近但是大小、形状不完全相同的文字在unicode中的编码是不同的,但过审后人眼结合上下文很容易就能看出来要表达的是什么。

那么通过对敏感词中的字母文字进行替换,可以增加审查系统的工作量,即使最后过不了审,也可以极大消损审查系统所依附的硬件。

举几个常见的例子,
字母A,在拉丁字母、西里尔字母、希腊字母中,就有
ÀÁÂÃÄÅĀ这么多相近表示
那么党的英文party,就可以有
PĀRTY
PÅRTY
PÄRTY
等等表示

字母C有
Ç℃这么多近似的表示,就可以有
℃PC
ÇP℃
等表示

文字才有
日本假名ォ,就可以有
徐ォ厚这样的表示
0
分享 2026-02-22

7 个评论

>> 有的输入法支持“火星文”,效果就类似。不过其实也很好破,关键字对比是最简单的审查方式,无非是把...


正则表达式:

徐[才ォ]厚
[pP][aÀÁÂÃÄÅĀ][rR][tT][yY]

要发言请先登录注册

要发言请先登录注册

发起人

习禁评镜像版——习畅言

状态

  • 最新活动: 2026-02-23
  • 浏览: 1444