奥卡姆剃刀老师最新作品:华为拍月亮用的是“压缩感知”
华为拍月亮用的是“压缩感知”
最近某测评机构的一个人员指责华为P30拍月亮造假,被揭露是搞不清算法和PS的区别闹出了乌龙,该机构为了避免法律风险紧急止损,宣布将该测试人员开除。
这个事件虽然告一段落,但争论依然持续,原因就是人们对于新技术并不理解,以至于颇有些人认为那个测评人士冤枉。
这场争论这涉及到两个技术问题,一是什么才是照相中的“真”,二是压缩后的照片能否还原出原始信息。
1.什么才是照相中的“真”?
华为的手机照相现在是公认的全球第一,其历史性突破源于P20。去年4月12日我在上海参加了P20发布会,我拿到样机后在上海的街头拍了一些夜景,成像非常漂亮。
后来琢磨明白了原理,其夜景曝光长达6秒钟,加上脚架可以选择30秒曝光,其实相机已经拍了上千张照片,然后根据这些照片而呈现出的特性,对着上千张照片的细节进行加权融合。
对霓虹灯等太亮的东西进行压缩,对昏暗的细节进行提亮,使得对比度和层次感大大提升,画面变得非常漂亮,这是一般单反相机所不能达到的。后来我当面跟@华为何刚 做了交流,他认同我的理解。
有人认为这种做法就不“真”了,其实这是对传统机械曝光相机成像的一种执念,认为那才是真。
实际上传统相机短时曝光所成的像,跟人眼连续观察成像是非常不同的。相对来说,华为P20手机拍摄的夜景,与人眼所看到的情况更加一致,这是因为人工智能拟合了人脑的认知。
前几天我在以色列特拉维夫旅行,中国网络安全代表团正在特拉维夫参加国际标准化组织的会议,一位代表团成员来宾馆看我,我们一起在海边用P20pro照了张合影。
夜里10点无闪光灯5秒曝光后AI合成,与当时肉眼的观察很接近,如果用单反相机加闪光灯的话,景色就不会这么真实。
传统相机的极短曝光成像就是真?这其实是个笑话,人工智能算法处理的相片更接近人眼所看到的真实。
2.有损压缩后能否还原原始信息?
我们通常认为,图像模糊后就不可能还原了,因为模糊是一种有损压缩,信息已经丢了,怎么可能还原呢?除非凭空编造。
10年前出现了一门叫做“压缩感知”的图像处理技术,成功地用于用B超检查。B超扫描人体内部的模糊图像,经过某种算数学算法后居然变得非常清楚,这是一个非常重要的理论突破。
8年前我在微博上频繁跟@数学文化 互动,他每周都要出一道数学题,当时我抢着做经常以最快速度提交答案,得到了这位老师的肯定,他就是中国科学院院士汤涛。
我曾在科学松鼠会内部参加校对过一篇关于“压缩感知”的文章,汤院士非常感兴趣,刊登在了他任主编的《数学文化》刊物上。
我也就图像数据的压缩写了科普文章,这篇文章还被收录到最新版的《十万个为什么》。
铺垫太多了,言归正传。“压缩感知”的理论基础就是先验概率不均衡。这该怎么理解呢?
例如我们看一个民国美女的黑白照片,她的嘴唇呈现了一种灰度。如果我们用黑白相机照红绿蓝三种颜色,都会呈现出相同的这种灰度。
而美女嘴唇是红色的先验概率,要远远大于嘴唇是蓝绿色的先验概率,所以我们就可以将这种特定的灰色度还原成红色。
这是无中生有的PS吗?不是!这是一种概率分析。
用华为P30拍摄月亮的环形坑也是如此,拍的结果是模模糊糊的,但这并不是终止,有1000种形态经过模糊拍照后会达成现在这种状态,而在这1000种形态中,有一种的先验概率远远高于其他9999种,那么我们就有理由将这个模糊的环形山状态还原成那个高概率的清晰形态。这不是作假也不是PS,这就是概率分析算法,这就是压缩感知技术。
一般华为手机发布会都会邀请我去参观的,作为专业人士,我的理解比普通公众更深刻,作为第三方的专业声音,也更令网友们接受。
很遗憾,这次P30发布会我没有收到邀请,也就丧失了跟华为P30相关人士深入探讨的机会,因此我上述的观点更多的出自于我对技术理论的理解,未必完全正确,还请各位内行批评指正。
原博
最近某测评机构的一个人员指责华为P30拍月亮造假,被揭露是搞不清算法和PS的区别闹出了乌龙,该机构为了避免法律风险紧急止损,宣布将该测试人员开除。
这个事件虽然告一段落,但争论依然持续,原因就是人们对于新技术并不理解,以至于颇有些人认为那个测评人士冤枉。
这场争论这涉及到两个技术问题,一是什么才是照相中的“真”,二是压缩后的照片能否还原出原始信息。
1.什么才是照相中的“真”?
华为的手机照相现在是公认的全球第一,其历史性突破源于P20。去年4月12日我在上海参加了P20发布会,我拿到样机后在上海的街头拍了一些夜景,成像非常漂亮。
后来琢磨明白了原理,其夜景曝光长达6秒钟,加上脚架可以选择30秒曝光,其实相机已经拍了上千张照片,然后根据这些照片而呈现出的特性,对着上千张照片的细节进行加权融合。
对霓虹灯等太亮的东西进行压缩,对昏暗的细节进行提亮,使得对比度和层次感大大提升,画面变得非常漂亮,这是一般单反相机所不能达到的。后来我当面跟@华为何刚 做了交流,他认同我的理解。
有人认为这种做法就不“真”了,其实这是对传统机械曝光相机成像的一种执念,认为那才是真。
实际上传统相机短时曝光所成的像,跟人眼连续观察成像是非常不同的。相对来说,华为P20手机拍摄的夜景,与人眼所看到的情况更加一致,这是因为人工智能拟合了人脑的认知。
前几天我在以色列特拉维夫旅行,中国网络安全代表团正在特拉维夫参加国际标准化组织的会议,一位代表团成员来宾馆看我,我们一起在海边用P20pro照了张合影。
夜里10点无闪光灯5秒曝光后AI合成,与当时肉眼的观察很接近,如果用单反相机加闪光灯的话,景色就不会这么真实。
传统相机的极短曝光成像就是真?这其实是个笑话,人工智能算法处理的相片更接近人眼所看到的真实。
2.有损压缩后能否还原原始信息?
我们通常认为,图像模糊后就不可能还原了,因为模糊是一种有损压缩,信息已经丢了,怎么可能还原呢?除非凭空编造。
10年前出现了一门叫做“压缩感知”的图像处理技术,成功地用于用B超检查。B超扫描人体内部的模糊图像,经过某种算数学算法后居然变得非常清楚,这是一个非常重要的理论突破。
8年前我在微博上频繁跟@数学文化 互动,他每周都要出一道数学题,当时我抢着做经常以最快速度提交答案,得到了这位老师的肯定,他就是中国科学院院士汤涛。
我曾在科学松鼠会内部参加校对过一篇关于“压缩感知”的文章,汤院士非常感兴趣,刊登在了他任主编的《数学文化》刊物上。
我也就图像数据的压缩写了科普文章,这篇文章还被收录到最新版的《十万个为什么》。
铺垫太多了,言归正传。“压缩感知”的理论基础就是先验概率不均衡。这该怎么理解呢?
例如我们看一个民国美女的黑白照片,她的嘴唇呈现了一种灰度。如果我们用黑白相机照红绿蓝三种颜色,都会呈现出相同的这种灰度。
而美女嘴唇是红色的先验概率,要远远大于嘴唇是蓝绿色的先验概率,所以我们就可以将这种特定的灰色度还原成红色。
这是无中生有的PS吗?不是!这是一种概率分析。
用华为P30拍摄月亮的环形坑也是如此,拍的结果是模模糊糊的,但这并不是终止,有1000种形态经过模糊拍照后会达成现在这种状态,而在这1000种形态中,有一种的先验概率远远高于其他9999种,那么我们就有理由将这个模糊的环形山状态还原成那个高概率的清晰形态。这不是作假也不是PS,这就是概率分析算法,这就是压缩感知技术。
一般华为手机发布会都会邀请我去参观的,作为专业人士,我的理解比普通公众更深刻,作为第三方的专业声音,也更令网友们接受。
很遗憾,这次P30发布会我没有收到邀请,也就丧失了跟华为P30相关人士深入探讨的机会,因此我上述的观点更多的出自于我对技术理论的理解,未必完全正确,还请各位内行批评指正。
原博
8 个评论

啰里八嗦说了半天本质还是[后期ps]嘛。舔菊花舔出新高度,可惜”奥卡姆剃刀“这个好名字。

我被数学虐的很惨!
不多谈!
不多谈!
这是无中生有的PS吗?不是!这是有中生有的PS!再戴个“概率分析”、“压缩感知技术”等专业名词的帽子,很多人不就被忽悠得一愣一愣的,开始认可华为手机拍照的后期PS。
堂而皇之的造假都可以洗白,可以期待未来的P40直接拍黑洞了。
我记得陶哲轩在稀疏矩阵和 compressed sensing 做过一些东西,倒是蛮有趣的。
“前几天我在以色列特拉维夫旅行,中国网络安全代表团正在特拉维夫参加国际标准化组织的会议,一位代表团成员来宾馆看我,我们一起在海边用P20pro照了张合影。”奥老师一贯的不经意的炫耀
“8年前我在微博上频繁跟@数学文化 互动,他每周都要出一道数学题,当时我抢着做经常以最快速度提交答案,得到了这位老师的肯定,他就是中国科学院院士汤涛。” 奥老师一贯的拉上别人来加成
“一般华为手机发布会都会邀请我去参观的,作为专业人士,我的理解比普通公众更深刻,作为第三方的专业声音,也更令网友们接受。很遗憾,这次P30发布会我没有收到邀请,也就丧失了跟华为P30相关人士深入探讨的机会” :奥老师一惯的疯狂暗示
“前几天我在以色列特拉维夫旅行,中国网络安全代表团正在特拉维夫参加国际标准化组织的会议,一位代表团成员来宾馆看我,我们一起在海边用P20pro照了张合影。”奥老师一贯的不经意的炫耀
“8年前我在微博上频繁跟@数学文化 互动,他每周都要出一道数学题,当时我抢着做经常以最快速度提交答案,得到了这位老师的肯定,他就是中国科学院院士汤涛。” 奥老师一贯的拉上别人来加成
“一般华为手机发布会都会邀请我去参观的,作为专业人士,我的理解比普通公众更深刻,作为第三方的专业声音,也更令网友们接受。很遗憾,这次P30发布会我没有收到邀请,也就丧失了跟华为P30相关人士深入探讨的机会” :奥老师一惯的疯狂暗示
奥学已成显学
#美顏不是修圖

压缩感知类似预置字典,应当理解成一种来自机器的主观视角。和人的“脑补”类似,机器会自动补上照片的细节信息以使它和经验相符。信息来自机器的经验而非照相,因此这确实丧失了相对的客观性,也就是不那么"真"了。作为专业人士却混淆了"客观的真实"和“人眼看到的真实”,忘了人眼看到的根本不是"真实",所谓非蠢即坏。
虽然照片本身不那么"真"了,是否“造假”还是得看那个活动是怎么规定的。不清楚。
虽然照片本身不那么"真"了,是否“造假”还是得看那个活动是怎么规定的。不清楚。