《计算机视觉中的数学方法》

2015-11-30

s/math_for_CV.jpg

    

   过了好久我才来补充的记录一下学习的感受。我从年初开始准备CV的学习材料的时候就查到了这本书。起初,我看这本书是国内的人写的,感觉其可能没有国外著名大学的教材好,就没买。后来发现的确没有这方面的材料,就买了一本。现在看来是我错了,作者的确很牛掰,最早做数学研究,后来做人工智能,目前在做计算机视觉和图像处理。看起来越来越偏向应用,实践性越强。相信作者前期的数学能力让他在后续的工作中如鱼得水般自在。
   实际上这本书里面有很多东西我看不懂,有三个Part,我也只重点看了前两个part:射影几何、矩阵与张量。第三part 的模型估计讲的都是数学上的计算方式,我看不懂,也不知道如何应用,基本上略过了。“一切几何皆摄影几何”。相比于我们在高中学习过的欧氏几何,摄影几何更加具有广泛意义。必然导致我理解起来更费劲了。这本书仅仅涉及从图像中提取三维信息用到的几何知识。我并不认为我以后的工作中会单纯的使用RGB摄像头来进行场景重建。我仅仅想知道 how far can we go 这样的问题的答案,单纯使用二维图像提取三维信息的极限在哪里。前一段时间听这边做渲染的同学说有人在用一组RGB摄像头来对人身体进行模型重建,我有点吃惊,用这种从二维图片中重建三维场景需要多大的计算量、有多少限制?编码起来得多复杂啊?我现在还是倾向于有depth camera来做场景重建,加上其他的各种能够用上的sensor,这种方式应该是最简单、容易实现。
   我不能在视觉方面的学习做什么推荐了,我本来就非专业,再者花费的时间并不充足,我的数学根基更是需要加强,我只从一个侧面来评价一下吧:能从低层次的数学分析CV的材料并不多,说明作者的确想让学习者更加从本质上看待CV中的问题,实为难得。况且这本书是硬皮书,拿在手里很有质感呦。
如果有任何意见,欢迎留言讨论。


[ 主页 ]
COMMENTS
POST A COMMENT

(optional)



(optional)