计算机视觉:模型.学习和推理/(英)西蒙J.D.普林斯
作 者:(英)西蒙J.D.普林斯
定 价:119
出 版 社:机械工业出版社
出版日期:(咨询特价)-01
页 数:442
装 帧:平装
ISBN:28
●目录Computer Vision:Models,Learning,and Inference译者序译者简介序前言**章绪论111本书结构212其他书籍4**部分概率第2章概率概述621随机变量622联合概率723边缘化724条件概率825贝叶斯公式926独立性927期望10讨论10备注11习题11第3章常用概率分布1231伯努利分布1332贝塔分布1333分类分布1434狄利克雷分布1435一正态分布1536正态逆伽马分布1537多正态分布1638正态逆维希特分布1639共轭性17总结18备注18习题18第4章拟合概率模型2141*大似然法2142*大后验法2143贝叶斯方法2244算例1:一正态分布22441*大似然估计22442*大后验估计24443贝叶斯方法2645算例2:分类分布28451*大似然法28452*大后验法29453贝叶斯方法30总结31备注31习题32第5章正态分布3451协方差矩阵的形式3452协方差分解3553变量的线性变换3654边缘分布3655条件分布3756正态分布的乘积3857变量改变38总结38备注39习题39第二部分机器视觉的机器学习第6章视觉学习和推理4261计算机视觉问题4262模型的种类42621判别模型43622生成模型4363示例1:回归43631判别模型44632生成模型4464示例2:二值分类46641判别模型46642生成模型4665应该用哪种模型4866应用49661皮肤检测49662背景差分50总结51备注51习题52第7章复杂数据密度建模5471正态分类模型5472隐变量5673期望*大化5774混合高斯模型58741混合高斯边缘化59742基于期望*大化的混合模型拟合5975t分布63751学生t分布边缘化64752拟合t分布的期望*大化6576因子分析67761因子分析的边缘分布68762因子分析学习的期望*大化6877组合模型7178期望*大化算法的细节71781期望*大化算法的下界73782E步74783M步7479应用75791人脸检测75792目标识别76793分割77794正脸识别78795改变人脸姿态(回归)78796作为隐变量的变换79总结80备注80习题81第8章回归模型8281线性回归82811学习83812线性回归模型的问题8382贝叶斯线性回归84821实际考虑85822拟合方差8683非线性回归87831*大似然法87832贝叶斯非线性回归8984核与核技巧8985高斯过程回归9086稀疏线性回归9187二线性回归9388相关向量回归9589多变量数据回归96810应用968101人体姿势估计968102位移专家97讨论98备注98习题98第9章分类模型10091逻辑回归100911学习:*大似然估计102912逻辑回归模型的问题10392贝叶斯逻辑回归104921学习104922推理10693非线性逻辑回归10794对偶逻辑回归模型10895核逻辑回归11096相关向量分类11197增量拟合和boosting11398分类树11699多分类逻辑回归117910随机树、随机森林和随机蕨分类器118911与非概率模型的119912应用1209121性别分类1209122脸部和行人检测1219123语义分割1229124恢复表面布局1239125人体部位识别124讨论125备注125习题127第三部分连接局部模型**0章图模型130101条件独立性130102有向图模型1311021示例11321022示例21321023示例31331024总结134103无向图模型1341031示例11351032示例2136104有向图模型与无向图模型的对比136105计算机视觉中的图模型137106含有多个未知量的模型推理1391061求*大后验概率的解1391062求后验概率分布的边缘分布1391063*大化边缘1401064后验分布的采样140107样本采样1401071有向图模型的采样1411072无向图模型的采样141108学习1421081有向图模型的学习1421082无向图模型的学习143讨论145备注145习题145**1章链式模型和树模型147111链式模型1481111有向链式模型1481112无向链式模型1481113模型的等价性1481114隐马尔可夫模型在手语中的应用149112链式MAP推理149113树的MAP推理152114链式边缘后验推理1551141求解边缘分布1551142前向后向算法1561143置信传播1571144链式模型的和积算法158115树的边缘后验推理160116链式模型和树模型的学习161117链式模型和树模型之外的东西161118应用1631181手势跟踪1631182立体视觉1641183形象化结构1661184分割167讨论167备注168习题169**2章网格模型172121马尔可夫随机场1721211网格示例1731212离散成对MRF图像去噪174122二值成对马尔可夫随机场的MAP推理1751221*大流/*小割1761222MAP推理:二值变量177123多标签成对MRF的MAP推理182124非凸势的多标签MRF186125条件随机场189126高阶模型190127网格有向模型190128应用1911281背景差分1911282交互式分割1921283立体视觉1931284图像重排1931285超分辨率1951286纹理合成1961287合成新面孔197讨论198备注198习题200第四部分预处理**3章图像预处理与特征提取204131逐像素变换2041311白化2041312直方图均衡化2051313线性滤波2061314局部二值模式2101315纹理基映射211132边缘、角点和兴趣点2121321Canny边缘检测器2121322Harris角点检测器2141323SIFT检测器215133描述子2161331直方图2161332SIFT描述子2161333方向梯度直方图2171334词袋描述子2181335形状内容描述子218134降维2191341单数值近似2201342主成分分析2211343二主成分分析2211344K均值算法222结论223备注223习题224第五部分几何模型**4章机228141机简介2281411归一化摄像机2291412焦距参数2301413偏移量和偏移参数2301414摄像机的位置与方向2311415全机模型2321416径向畸变232142三个几何问题2331421问题1:学习外在参数2331422问题2:学习内在参数2341423问题3:推理3D世界点2351424解决问题235143齐次坐标236144学习外在参数237145学习内在参数239146推理3D世界点240147应用2411471结构光的深度2411472剪影重构243讨论245备注245习题246**5章变换模型249151二维变换模型2491511欧氏变换模型2491512相似变换模型2511513仿射变换模型2521514投影变换模型2521515增加不确定性254152变换模型中的学习2551521学习欧氏参数2551522学习相似参数2561523学习仿射参数2561524学习投影参数257153变换模型中的推理258154平面的三个几何问题2581541问题1:学习外在参数2581542问题2:学习内在参数2601543问题3:与摄像机相关的3D位置推理261155图像间的变换2611551单应性的几何特征2621552计算图像间的变换263156变换的鲁棒学习2641561RANSAC2641562连续RANSAC2651563PEaRL266157应用2681571增强现实追踪2681572视觉全景269讨论270备注270习题271**6章多摄像机系统273161双视图几何学理论2731611极线约束2741612极点274162实矩阵2751621实矩阵的属性2761622实矩阵的分解277163基础矩阵2791631基础矩阵的估计27916328点算法280164双视图重构的流程281165校正2841651平面校正2841652极面校正2861653校正后处理287166多视图重构287167应用2901671三维重构2901672图片浏览2911673立体图割292讨论293备注293习题294第六部分视觉模型**7章形状模型298171形状及其表示298172snake模型2991721推理3011722snake模型中存在的问题301173形状模板3021731推理3031732用迭代*近点算法进行推理304174统计形状模型3041741学习3051742推理306175子空间形状模型3061751概率主成分分析3071752学习3081753推理309176三维形状模型311177形状和外观的统计模型3111771学习3131772推理314178非高斯统计形状模型3151781回归PPCA3151782高斯过程隐变量模型316179铰接式模型3171710应用31917101三维形变模型31917102三维人体模型321讨论322备注322习题324**8章身份与方式模型326181子空间身份模型3281811学习3291812推理3311813在其他识别任务中的推理3321814身份子空间模型的局限性333182概率线性判别分析3341821学习3351822推理335183非线性身份模型336184非对称双线性模型3371841学习3391842推理339185对称双线性和多线性模型3411851学习3421852推理3431853多线性模型344186应用3441861人脸识别3441862纹理建模3451863动画合成346讨论346备注346习题348**9章时序模型349191时序估计框架3491911推理3501912学习350192卡尔曼滤波器3511921推理3511922改写测量合并阶段3521923推理总结3531924示例13531925示例23541926滤波3551927时序和测量模型3561928卡尔曼滤波器的问题358193扩展卡尔曼滤波器358194无损卡尔曼滤波器3601941状态演化3611942测量合并过程362195粒
内容简介
本书是一本从机器学习视角讲解计算机视觉的**好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的,以及如何如何研究这些来从新的图像数据中作出新的推理。本书要求少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也**有用。
前言Computer Vision:Models,Learning,and Inference目前,已有很多关于计算机视觉的书籍,那么还有必要再写另外一本吗?下面解释撰写本书的原因。 计算机视觉是一门工程学科,机器在现实世界中捕获的视觉信息可以激发我们的积极性。因此,我们通过使用计算机视觉解决现实问题来对我们的知识进行分类。例如,大多数视觉教科书都包含目标识别和立体视觉内容。我们的学术研讨会也是用同样的模式进行组织的。本书对这一传统方式提出了质疑:这真的是我们组织自己知识的正确方法吗?对于目标识别问题,目前已提出多种算法解决这一问题(例如子空间模型、boosting模型、语义包模型、星座模型等)然而,这些方法没有什么共同点。任何试图全面描述知识的壮举都会转变为一个非结构化的技术列表。我们怎样让新同学把所有的技术和理论都弄懂呢@我主张使用一种不同的方式来组织知识,但首先让我告诉大家我是如何看待计算机视觉问题的。 对于一幅图像,我们不仅要观察图像中的内容,同时还需要提取其测量值。例如,我们可以直接使用RGB值,或者对图像进行滤波处理,或者执行一些更复杂的预处理。计算机视觉的目标或者需要解决的问题是使用这些测量值来推理全局状态。例如:在立体视觉中,我们尝试推断出场景的深度。在目标识别中,我们尝试推断某一特定类目标存在与否。 为了实现目标,我们建立一个模型。模型描述了测量值与全局状态之间的一系列统计关系。这一系列统计关系中的特殊成员是由一个参数集合确定的。在学习的过程中,选择这些参数,以便它们能够准确反映测量值与全局状态之间的关系。在推理的过程中,选用一组新的测量值,并利用学习后的模型来推理全局状态。学习和推理的方法包含在算法中
......