资 源 简 介
由于数据在各个科学领域的增值,新兴的数据分析技术正在以难以置信的速度发展。大数据集目前通常在科学上用于激励发展数学技术和计算方法,用来帮助分析、解释和释疑数据在科学应用环境中的意义。本书的特定目的是集成标准的科学计算方法和数据分析技术。通过这种方式,本书还引入了统计学、时频分析和降维处理等方面的重要思想。全书共分四部分(26章),前三部分详细讲解各类数学运算与分析方法,第四部分重点讲解如何应用数学方法进行动态复杂系统分析与大数据处理。其中,第一部分讨论数学、矩阵分析和概率论的主要数据计算方法及结果可视化;第二部分讨论微分方程计算与建模;第三部分讨论各种数值分析与计算方法并进行比较,引入动态复杂内容简介由于数据在各个科学领域的增值,新兴的数据分析技术正在以难以置信的速度发展。大数据集目前通常在科学上用于激励发展数学技术和计算方法,用来帮助分析、解释和释疑数据在科学应用环境中的意义。本书的特定目的是集成标准的科学计算方法和数据分析技术。通过这种方式,本书还引入了统计学、时频分析和降维处理等方面的重要思想。全书共分四部分(26章),前三部分详细讲解各类数学运算与分析方法,第四部分重点讲解如何应用数学方法进行动态复杂系统分析与大数据处理。其中,第一部分讨论数学、矩阵分析和概率论的主要数据计算方法及结果可视化:第二部分讨论微分方程计算与建模:第三部分讨论各种数值分析与计算方法并进行比较,引入动态复杂系统概念;第四部分讲解复杂系统与大数据分析方法和处理模型的建立。该书适合作为本科生的参考阅读书籍,也适合作为科学计算分析等相关专业研究生的教材。从事数据计算分析方法、计算与建模等相关工作的研究者也能从中有所获益。Copyright o 2013 by J, Nathan Kutz.This translation of Data-Driven Modeling and Scientific Computation: Methods for Complex Systems and Big Data,First Edition, originally published in English in 2013, is published by arrangement with Oxford University Press and isfor sale only in the territories of Mainland China not including Hong Kong SAR, Macau SAR and Taiwan本书中文简体版专有出版权由美国 Oxford University Press授权电子工业出版社。未经出版者预先书面许可,不得以任何方式复制或抄袭本书的任何部分。此版本仅限在中国大陆发行与销售。版权贸易合同登记号图字:01-20145134图书在版编目(CP)数据数据驱动建模及科学计算:复杂系统和大数据处理方法(美)库茨(Kut,JN)著;吕丽刚等译北京:电子工业出版社,20171(经典译从·人工智能与智能系统)书名原文: Data-Driven Modeling and Scientific Computation: Methods for Complex Systems and Big DataISBN978-7-121-26596-9I.①数…Ⅱ.①库…②吕…Ⅲ.①数据库系统一建立模型②数据库系统-科学计算Ⅳ.①TP31113中国版本图书馆CIP数据核字(2015)第155835号策划编辑:马岚责任编辑:马岚特约编辑:马晓云印刷:三河市鑫金马印装有限公司装订:三河市鑫金马印装有限公司出版发行:电子工业出版社北京市海淀区万寿路173信箱邮编100036开本:787×1092116印张:295字数:755千字版次:2017年1月第1版印次:2017年1月第1次印刷定价:89.00元凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:0895828意心质量投诉请发邮件至zs@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn本书咨询联系方式:classic-series-info@phei.com.cn译者序大数据的飞速发展彻底改变了我们的工作、学习和生活。未来几年,各种数据源仍会持续爆炸式增长,对大数据的研究也进入了快速发展时期。大数据研究的目的是发展大数据技术并将其应用到相关领域,通过处理巨量数据促进其突破性发展。及时掌握国内外相关领域研究成果和应用技术,迫切需要内容全面、权威的教材。本书为合适之选。本书以作者多年的科学研究和工程实践为基础,对 MATLAB软件、数据处理理论和数据分析技术等专业知识进行了较为全面系统的阐述,并就各种专业知识在解决实际科研、工程技术应用方面进行了讲解,提供了一些解决现实工程技术问题必要的软件工具,便于学习研究。全书共四个部分(26章)。其中第一部分(第1章至第6章)介绍 MATLAB语言基础、编程思想和解决基本问题的方法;第二部分(第7章至第11章)介绍了常徵分和偏微分方程数值计算方法中高层次的理论,系统地为广大科学计算爱好者们提供了应用程序的基础理论框架;第三部分(第12章至第23章)从独特的视角提供了数据分析方法,即利用数据统计、时频分析、降维运算这三个思想来解决各种复杂问题;第四部分(第24章至第26章)是科学应用部分,其核心思想是运用有限差分、谱方法、有限元方法等数值方法,求解三体问题、量子力学等实际的复杂问题。本书的翻译、审校工作得到相关领域专家的关心与指导。邵志平教授、孙鹏教授和张少华教授等专家学者均对书稿的翻译做了大量指导工作,提出了宝贵的修改意见。在此,译者表示衷心的感谢。本书翻译的具体分工如下:吕丽刚翻译了前言、学习指南、术语对照表等内容,并负责全书的统稿和校对;王立华、周宏升和丛培荣翻译了第一部分和第二部分,常广建、赵铭和于晓翻译了第三部分的部分章节;黄红坡、刘永锋和刘丽巧翻译了第三部分的部分章节和第四部分。全书由任鸿审校。大数据为目前最新研究领域之一,无论在理论研究还是工程技术应用方面,都有很多问题有待进一步探讨解决。加之译者水平有限,翻译时间比较仓促,本书的不当甚至错误之处在所难免,恳请各位专家和广大读者批评指正3前言科学计算普遍存在于物理、生物和工程领域。今天,专业的计算方法对研究分析能力有重要影响。尽管数学家们提供了大量的数据分析教程,但此类教程往往更适合数字专业的人看懂。可视化数据分析技术仍是必不可少的,因为它为数据分析教材与课程提供了基础。可视化数据分析被熟练地应用于实践,并解决实际问题,传统的数学计算方式需要一年的工作才能达到与其相当的水平。MATLAB已经在科学计算软件领域确立了其主导地位。其内嵌的运算规则使得科学计算从技术细节转换到整体的算法实现和解决方案上。重复繁重的计算任务产生了 MATLAB线性代数运算包、快速傅里叶变换函数运算包和有限元(偏微分方程)运算包。这些函数是解决技术问题的关键所在。当然,提供简单的说明是任何函数应用所必需的,作为应用程序的参考材料,可以为用户提供查阅服务。本书的最终目的是为学生开发一套可信的解决计算问题的工具。特别要提出的是,在本书结束部分,学生应该能够解决椭圆、双曲线或抛物线类型的一维至三维的所有问题,起码他们会有大量关于如何解决问题的知识、信息和参考文献的辅助信息。类似地,就目前的数据分析框架而言,为统计学、时序分析和降维处理(奇异值分析)等以数据处理为核心的问题提供了更便捷的解决途径。总而言之,本书可以为读者提供一种通过数据驱动建模来解决各种复杂问题的思路。致谢本书第一部分内容来源于与 Dave Muraki的一系列谈话,然后逐步发展成为科学计算课程的主要内容,其目的在于为生物和物理工程学的学生提供通用、有效的课程。过去两年中,本书内容得到进一步丰富,包括数据分析方法,并支撑了本书的主要内容。正如大家所熟知的,本书数据分析的主要部分极大地受益于 Emmanuel Candes, Yannis Kevrekidis和 ClancyRowley的出色工作。我还获益于早期与 James Rossmanith,以及与 Peter Blossey和 Sorin mitran的大量讨论,以及近期与 Steven Brunton, Edwin: Ding, Jeshua proctor, Peter Schmid,EiShlizerman, Jonathan Tu和 Matthew williams关于维度降低方法的讨论。同时, Leslie butson,Sarah Hewitt和 Jennifer O Neil也为编辑本书给予了大量帮助,正是由于他们的这些努力,增加了本书的可读性、适用性和准确性。另外,特别需要感谢大量学生读者,正是他们提出如此多的批评性建议和重要的反馈意见,才增加了本书的发行量、可读性和正确率。当然,由于水平有限且时间仓促,书中错误在所难免,敬请谅解。4学习指南本书分为三个数值方法部分和一个应用部分。实际上,本书各部分针对不同读者设计,不同的用户会关注适合他的部分。本书所有部分均经过本科毕业生和许多学生仔细校对和检查,以便提高整体可读性和实用性;本书的应用部分可以帮助学生解决更广泛的现实问题。就我个人而言,感觉很多其他的 MATLAB书籍设计的问题和对关键问题的阐述缺乏真正的实用性和指导性。本书特点详述如下。本科课程中的科学计算本书第一部分汇集了目前华盛顿大学一二年级工科和物理专业的学生们最为关注的资料。鉴于在工程项目中使用的是 MATLAB语言,我们首先介绍该语言的基本概念和理论思想。其次,介绍利用该语言编译的程序实例,如最小二乘、导数、积分等。最后讲解如何用 MATLAB处理较为常见的简单问题,如导入/导出数据等。因此第1章至第6章介绍 MATLAB语言基础、基础编程(if和for循环语句)思想和解决基本问题的思路。最后在第6章阐述了微分方程。快速高效地解决微分方程是许多高年级学生在航空航天(三体问题)工程、电子工程等方面的主要课程。因此,本书第一部分适合初学科学计算的读者。研究生课程中的科学计算本书还为研究生(或者高年级本科生)提供科学计算方法的基础介绍和高级概述。数学分析在传统研究生课程中,重点通常都集中在数学基础理论与实现方面,而目前许多数据分析课程极少有面向工程、生物和物理专业学生的讲解。本书的第二部分,第7章到第11章为读者介绍了解决微分和偏微分方程计算方法中高层次的理论,系统地为广大科学计算爱好者们提供了应用程序的基础理论框架,其中考虑了有限差分、光谱和有限元等关键问题。第7章是研究生学习的起点。一方面,学生可以根据个人情况跳过这本书的第一部分,从研究生阶段开始学习科学计算。另一方面,本书的第一部分包含了部分研究生的简单工程设计的内容,比如创建影像、导入/导出数据或提供编程架构。因此,本书的第一部分对硏究生具有硏究参考价值。研究生课程中数据分析的计算方法本书第一、二部分提供了一套科学计算的标准化处理流程,用大量简单的实例说明初级和中级数值方法问题的偏微分方程等解决方案。本书第三部分(第12章至第23章)则从更独特的视角提供了数据分析方法。该部分的目的是向研究生(或高年级本科生)介绍迅猛发展的数据分析学科,该学科几乎应用于所有的科学研究领域,发展极为迅速。各学科遇到的大数据问題极大地鼓舞了他们对旧理论的解释及对新理论的设想。这一部分总结了其中有代表性的思想:(1)数据统计;(2)时频分析;(3)降维运算。提供有意义的数据分析方法是当今任何科学领域需要面对的问题。这是一个令人振奋的学科,这一部分也由许多实例组成,这三个思想可用于指导解决各种问题。与第二部分一样,本书第一部分补充了学生的背景知识,是全书总体结构不可或缺的重要部分。5·计算方法参考指南本书除了作为大学科学计算及数据分析的教材外,也可作为参考指南。这本书提供了大量应用实例和一些关键、经典问题的另类解决思路。使应用程序和理论相结合,提供了一个可以更加高效快捷提高自己相关技能的解决方案。在与读者们交流的过程中,我听到最多的就是学生们发现本书有助于完成作业。我认为这是由于他们在使用本书后,既获得了 MATLAB的理论知识,又能在实际应用中借鉴本书中的代码,从而降低了使用该语言的门槛。另外,本书也介绍了很多高级 MATLAB子例程,对这些子例程的应用,可以使读者们在编程方面少走弯路。理论联系实际本书最重要的部分是科学应用部分(第24章至第26章),该思想的核心是用理论解决实际问题。有时我不得不开发复杂的程序以解决复杂的问题,而教材提供的理论简化了这些复杂的问题,更容易进行问题分析。教材中使用这种方法是可以理解的,因为这就是教学目的。我们最终的目标是培养构建代码的专业人员,他们终究会遇到复杂的问题。所以实际应用问题的选择要足够广泛,教师们也应该有条件选择自己感兴趣的东西。另外,本部分中的每个问题都有精心布置的背景,使得这些问题更好地与实际应用相联系。这些问题的难度依次增加,但这些问题仍然适用于任何读者,无论是低年级本科生、高年级本科生还是研究生都可以从中获益。本部分对于不同层次的读者唯一的区别在于他们可以读到本书的哪一部分。如果初学者想要更深入地了解,也可以读更深层次的部分。另外,本部分还提出很多经典问题,如:三体问题、量子力学等。希望这类问题的提出能让学生和教师们一样感兴趣,故本书可以作为理论联系实际的计算工具一目录第一部分基本计算和可视化第1章 MATLAB概述…………1.1向量和矩阵………………………1.2逻辑、选择和循环……………………………………22613迭代法: Newton-Raphson方法………914函数调用,输入输出及调试………………………121.5绘图和数据的导入导出………………16第2章线性系统……………………………………2221直接方法求解Ax=b………………………2222迭代法求解Ax=b………………………………………………2523梯度下降(最速下降)法求解Ax=b……………………………………2824特征值、特征向量和可解性………………………………………322.5特征值、特征向量应用与人脸识别……………………………3626非线性系统…………41第3章曲线拟合…………………………………4531最小二乘拟合法………………………………………………………453.2多项式拟合和样条插值……………………………………4833基于 MATLAB的数据拟合………………………………………………51第4章数值微积分…………………………………………………………5741数值微分………5742数值积分…………………………………………………613数值微分和积分计算…………………6第5章基本优化……………………………6951无约束最优化………………………………………………6952无约束最优化(微分方法)………………………………………735.3线性规划………………………………………………………………7754单纯形法………………………………………815.5遗传算法……………84第6章可视化……………………………………………………………886.1定制图形和基本的二维绘图………………………………………8862高级二维和三维绘图……………………………………926.3电影及动画…………………………………………………………967笫二部分常微分方程和偏微分方程第7章常微分方程初边值问题………………………………………………10071初值问题:欧拉方法、 Runge-Kutta方法和 Adams方法1007.2时间步进算法的误差估计………………………………………1057.3高级时间步进算法………10974边值问题:打靶法……………………………………………1117.5打靶法的实现和收敛性研究……………1167.6边值问题:直接求解与松弛……1207.7使用 MATLAB求解边值问题……………………………1227.8线性算子及谱的计算……………………………125第8章有限差分方法……………………………………………13181有限差分离散…13182求解线性方程组Ax=b的高级迭代方法……………………………1358.3快速泊松解子:傅里叶变换…………………………………1368.4线性方程组求解技术的比较;经验法则………………………13885克服计算困难…………………………………142第9章时间和空间步进方式:线性法…14591基本时间步进方法………4592时间步进方法:显式和隐式方法……………………………………14893稳定性分析…………………………………………15194比较时间步进方法……………………………………………………1549.5算子分裂技术…………………………………1579.6优化计算性能:粗略估计…………………159第10章谱方法…164210.1快速傅里叶变换和余弦、正弦变换……………………16410.2切比雪夫多项式和切比雪夫变换………………………………16710.3谱方法的实现…………170104带滤波的伪谱方法……………………………17110.5边界条件和切比雪夫变换………………175106实现切比雪夫变换++,++++++y++,+,x+,+++H;Fs=;+v如中;丰“;中“丰“,瓶““17810.7计算谱: Floquet-Fourier-H方法……82第11章有限元法………………………………………………………………18711.1有限元法基础……………………………187112有限元离散和边界………………………19111.3使用 MATLAB求解偏微分方程…………………………………194l14 MATLAB偏微分方程工具箱……………………………………………………………1988第三部分数据分析计算方法第12章统计方法及其应用………………………………20412.1概率论基本概念……………………………204122随机变量和统计概念…………………………20812.3假设检验及其统计意义……………………215第13章时频分析:傅里叶变换与小波理论…220131傅里叶级数及傅里叶变换…………………………22013.2FFT的应用:雷达探测和滤波…226133FFT的应用:雷达探测与平均法+“·“"·""非23013.4时频分析:窗口傅里叶变换………………………235135时频分析与小波理论…………………………………………………23913.6多分辨率分析与小波基函数………………………………………………24513.7 MATLAB中的谱图及 Gabor变换……………………………………24813.8 MATLAB滤波器设计和小波工具箱………………………………253第14章图像分析处理…………161141图像分析基本概念……………261142图像降噪的线性滤波……12414.3散度及图像处理…………………………………268第15章线性代数及其奇异值分解……………………………27315奇异值分解基础……………………73152广义SvD…………276153主成分分析(PCA)简介……………………281154主成分分析,对角化及SVD……“…………28315.5主成分及适当正交模型………………………………………………………2860156稳定PCA模型…92第16章独立成分分析……………………………………………29916.1独立成分的概念…………………………………………………29916,2图像分离问题………………………………………………………………303163图像分离及 MATLAB应用…………………………………………307第17章图像识别:基本的机器学习………………………31217.1识别猫狗…………………………………………………312172SD和线性判别分析…………………………………………315173 MATLAB识别猫狗…………………………………320第18章压缩感知理论基础………………32318.1最小二乘拟合之外的L范数…………32318.2信号重构和规避奈奎斯特……32818、3稀疏采样的数据(图像)重构…3339