第一章
地理信息是指有关地理实体的性质、特征和运动状态的表征和一切有用的知识。基本特征:空间,属性,时序
地理数据:各种地理特征和现象间关系的符号化表示,包括空间位置、属性特征、时态特征。空间数据:以地球表面空间位置为参照的自然、社会、、和人文经济景观数据,可以是图形、图像、文字、表格和数字等。空间特征是指地理实体的空间位置及其相互关系;属性特征表示地理实体的名称、类型和数量等;时间特征指实体随时间而发生的相关变化。
空间数据特征:空间特征;非结构话特征;空间关系特征;多尺度与多态性;分类编码特征;海量数据特征。
空间查询:空间查询是GIS最基本的功能,包括已知属性查图形,已知图形查属性及多种条件的综合查询。
拓扑叠加:通过将同一地区两个不同图层的特征相叠加,建立新的空间特征,易于进行多条件的查询检索、地图裁剪、地图更新和应用模型分析等。
缓冲区建立:它是研究根据数据库的点、线、面实体,自动建立各种类型要素的缓冲多边形,用以确定不同地理要素的空间接近度或邻近性。
Gis:是在计算机硬、软件系统支持下,对现实世界的研究和变迁的各类空间数据及描述
这些空间数据特性的属性进行采集、储存、管理、运算、分析、显示、和描述的技术系统。组成:硬件,软件,地理数据(空间分析模型,地理空间数据库),人员。
功能:数据采集监测编辑、数据处理、数据存储与组织、空间查询与分析
特征:数据的空间定位;空间数据关系处理的复杂性;海量的数据管理能力。
地理信息系统按其内容可以分为三大类:1专题地理信息系统:是具有有限目标和专业特点的地理信息系统;2区域地理信息系统:主要以区域综合研究和全面信息服务为目标;3地理信息系统工具:它是一组具有图形图像数字化、存储管理、查询检索、分析运算和多种输出等地理信息系统基本功能的软件包。
第三章
空间数据模型:概念:是关于现实世界中空间实体及其相互间联系的概念。种类:场模型:用于描述空间中连续分布的现象;要素模型:用于描述各种空间地物;网络模型:可以模拟现实世界中的各种网络。
地理空间:指物质、能量、信息的存在形式在形态、结构过程、功能关系上的分布形式和格局及其在时间上的延续。
时空数据模型:研究如何有效地表达、记录和管理现实世界的实体及其相互关系随时间不断发生的变化。三种可能:属性变化,其空间坐标或位置不变;空间坐标或位置变化,而属性不变;空间实体或现象的坐标和属性都发生变化。
CASe工具是计算机信息系统结构化分析、数据流程描述、数据实体关系表达、数据字典与系统原型生成、原代码生成的重要工具,在非空间型计算机信息系统的设计与建立中有着较为广泛的应用。
各向同性场:一个场中的所有性质都与方向无关。
空间自相关:是空间场中的数值聚集程度的一种量度。
栅格数据模型:是基于连续覆盖的,它是将连续空间离散化,即用二维覆盖或划分覆盖整个连续空间。
欧氏空间:许多地理现象模型建立的基础就是嵌入在一个坐标空间中,在这种坐标空间中,根据常用的公式就可以测量点之间的距离及方向,这个带坐标的空间模型。它把空间特性转换成实数的元组特性,两维的模型叫做欧氏平面。
拓扑属性:它研究在拓扑变换下能够保持不变的几何属性。
空间指标量算:定量量测区域空间指标和区域地理景观间的空间关系是地理信息系统特有的能力。指标包括:几何指标,自然地理参数,人文地理参数。
曼哈顿距离:纬度差加上经度差
旅行时间距离:从一个城市到另一个城市的最短的时间可以用一系列指定的航线来表示
词典距离:在一个固定的地名册中一系列城市中它们位置之间的绝对差值。
时空数据模型设计的基本指导思想:根据应用领域的特点和客观现实变化规律,折中考虑时空数据的空间/属性内聚性和时态内聚性的强度,选择时间标记的对象;同时提供静态、动态数据建模手段;数据结构里显式表达两种地理事件;时空拓扑关系一般指地理实体空间拓扑关系的拓扑事件间的时态关系。
体元:三维数据结构中,将地理实体的三维空间分成细小的单元。
第五章
Gis数据:空间信息(位置,空间关系等等),非空间的属性信息,时间信息。
空间特征数据:记录的是空间实体的位置、拓扑关系和几何特征。
专题特征数据:专题特征指的是地理实体所具有的各种性质。
时间特征数据:指地理实体的时间变化或数据采集的时间等。
测量的尺度大致可以分成四个层次,由粗略至详细依次为:命名;次序;间隔;比例
准确性:
空间分辨率:分辨率是两个可测量数值之间最小的可辩识的差异。那么空间分辨率可
以看作记录变化的最小距离。
空间数据使用的过程中也会导致误差的出现,主要包括两个方面:一是对数据的解释过程,二是缺少文档。
数据误差类型:几何(点,线),属性,时间,逻辑。
元数据:是描述数据的数据。对数据集的描述、数据质量的描述、数据处理信息的说明、数据转换方法的描述、数据更新、集成等说明。作用:帮助数据生产单位有效地管理和维护空间数据、建立数据文档,并保证即使其主要工作人员离退时,也不会失去对数据情况的了解;提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息,便于用户查询检索地理空间数据;帮助用户了解数据,以便就数据是否能满足其需求做出正确的判断;提供有关信息,以便用户处理和转换有用的数据。
空间数据质量问题的来源:空间现象自身存在不稳定性;空间想象的表达;空间数据处理中的误差;空间数据使用中的误差。
空间数据质量的主要控制内容包括:(1)有准确定义的数据字典,以说明数据的组成,各部分的名称,表征的内容等;(2)保证数据逻辑科学地集成,如植被数据库中不同亚类的区域组合成大类区,这要求数据按一定逻辑关系有效的组合;(3)有足够的说明数据来源、数据的加工处理工程、数据解译的信息。
空间数据质量的主要控制方法:传统的手工方法,源数据方法、地理相关。
第六章
空间数据获取的方式:数据转换,遥感数据处理,数字测量
矢量电子地图与纸地图相比有如下优点:计算距离和标注地名符号快速准确;可对地图局部放大、全图缩小和移动显示、漫游功能很强;分层显示地图(当对地图上各种信息分不同层归类存放后,则可以显示某些层,关闭不显示的层);可以以图元为单位进行信息编缉修改,人机交互画线标注符号文字,删除地图上多余的信息;可以通过计算机网络进行电子地图传递,提供信息共享,传递的速度快,保密性强;如果能有效解决地图符号自动分割和识别问题,则能实现地图的智能矢量化。这里智能化是指自动矢量化和自动标注符号,最佳路径优化选择和自动跟踪目标等。
矢量电子地图与纸地图相比有如下优点:相同信息量下前者的文件相对要小得多,图越复杂表现越明显;前者可以以图元为单位进行信息编缉修改删除,人机交互画线标注符号文字;后者只能以像素为基本单位(如矩形图像块)进行拷贝,移动和删除,即它的编辑功能很差;前者可对所有图元分层显示,后者只能做到对整图某区域(矩形区)的开窗显示控制。
地图数据:空间数据(或图形数据,)语义数据。
地图要素图形:面——可由环绕它们的线表示;也可以由其区域内的点表示;线——可离散化成为点的集合;点——则能用一对平面坐标系中的坐标来确定。
输入方式:手扶跟踪数字化(点方式,流方式(距离流和时间流))其他数据转换,键盘录入;
鼠标输入;其他定点测量设备
曲线离散化算法(压缩算法) 考过:道格拉斯——普克法:对每一条曲线的首末点虚连一条直线,求所有点与直线的距离,并找出最大距离值dmax,用dmax与限差D相比:
若dmax 栅格图像转换为矢量地图:图像二值化:从原始扫描图像计算得到黑白二值图像;平滑:图像平滑用于去除图像中的随机噪声,通常表现为斑点;细化:细化将一条线细化为只有一个像素宽,细化是矢量化过程中的重要步骤,也是矢量化的基础;链式编码:链式编码将细化后的图像转换成为点链的集合,其中每个点链对应于一条弧段。矢量线提取:将每个点链转化成为 一条矢量线。每条线由一系列点组成,点的数目取决于线的弯曲程度和要求的精度。除了上述五个步骤以外,还需要一些处理以方便图像矢量化过程,如图像拼接和剪裁等等。图像拼接:以两相邻地图图像的部分重叠区为基础,把它们合成为一幅整图的过程。 图像裁剪:把一幅图像裁成两两相邻的规则图块的过程称为地图裁剪。 图像细化预处理二值图像平滑:在将地图扫描或摄像输入时,由于线不光滑以及扫描、摄像系统分辨率的,使得一些曲线目标带来多余的小分支(即毛刺噪声);此外,还有孔洞和凹陷噪声。采用模板去除 图像细化:线细化,就是不断去除曲线上不影响连通性的轮廓像素的过程。要求: 保证细化后曲线的连通性;细化结果是原曲线的中心线;保留细线端点. 算法: 1:对于栅格图像中的每个点p,进行如下操作:如果2≤N(p)≤6并且T(p)=1并且pNpSpE=0并且pWpEpS=0则标志p点;将所有被标志的栅格点赋值为0,如果没有被标志的点,则算法结束;对于栅格图像中的每个点p,进行如下操作:如果2≤N(p)≤6并且T(p)=1并且pNpSpW=0并且pWpEpN=0则标志p点;将所有被标志的栅格点赋值为0,如果没有被标志的点,则算法结束;转到第一步. 链码:用曲线出发点坐标和线的斜率来描述二值线图形的一种方法。 拓扑关系内容:区域,如果多边形数据DIME数据模型,每个多边形可以用一组封闭的线来表示,而不需要记录封闭线上的所有点,避免两次记录相邻多边形的公共边界,这样减少 了数据冗余;邻接性,另一种可以用拓扑描述的属性是多边形之间的相互邻接性;连通性 是指对弧段连接的判别,连通性的建立和表现是网络分析的基础。 造成数字化错误的具体原因:遗漏某些实体;某些实体重复录入;定位的不准确。 错误主要形式:伪节点:使一条完整的线变成两段,造成伪节点的原因常常是没有一次录入完毕一条线;悬挂节点,如果一个节点只与一条线相连接,那么该节点称为悬挂节点;碎屑:条带多边形一般由于重复录入引起,由于前后两次录入同一条线的位置不可能完全一致,造成了“碎屑”多边形。另外,由于用不同比例尺的地图进行数据更新,也可能产生“碎屑”多边形。不正规的多边形:是由于输入线时,点的次序倒置或者位置不准确引起的。 拓扑关系建立:首先将所有弧段的左右多边形都设置为空;然后对每个节点计算与其相连弧段的在连接处的角度,并进行排序。 第七章 地理信息系统与一般管理信息系统的比较:不同在硬件上,为了处理图形和图像数据,系统需要配置专门的输入和输出设备,如数字化仪、绘图机、图形图像的显示设备等;许多野外实地采集和台站的观测所得到的资源信息是模拟量形式,系统还需要配置模——数转换设备,这些设备往往超过处理机的价格,体积也比较大;在软件上,则要求研制专门的图形和图像数据的分析算法和处理软件,这些算法和软件又直接和数据的结构及数据库的管理方法有关;在信息处理的内容和采用目的方面,一般的管理信息系统,主要是查询检索和统计分析,处理的结果,大多是制成某种规定格式的表格数据,而地理信息系统,除了基本的信息检索和统计分析外,主要用于分析研究资源的合理开发利用,制定区域发展规划,地区的综合治 理方案,对环境进行动态的监视和预测预报,为国民经济建设中的决策提供科学依据,为生产实践提供信息和指导。共同处两者都是以计算机为核心的信息处理系统,都具有数据量大和数据之间关系复杂的特点,也都随着数据库技术的发展在不断的改进和完善。比较起来,商用的管理信息系统发展快,用户数量大,而且已有定型的软件产品可供选用,这也促进了软件系统的标准化。地理信息系统,由于上述一些特点,多是根据具体的应用要求专门设计,数据格式和组织管理方法各不相同。 地理信息系统的数据库(简称空间数据库或地理数据库):概念:是地理信息系统中用于存储和管理空间数据的场所。特点:数据量特别大;不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据;数据应用广泛。 空间数据库与传统数据库区别:优点+空间数据库主要存储非结构化的数据。 数据库管理系统DBMS:概念:用程序和数据文件之间起到了桥梁作用。主要问题:GIS 中空间数据记录是变长的,且要存储和维护空间数据拓扑关系;DBMS一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作。GIS需要一些复杂的图形功能,一般的DBMS不能支持;地理信息是复杂的,单个地理实体的表达需要多个文件、多条记录、或许包括大地网、特征坐标、拓扑关系、空间特征量测值、属性数据的关键字以及非空间专题属性等;具有高度内部联系的GIS数据记录需要更复杂的安全性维护系统。 GIS数据管理方法主要4种类型:对不同的应用模型开发的数据管理服务,这是一种基于文件管理的处理方法;商业化的DBMS基础上开发附加系统。开发一个附加软件用 于存储和管理空间数据和空间分析,使用DBMS管理属性数据;用现有的DBMS,通常是以DBMS 为核心,对系统的功能进行必要扩充,空间数据和属性数据在同一个DBMS管理之下。需要增加足够数量的软件和功能来提供空间功能和图形显示功能;新设计一个具有空间数据和属性数据管理和分析功能的数据库系统。 数据组织分级:数据项(项是可以定义数据的最小单位);记录(由若干相关联的数据项组成,是处理和存储信息的基本单位,是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性);文件(一给定类型的记录的全部具体值的集合,文件用文件名称标识,文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等);数据库(比文件更大的数据组织,数据库是具有特定联系的数据的集合) 数据之间的逻辑联系:主要是指记录与记录之间的联系。有三种:一对一的联系;一对多的联系;多对多的联系。 倒排文件:带有辅索引的文件; 栅格结构:将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。 栅格结构的显著特点:属性明显;定位隐含;易于存储;算法简单;地表是不连续,是量化和近似离散的据。 决定栅格单元的代码:中心点法;面积占优法;重要性法;百分比法。 栅格编码方法:1、栅格编码(就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码);2、压缩编码方法:链码、游程长度编码、块码和四叉树编码。 链码:以有效地压缩栅格数据,而且对于估算面积、长度、转折方向的凹凸度等运算十分方便,比较适合于存储图形数据。缺点是对边界进行合并和插入等修改编辑工作比较困难,对局部的修改将改变整体结构,效率较低。 游程长度编码:基本思想是:按行或列扫描,将相邻等值的像元合并,并记录代码的重复个数。其方法有两种方案:在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数和逐个记录各行(或列)代码发生变化的位置和相应代码。特点:数据量没有明显增加,压缩效率较高,且易于检索,叠加合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况。 块码:游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单元的代码组成。 四叉树:基本思想:四叉树将整个图像区逐步分解为一系列被单一类型区域内含的方形区域,最小的方形区域为一个栅格象元,分割的原则是,将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。 定义:将2n 2n像元阵列连续地进行4象限等分,一直分到子象限中像素值单调为止。 种类:常规四叉树(记录这棵树的叶结点外,中间结点,结点之间的联系用指针联系,每个结点需要6个变量:父结点指针、四个子结点的指针和本结点的属性值);线性四叉树:记录叶结点的位置,深度(几次分割)和属性。地址码:定位码、Morton码、进制、十进制。 栅格数据编码方法比较:四叉树编码具有可变的分辨率,并且有区域性质,压缩数据灵活,许多运算可以在编码数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。好的压缩编码方法就是要在尽可能减少运算时间的基础上达到最大的数据压缩效率,并且是算法适应性强,易于实现;码的压缩效率较高,已经近矢量结构,对边界的运算比较方便,但不具有区域的性质,区域运算困难;程长度编码既可以在很大程度上压缩数据,又最大限度地保留了原始栅格结构,编码解码十分容易;块码和四叉树码具有区域性质,又具有可变的分辨率,有较高的压缩效率,四叉树编码可以直接进行大量图形图像运算,效率较高,是很有前途的方法。 矢量数据编码方法:点实体:对于点实体和线实体的矢量编码比较直接,只要能将空间信息和属性信息记录完全就可以了。点是空间上不能再分的地理实体,可以是具体的或抽象的,如地物点、文本位置点或线段网络的结点等,由一对x、y坐标表示;线实体:要用来表示线状地物(如公路、水系、山脊线等)符号线和多边形边界,有时也称为“弧”、“链”、“串”等,其矢量编码一般:唯一标识码是系统排列序号;线标识码可以标识线的类型;起始点和终止点号可直接用坐标表示;显示信息是显示时的文本或符号等;与线相联系的非几何属性可以直接存储于线文件中,也可单独存储,而由标识码联接查找。由一串x、y坐标表示。多边形实体:多边形矢量编码不但要表示位置和属性,更为重要的是要能表达区域的拓扑性质,如形状、邻域和层次等。 多边形实体:1、坐标序列法;只记录空间对象的位置坐标和属性信息,不记录拓扑关系。特点:无拓扑关系,主要用于显示、输出及一般查询;边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形;每个多边形自成体系而缺少邻域信息,难以进行邻域处 理,如消除某两个多边形之间的共同边界;岛只作为一个单个的图形建造,没有与外包多边形的联系;不易检查拓扑错误。这种方法可用于简单的粗精度制图系统中。2、树状索引编码法:该法采用树状索引以减少数据冗余并间接增加邻域信息,方法是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。特点:消除了相邻多边形边界的数据冗余和不一致的问题;简化复杂边界线或合并相邻多边形时可不必改造索引表;邻域信息和岛状信息可以通过对多边形文件的线索引处理得到,但是比较繁琐;相邻函数运算,消除无用边,处理岛状信息以及检查拓扑关系比较困难两个编码表都需要以人工方式建立,工作量大且容易出错。3拓朴结构编码法:包括以下内容:唯一标识,多边形标识,外包多边形指针,邻接多边形指针,边界链接,范围。 栅格结构和矢量结构的比较:栅格结构与矢量结构似乎是两种截然不同的空间数据结构,栅格结构“属性明显、位置隐含”,而矢量结构“位置明显、属性隐含”,栅格数据操作总的来说比较容易实现,尤其是作为斑块图件的表示更易于为人们接受;而矢量数据操作则比较复杂,许多分析操作(如两张地图的覆盖操作,点或线状地物的邻域搜索等)用矢量结构实现十分困难,矢量结构表达线状地物是比较直观的,而面状地物则是通过对边界的描述而表达。矢量数据优缺点:优点:数据结构紧凑、冗余度低;利于网络和检索分析;形显示质量好、精度高,缺点:数据结构复杂;边形叠加分析比较困难。 栅格数据优缺点:优点:数据结构简单;于空间分析和地表模拟;势性较强。缺点:数据量 大;影转换比较复杂。 矢量格式向栅格格式的转换:1、内部点扩散算法(种子填充法)该算法由每个多边形一个内部点(种子点)开始,向其八个方向的邻点扩散,判断各个新加入点是否在多边形边界上,如果是边界上,则该新加入点不作为种子点,否则把非边界点的邻点作为新的种子点与原有种子点一起进行新的扩散运算,并将该种子点赋以该多边形的编号。2数积分算法(内角和法)对全部栅格阵列逐个栅格单元地判断该栅格归属的多边形编码,判别方法是由待判点对每个多边形的封闭边界计算复数积分,对某个多边形,如果积分值为2 r,则该待判点属于此多边形,赋以多边形编号,否则在此多边形外部,不属于该多边形。3、算法和扫描算法:线算法可逐点判断数据栅格点在某多边形之外或在多边形内,由待判点向图外某点引射线,判断该射线与某多边形所有边界相交的总次数,如相交偶数次,则待判点在该多边形外部,如为奇数次,则待判点在该多边形内部。4、边界代数算法:(1)单多边形转换。多边形编号为a,初始化的栅格阵列各栅格值为零,以栅格行列为参考坐标轴,由多边形边界上某点开始顺时针搜索边界线,当边界上行时,位于该边界左侧的具有相同行坐标的所有栅格被减去a;当边界下行时,该边界左边(前进方向看为右侧)所有栅格点加一个值a,边界搜索完毕则完成了多边形的转换。(2) 多个多边形的转换。如果把不属于任何多边形的区域(包含无穷远点的区域)看成编号为零的特殊的多边形区域,则图上每一条边界弧段都与两个不同编号的多边形相邻,按弧段的前进方向分别称为左、右多边形,可以证明,对于这种多个多边形的矢量向栅格转换问题,只需对所有多边形边界弧段作如下运算而不考虑排列次序:当边界弧段上行时,该弧段与左图框之间栅格增加一个值(左多边形编号减去右多边形编号);当边界弧段下行时,该弧段与左图框之间栅格增加一个值(右多边形编号减去左多边形编号)。 栅格像矢量转换步骤:多边形边界提取:采用高通滤波将栅格图像二值化或以特殊值标 识边界点;边界线追踪:对每个边界弧段由一个结点向另一个结点搜索,通常对每个已知边界点需沿除了进入方向的其他7个方向搜索下一个边界点,直到连成边界弧段;拓扑关系生成:对于矢量表示的边界弧段数据,判断其与原图上各多边形的空间关系,以形成完整的拓扑结构并建立与属性数据的联系;去除多余点及曲线圆滑常用的算法有:线形迭代法;分段三次多项式插值法;正轴抛物线平均加权法;斜轴抛物线平均加权法;样条函数插值法。 多边形栅格转矢量的双边界搜索算法:基本思想是通过边界提取,将左右多边形信息保存在边界点上,每条边界弧段由两个并行的边界链组成,分别记录该边界弧段的左右多边形编号。步骤:边界点和结点提取;边界线搜索与左右多边形信息记录;多余点去除。 空间索引:概念:依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构。其中包含空间对象的概要信息,空间索引介于空间操作算法和空间对象之间。 空间索引分类:格网型空间索引,BSP树;KDB树;R树;R+树;CELL树 格网型空间索引:基本思想是将研究区域用横竖线条划分大小相等和不等的格网,记录每一个格网所包含的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体。 BSP树:一种二叉树,它将空间逐级进行一分为二的划分。 KDB树就是BSP树向空间的一种发展。它对于空间中的点进行索引具有较好的动态特性,删除和增加空间点对象也可以很方便地实现;其缺点是不直接支持占据一定 空间范围的地物要素。空间映射或变换方法仍然存在着缺点:高维空间的点查询要比原始空间的点查询困难得多。 R树根据地物的最小外包矩形建立(图7-20),可以直接对空间中占据一定范围的空间对象进行索引。 CELL树:R树和R+在插入、删除和空间搜索效率两方面难于兼顾,CELL树应运而生。它在空间划分时不再采用矩形作为划分的基本单位,而是采用凸多边形来作为划分的基本单位。 空间信息查询:在gis中,根据一定的图形条件或属性条件,检索出对应的空间对象的属性或图形一种工具。 基于属性特征查询,基于空间关系和属性特征的查询(SQL),一种空间扩展SQL查询语言——GeoSQL:相对于一般SQL,空间扩展SQL 主要增加了空间数据类型和空间操作算子,以满足空间特征的查询。 第八章(重点) 空间分析:概念:以地理事物的空间位置和形态特征为基础,以空间数据运算、空间数据和属性数据的综合运算为特征,提取与产生新的空间信息的技术和过程。方法:叠置分析,缓冲区分析,窗口分析、网络分析。 查询通常分为两步:首先借助空间索引,在地理信息系统数据库中快速检索出被选空间 实体;据空间实体与属性的连接关系即可得到所查询空间实体的属性列表。 空间查询方式:基于空间关系查询;于空间关系和属性特征查询;地址匹配查询。 几何量算对不同的点、线、面地物有不同的含义:点状地物(0维):坐标;线状地物(1维):长度,曲率,方向;面状地物(2维):面积,周长,形状,曲率等;体状地物(3维):体积,表面积等。 形状量算两个基本考虑:空间一致性问题,即有孔多边形和破碎多边形的处理;多边形边界特征描述问题。 度量空间一致性最常用的指标是欧拉函数,用来计算多边形的破碎程度和孔的数目。欧拉函数的结果是一个数,称为欧拉数。欧拉函数的计算公式为:欧拉数=(孔数)-(碎片数-1)质心量算,距离量算, 空间关系类型:空间拓扑关系:拓扑变换下保持不变的关系;空间顺序关系:描述实体在地里空间上的顺序排列;空间度量关系:描述空间实体距离远近关系,一般用欧氏距离。空间变换:为了满足特定空间分析的需要,需对原始图层及其属性进行一系列的逻辑或代数运算,以产生新的具有特殊意义的地理图层及其属性,这个过程称为空间变换。 基于栅格结构的空间变换可分为三种方式:(1)单点变换;(2)邻域变换;(3)区域变换。缓冲区:地理空间目标的一种影响范围或服务范围。缓冲区计算的基本问题是双线问题。双线问题有很多另外的名称,如图形加粗,加宽线,中心线扩张等。 角平分线法:角分线法的缺点是难以最大限度保证双线的等宽性,尤其是在凸侧角点在 进一步变锐时,将远离轴线顶点。 凸角圆弧法:在轴线首尾点处,作轴线的垂线并按双线和缓冲区半径截出左右边线起止点;在轴线其它转折点处,首先判断该点的凸凹性,在凸侧用圆弧弥合,在凹侧则用前后两邻边平行线的交点生成对应顶点。这样外角以圆弧连接,内角直接连接,线段端点以半圆封闭。 自相交多边形分为两种情况:岛屿多边形和重叠多边形。屿多边形是缓冲区边线的有效组成部分;重叠多边形不是缓冲区边线的有效组成,不参与缓冲区边线的最终重构。对于岛屿多边形和重叠多边形的自动判别方法,首先定义轴线坐标点序为其方向,缓冲区双线分成左右边线,左右边线自相交多边形的判别情形恰好对称。对于左边线,岛屿自相交多边形呈逆时针方向,重叠自相交多边形呈顺时针方向;对于右边线,岛屿多边形呈顺时针方向,重叠多边形呈逆时针方向。 叠加分析:将有关主题层组成的数据层面,进行叠加产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。 视觉信息叠加:不同侧面的信息内容叠加显示在结果图件或屏幕上,以便研究者判断其相互空间关系,获得更为丰富的空间信息。包括点状图,线状图和面状图之间的叠加显示。面状图区域边界之间或一个面状图与其他专题区域边界之间的叠加。遥感影象与专题地图的叠加。专题地图与数字高程模型(DEM)叠加显示立体专题图。 矢量数据的叠加分析 点与多边形叠加:实际上是计算多边形对点的包含关系。 线与多边形的叠加,是比较线上坐标与多边形坐标的关系,判断线是否落在多边形内。计算过程:计算交点;形成结点和链;建立拓朴;更新属性。 多边形叠加:将两个或多个多边形图层进行叠加产生一个新多边形图层的操作,其结果将原来多边形要素分割成新要素,新要素综合了原来两层或多层的属性。叠加过程可分为几何求交过程和属性分配过程两步 三种多边形叠加操作:并:保留两个输入图层的所有多边形;叠合:以输入图层为界,保留边界内两个多边形的所有多边形;交:只保留两个输入图层的公共区域。 地图代数:这种作用于不同数据层面上的基于数算的叠加运算,在地理信息系统中称为地图代数三种类型:基于常数对数据层面进行的代数运算;基于数学变换对数据层面进行的数学变换(指数、对数、三角变换等);多个数据层面的代数运算(加、减、乘、除、乘方等)和逻辑运算(与、或、非、异或等)。 网络分析:对地理网络(如交通网络)、城市基础设施网络(如各种网线、电力线、电话线、供排水管线等)进行地理分析和模型化,是地理信息系统中网络分析功能的主要目的。网络分析是运筹学模型中的一个基本模型,它的根本目的是研究、筹划一项网络工程如何安排,并使其运行效果最好。分析和解决网络模型的有力工具是图论。 网络分析功能路径分析:静态求最佳路径;N条最佳路径分析;最短路径或最低耗费路径;动态最佳路径分析。 资源分配:一种是由分配中心向四周分配,另一种是由四周向收集中心分配。负荷设计 和时间距离估算。 空间插值:常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较。包括内插和外推。 内插场合:现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值;现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值;现有的数据不能完全覆盖所要求的区域范围。 连续表面空间插值的数据源:摄影测量得到的正射航片或卫星影象;卫星或航天飞机的扫描影象;野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线);数字化的多边形图、等值线图; 整体插值方法:1)边界内插方法:界内插方法假设任何重要的变化发生在边界上,边界内的变化是均匀的,同质的,即在各方向都是相同的。2)趋势面分析:种地理属性在空间的连续变化,可以用一个平滑的数学平面加以描述。多项式回归分析是描述长距离渐变特征的 最简单方法。多项式回归的基本思想是用多项式表示线、面,按最小二乘法原理对数据点进行拟合。线或面多项式的选择取决于数据是一维的还是二维的。3)变换函数插值:据一个或多个空间参量的经验方程进行整体空间插值。 局部插值方法:局部插值方法只使用邻近的数据点来估计未知点的值,包括几个步骤:定义一个邻域或搜索范围;搜索落在此邻域范围的数据点;选择表达这有限个点的空间变化的数学函数;为落在规则格网单元上的数据点赋值。重复这个步骤直到格网上的所有点赋值 完毕。 最近邻点法:泰森多边形方法; 移动平均插值方法:距离倒数插值(距离倒数插值方法综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处,它假设未知点x0处属性值是在局部邻域内中所有数据点的距离加权平均值。距离倒数插值方法是加权移动平均方法的一种) 样条函数插值方法 克里金插值:克里金插值方法的区域性变量理论假设任何变量的空间变化都可以表示为下述三个主要成分的和:恒定均值或趋势有关的结构性成分;与空间变化有关的随机变量,即区域性变量;与空间无关的随机噪声项或剩余误差项。 其他分析方法:层次分析法;系统聚类分析法;判别分析法。 第九章 DEM三种表示模型:规则格网模型,等高线模型,不规则三角网。 规则格网dem缺点:在地形平坦的地方,存在大量的数据冗余;在不改变格网大小的情况下,难以表达复杂地形的突变现象;在某些计算,如通视问题,过分强调网格的轴方向。TIN的数据存储方式比格网DEM复杂,它不仅要存储每个点的高程,还要存储其平面坐标、节点连接的拓扑关系,三角形及邻接三角形等关系。 DEM建立:基本思路:选择一合理的数学模型,利用已知点上的信息求出函数的待定系数,然后求算规则格网上的高程值。 TIN:采用不规则三角网形成对地理空间的完整覆盖。Tin模型根据区域有限个点集将区域划分为相连的三角面网络,区域中任意点落在三角面的顶点、边或者三角网。 层次地形模型:一种表达多种不同精度水平的数字高程模型。 Delaunay三角网有以下特性:其Delaunay三角网是唯一的;三角网的外边界构成了点集P 的凸多边形“外壳”;没有任何点在三角形的外接圆内部,反之,如果一个三角网满足此条件,那么它就是Delaunay三角网。如果将三角网中的每个三角形的最小角进行升序排列,则Delaunay三角网的排列得到的数值最大。 Delaunay三角形产生的基本准则:外接圆准则;大化最小角原则;局部优化准则。 格网DEM转成TIN:保留重要点法;启发丢弃法。 等高线转成格网DEM:等高线存在在问题:不适合于计算坡度,适合制作地貌渲染图等地形分析。利用格网DEM生成等高线时,需要将其中的每个点视为一个几何点,而不是一个矩形区域,这样可以根据格网DEM中相邻四个点组成四边形进行等高线跟踪。主要有两类方法:将每个矩形分割成为两个三角形,并应用TIN提取等高线算法;接用四边形法。TIN转成DEM:按要求的分辨率大小和方向生成规则格网,对每一个格网搜索最近的TIN 数据点,按线性或非线性插值函数计算格网点高程。 数字摄影测量获取DEM采样方式:沿等高线采样;规则格网采样;渐进采样;选择采样;混合采样;自动化DEM数据采集。数字摄影测量获取的DEM数据点都要按一定插值方法转成规则格网DEM或规则三角网DEM格式数据。 DEM应用:地形曲面拟合;立体透视图;通视分析;流域特征地貌提取与地形自动分割(坡度、坡向,面积、体积,表面积。 坡度:水平面与局部地表之间的正切值。它包含两个成分:斜度——高度变化的最大值比率 (常称为坡度);坡向——变化比率最大值的方向。 三角网DEM应用:三角网内插(格网点的检索,高程内插)、等高线追踪。
因篇幅问题不能全部显示,请点此查看更多更全内容