摘要:美国地质调查局的阿尔伯克基地震实验室(ASL)正在实施多项举措,以提高和跟踪ASL地震台站产生的数据质量,并改善与用户群体关于数据问题的沟通。数据质量分析器(DQA)就是基于此的一种开发,旨在以定量和自动化的方式表征地震台站的数据质量。DQA由一个度量计算器、一个PostgreSQL数据库和一个Web界面组成。度量计算器SEEDscan是一个Java应用程序,它读取和处理miniSEED数据,并根据配置文件生成度量。SEEDscan将散列的元数据与观测数据作比较,以检测其中任何一个的变化,并根据需要执行后续重新计算。这可确保度量标准值实时更新且准确无误。SEEDscan可以执行计划任务或按需要运行。PostgreSQL数据库充当一个中心集线器,其中度量值和有限的站点描述以一天时段存储在信道级别中。Web界面动态加载来自数据库的台站数据,并允许用户请求感兴趣的时间段来查看特定的网络和台站,根据时间绘制度量标准,并调整各种度量标准对台站总体质量等级的贡献。台站数据质量的量化基于对各种度量的评估(例如,定时质量,相对于长期噪声模型的每日噪声水平,以及宽频带数据和合成地震记录之间的比较)。用户可以选择哪些度量对评估有贡献,并且这些度量被聚合到每个台站的“等级”中。基于完整的度量指标(可用性、缺失数据计数、时序质量、与全球噪声模型的偏差、与台站噪声模型的偏差、共址传感器之间的一致性,以及宽频带数据和地震合成数据之间的比较),DQA正在积极用于台站诊断和评估全球地震台网和美国国家现代地震监测系统的台站。
加入收藏
阿尔伯克基地震实验室(ASL)作为全球地震台网(GSN)和先进的美国国家现代地震监测系统(ANSS)的一部分,运行着近200个地震台站。这些台站产生的数据是地震震源和地球结构研究的基础,支撑美国国家地震信息中心(NEIC)的运作,以提供准确和及时的地震数据,并生成警报、网页、地震的地面震动图和全球地震响应快速评估系统(PAGER)等产品(Earleetal,2009)。为了确保数据的可用性,ASL工作人员执行数据质量分析。传统上,这是通过分析地震波形进行的,通过每日和每个星期“运行”扫描台站,自动通知数据可用性、时序质量和其他数据完整性问题,计算功率谱密度,以及使用潮汐合成数据来捕捉极性和增益的大尺度问题。这些技术通常用于验证台站的健康状况,但是不太适合捕捉随时间逐渐发展的细微问题或现象,例如反馈电路箱中的湿度导致STS-1响应降级的情况。因此,ASL最近开发并应用了许多工具来现场监测台站性能,例如使用PQLX和合成地震图来识别GSN台站的增益变化,以及实施年度校准处理。
为了便于使用多个指标来识别问题并实现数据质量的量化,我们开发了一个框架,称为数据质量分析器(DQA),用于定期计算数据度量,并在易于使用的界面中显示结果。DQA包括扫描miniSEED数据和计算度量,将它们存储在数据库中,并在Web界面上显示结果。该系统可配置,以应对未来的发展或变化,我们可以通过可扩展的标记语言(XML)配置文件添加和修改指标。代码可以作为调度任务(例如,每晚)运行或者根据命令运行以确保最新度量可用。DQA广泛使用哈希签名,以确保元数据或数据中的更改触发重新扫描以更新度量标准。
在本文中,我们将讨论整个DQA结构,包括SEEDscan的流程、数据库和Web界面,以及描述当前已实现的指标。使用这些指标,我们可以说明一些常见的数据问题,包括一些微妙的问题,这些问题在时间序列或功率谱的简单检查中并不明显。最后,我们讨论未来的发展计划。
1、代码
DQA自然地分为三个不同的部分:SEEDscan度量计算器、数据库和界面。此外,还有支持DQA过程的辅助代码。
1.1SEEDscan
SEEDscan程序是用Java语言编写的,并使用ApacheAnt(ApacheSoftwareFoundation,2011)构建文件进行编译。编译成功后,SEEDscan会读取XML配置文件,以识别数据文件的位置和结构、元数据的位置、要计算的度量以及计算这些度量的时间间隔(图1)。一旦SEEDscan读取了配置文件,它就会配置元数据服务器以读取网络元数据,并根据扫描器模块的请求提供特定部署配置文件(时期)的台站元数据(见下文)。在运行远程SEEDscan进程时,如果用户想要使用单个元数据服务器运行SEEDscan的多个实例,则可以将元数据服务器设置为本地或远程运行实例。默认情况下,元数据服务器读取不包含任何时间序列数据的无数据SEED格式元数据,也可以配置为使用其他格式。成功读取元数据后,扫描管理器将创建扫描程序的线程池,为每个台站创建扫描器并在其自己的线程中执行。扫描器请求其指定工作日的数据。对于每个度量标准,SEEDscan可以将用于计算度量的数据和元数据的散列数值与数据库中包含的值进行比较;如果它们不同,则重新计算度量并将其写入数据库,否则SEEDscan将继续运行而不执行计算。
我们使用夜间构建例程实现了SEEDscan,这使得可以包含新的度量以及修改度量而无需更改代码的基础结构(例如,我们可以简单地通过将其包含在代码中并添加几行到配置文件中来增加度量)。在辅助代码部分中,我们更多地讨论了夜间构建的管理模式。
图1SEEDscan过程的逻辑流。扫描管理器使用元数据服务器提供的网络无数据SEED卷(顶部),生成扫描器,然后扫描给定日期和台站的数据,检查数据库(底部)散列表,并在必要时计算度量。然后通过数据库注入器将度量注入数据库
图1SEEDscan过程的逻辑流。扫描管理器使用元数据服务器提供的网络无数据SEED卷(顶部),生成扫描器,然后扫描给定日期和台站的数据,检查数据库(底部)散列表,并在必要时计算度量。然后通过数据库注入器将度量注入数据库下载原图
1.2数据库
PostgreSQL数据库充当存储度量值和有限台站描述的中心枢纽。数据库由SEEDscan程序填充,数据以通道级别存储为双精度浮点数,时段为一天。某些度量是多值的,并且作为单独的度量存储在多个所选频带中。数据库还包含几个根据所需数据调用的存储过程。大多数存储过程根据Web界面从语法上分析的结果可返回用逗号分隔的响应。每个度量都有一个存储的计算类型,用于确定在一段时间内如何最好地汇总数据;缺失数据的计数等指标是求和的,其他大多数指标是取平均值。
1.3Web界面
Web界面使用HTML5与Java脚本前端,并使用PythonCGI脚本访问数据库。网页上显示的所有信息都是从数据库中动态加载的。新度量指标和(或)附加的台站添加到SEEDscan后,将自动包含在界面中。该界面由两个主要视图组成:(1)汇总级别(图2)和(2)台站级别(图3)。汇总级别显示一个表格,其中行是不同台站,列是各种度量。表中的度量值表示在指定的时间段内每个台站通道的平均值或总和。
使用界面中的选项卡,用户可以:(a)指定感兴趣的日期范围;(b)选择要显示的特定列;(c)将值导出到电子表格中,以及(d)指定度量对计算总体数据质量的贡献。用户还可以通过单击列标签按度量值对台站进行排序。选择台站的特定度量会生成指定时间段的通道平均值图,用户可以放大感兴趣的特征。
图22013年1月1日至2013年12月31日的中国数字地震台网(代码IC)的DQA汇总页面,其中显示了指标汇总和数据质量汇总的表格条目。显示了4个汇总指标,其中每个台站的通道上的日均值已被平均或求和(在缺失数据计数的情况下)。该图显示了XAN台站(中国西安市)在90~110s周期(左侧)的主要和次要并置的宽频带传感器之间的相干性,以及ENH台站(中国湖北省恩施市)在90~110s的周期(左,中)与并置宽频带传感器之间的功率差异,QIZ台站(中国海南省琼中市)的缺失数据(右,中),以及HIA台站(中国内蒙古自治区海拉尔)在200~500s周期(右)的噪声水平与10年基线噪声水平之间的差异。在此示例中,该图显示了2013年数据采集系统升级和STS-1地震计翻新的影响(原图为彩色图——译注)
图22013年1月1日至2013年12月31日的中国数字地震台网(代码IC)的DQA汇总页面,其中显示了指标汇总和数据质量汇总的表格条目。显示了4个汇总指标,其中每个台站的通道上的日均值已被平均或求和(在缺失数据计数的情况下)。该图显示了XAN台站(中国西安市)在90~110s周期(左侧)的主要和次要并置的宽频带传感器之间的相干性,以及ENH台站(中国湖北省恩施市)在90~110s的周期(左,中)与并置宽频带传感器之间的功率差异,QIZ台站(中国海南省琼中市)的缺失数据(右,中),以及HIA台站(中国内蒙古自治区海拉尔)在200~500s周期(右)的噪声水平与10年基线噪声水平之间的差异。在此示例中,该图显示了2013年数据采集系统升级和STS-1地震计翻新的影响(原图为彩色图——译注)下载原图
图3中国数字地震台网(CU)的GRGR台站(格林纳达岛格林维尔)的视图示例。加勒比台网中的该台站具有单独的宽频带传感器和加速度计。并非所有通道都计算所有指标,如表中相对稀疏的数据所示。在此图中,分别显示了从2013年1月1日至2013年12月31日,LHZ台站的U,W和V分量的质量块位置的满量程百分比随时间变化的曲线图,并与200~500s周期内的噪声水平变化进行比较(原图为彩色图——译注)
图3中国数字地震台网(CU)的GRGR台站(格林纳达岛格林维尔)的视图示例。加勒比台网中的该台站具有单独的宽频带传感器和加速度计。并非所有通道都计算所有指标,如表中相对稀疏的数据所示。在此图中,分别显示了从2013年1月1日至2013年12月31日,LHZ台站的U,W和V分量的质量块位置的满量程百分比随时间变化的曲线图,并与200~500s周期内的噪声水平变化进行比较(原图为彩色图——译注)下载原图
图4从2008年9月1日至2014年9月1日,山际西部(网络代码IW)IMW台站(美国怀俄明州印第安草地)的BHZ通道的可用性。由于太阳能电池板上的积雪,该台站冬季频繁停记(原图为彩色图——译注)
图4从2008年9月1日至2014年9月1日,山际西部(网络代码IW)IMW台站(美国怀俄明州印第安草地)的BHZ通道的可用性。由于太阳能电池板上的积雪,该台站冬季频繁停记(原图为彩色图——译注)下载原图
从汇总级别选择一个台站会将用户带到台站级别,其中包含一个表格,其中行是不同通道,列是各种度量。在台站级别,度量指标表示为数据范围的平均值或总和。可以绘制通道特定度量,类似于汇总级别。
汇总视图和台站视图中的最后一列是聚合列或质量列。它被计算为用户选择的度量的加权平均值,以指定如何计算台站等级,详见附录A。
1.4辅助代码和导入的库
为了利用现有代码,许多SEEDscan指标依赖于其他常用软件包的输出。例如,我们使用PQLX软件包来估计后面讨论的台站偏差度量中使用的台站基准噪声模型。我们还使用Mineos正常模式合成(Masters,2010)的事件来比较合成量。SEEDscan也可以配置为使用SAC(TapleyandTull,1992)或miniSEED格式(Ahern,2009)的任何合成事件。
DQA使用了许多现有的Java类。一部分miniSEED例程来自SeedCodec(Crot-well,2002)。为了计算离散傅里叶变换以及其他一些信号处理例程,我们使用了Lomax的Java库(Lomax,2000;Lomax,2014)。我们还利用TauP工具包中的现有类来计算距离和走时,以显示基于事件的指标中使用的波段记录(Crotwell,1999)。
2、指标
ASL已经开发或采用了一些度量标准,目前正在生产用于监测数据质量的指标(表1);其他指标仍在测试中。下面,我们将使用来自ASL在GSN(台网代码CU,IC和IU)、ANSS主干网(网络代码US)和两个区域网络(网络代码IW和NE)中运行的台站实例,来描述当前实现的度量标准,这些度量标准是通过增加复杂性来组织的。
2.1可用性
我们使用SEED格式的标签来标识一个台站在元数据中被描述为连续的所有通道。然后通过将当天可用样本的数量与预期样本的数量进行比较,来估计每个连续通道的完整性。为了避免重复数据,我们首先合并数据流,以便同一时间同一个通道不会有多个样本。图4示出了IW的IMW台站(美国怀俄明州印第安草地)的示例。由于太阳能电池板上积雪,该台站在冬季经常发生停电。
表1数据质量分析器(DQA)当前正在实施或正在开发的度量标准的状态。第2列是度量标准,第3~5列显示度量标准的当前状态,第6列给出度量标准的单位,第7列给出数据类型,第8列给出有关度量标准的其他信息
图5从2009年6月1日至2010年6月1日,美国国家现代地震监测系统(网络代码US)KVTX台站(美国得克萨斯州金斯维尔)的BHZ通道的缺失计数。该台站的汇要图显示了缺失的周期,更换连接到QuanterraQ330数据记录仪和Baler的腐蚀的电源线后,此问题已被解决(原图为彩色图——译注)
图5从2009年6月1日至2010年6月1日,美国国家现代地震监测系统(网络代码US)KVTX台站(美国得克萨斯州金斯维尔)的BHZ通道的缺失计数。该台站的汇要图显示了缺失的周期,更换连接到QuanterraQ330数据记录仪和Baler的腐蚀的电源线后,此问题已被解决(原图为彩色图——译注)下载原图
图62012年1月1日至2014年9月1日,美国地震学联合研究会/美国地质调查局(IRIS/USGS)(网络代码IU)KMBO台站(肯尼亚姆博戈乞力马山)的授时质量。该台站的数据记录器由于天线故障无法获得正确的时间,在许多时间段无法正常工作(原图为彩色图——译注)
图62012年1月1日至2014年9月1日,美国地震学联合研究会/美国地质调查局(IRIS/USGS)(网络代码IU)KMBO台站(肯尼亚姆博戈乞力马山)的授时质量。该台站的数据记录器由于天线故障无法获得正确的时间,在许多时间段无法正常工作(原图为彩色图——译注)下载原图
2.2缺失计数
使用数据时间标记,我们首先通过查找在一天开始或结束时大于一个样本的任何缺失(空白数据)来确定每个连续通道的缺失数量,然后通过组合没有丢失数据点的数据块,来识别当天的连续时间段的数量,从而计算其他时间段的缺失数量(缺失是当任何两个相邻数据点具有大于采样率的时间标记时才出现)。图5示出了美国台网的KVTX台站(美国得克萨斯州金斯维尔)的这个度量。我们不处理时间反转,因为当我们在读取数据后,合并数据时会对它们进行处理。
2.3授时质量
通过找到数字化仪写入每个miniSEED记录的授时质量的每日平均值,将整个通道授时质量记录为估计值(以百分比表示)。由于授时质量是一个与专用数字化仪有关的值,因此在具有不同数采类型的台站之间不容易比较该度量。然而,作为一个粗略的经验法则,当授时质量高于60%时,通道的授时对于大多数应用来说都是“好的”(Bolton,书面通讯)。图6示出了IU台网的KMBO台站(肯尼亚姆博戈乞力马山)的授时问题,其中记录的授时质量间歇地小于10%。在2013年2月15日重新安装全球定位系统天线后,授时质量恢复到100%,并且该台站重新产生可靠的时间标记数据。
图7在2013年3月1日至2014年3月1日之间,IRIS/USGS(网络代码IU)QSPA台站(南极洲,在安静的南极)的STS-2.5地震计的U模块质量块位置的满量程输出百分比。冰层中缓慢的逐渐倾斜导致仪器的质量块偏离中心,需要每月重新居中。垂直轴定义了特定传感器的可操作质量块位置范围的百分比,在质量块位置通道的元数据中也有定义(原图为彩色图——译注)
2.4质量块位置
该度量使用SEED元数据中描述的多项式响应,将质量块位置测量值转换为伏特。然后,使用响应的上限和下限,我们估计质量块位置为传感器满量程的百分比。这种方法允许我们考虑质量块位置输出中的潜在DC偏移以及不同的质量块位置灵敏度(例如,QuanterraQ680数据记录器上的质量块位置输出范围在0~1024之间,512为中心)。图7示出了IU台网的QSPA台站(南极洲,在安静的南极)的STS-2.5地震计的Galperin悬架U模块的质量块位置度量值。该传感器安装在冰面上的缓慢倾斜的表面拱顶中,导致质量块位置漂移,并需要周期性的质心重新居中。使用DQA,我们能够确定本仪器质量块有必要重新居中的频度,大约为每月一次。
2.5新的低噪声模型偏差
通过每天将台站噪声水平与参考噪声模型,例如新的低噪声模型(NLNM;Peterson,1993)进行比较,我们能够比较台站噪声水平,以及其相对于已知参考模型的性能(图8)。该度量当前在4个频带(4~8s,18~22s,90~110s和200~500s周期)中实现,分别对应于次到微震、初到微震、面波和地球简正模。我们估算功率谱密度(PSD)的方法遵循韦尔奇方法。在一天的数据中,我们用13个波段叠加计算PSD,用填零的方法将谱密度数值表示成2的某个幂次,75%重叠。我们还去除线性趋势的均值,应用10%余弦函数的端部尖灭,零填充至2的幂,并去除仪器响应。然后将PSD线性内插到NLNM的频点,其中我们以dB为单位取内插PSD和NLNM之间的逐点差。最后,我们取上述频段中这些差异的平均值。该代码允许用户指定参考模型,并且可以容易地实现其他模型,比如GSN噪声模型(Bergeretal,2004)。使用汇总级别的排序功能,DQA允许用户对每个频段的台站性能进行排名(图2)。这也可用于对台站进行排名,类似于拉蒙特波形质量中心开发的方法。图9显示了IC中心BJT台站(中国北京市白家疃)STS-1传感器在2013年5月翻新后,相对于NLNM的噪声水平变化(以dB为单位)。
图82013年3月1日,在IRIS/USGS(台网代码IU)TUC台站(美国亚利桑那州图森)的DQA中使用的垂直分量频谱比较(原图为彩色图——译注)。差值度量是主传感器(绿色实线)和辅助传感器(红色实线)两个功率水平的平均逐点差。新的低噪声模型(NLNM;Peterson,1993)偏差是NLNM(黑色实线)与主传感器(绿色实线)和次级传感器(红色实线)每日功率谱之间的平均逐点差异。台站偏差度量是主传感器(绿色虚线)与每日噪声(绿色实线)以及次级传感器(红色虚线)与每日噪声(红色实线)相比的第10个百分位数噪声模型的平均逐点差异。DQA中使用的频率被描绘为蓝带:4~8s,18~22s,90~110s和200~500s周期
图9从2009年6月至2014年9月,中国数字地震台网(网络代码IC)BJT台站(中国北京市白家疃)的地震计STS-1(位置代码00)的长周期垂直分量与新的低噪声模型(NLNM;Peterson,1993)之间的偏差。该台站于2013年5月进行了翻新,配备了用于STS-1的新底板和电子盒。设备维护降低了该台站的传感器噪声(原图为彩色图——译注)
图10IRIS/USGS台网(代码IU)的BBSR台站(百慕大圣乔治海洋科学研究所)的主传感器(位置代码00)的LH1通道的坏道度量图。CMG3-TB在2012年8月18日发生故障,并在2013年8月21日被Trillium120井下传感器取代(原图为彩色图——译注)
图11从2013年12月至2014年7月,山际西部台网(代码IW)SMCO台站(美国科罗拉多州斯诺马斯)的CMG-3TESP仪器的LHZ通道与背景噪声相比,从其第10个百分位数基线发生偏差,其周期窗口为4~8s。在即将进行的维护进程中,将更换该传感器,可以使用度量标准上的检测器自动识别这种快速变化的类型(原图为彩色图——译注)
图11从2013年12月至2014年7月,山际西部台网(代码IW)SMCO台站(美国科罗拉多州斯诺马斯)的CMG-3TESP仪器的LHZ通道与背景噪声相比,从其第10个百分位数基线发生偏差,其周期窗口为4~8s。在即将进行的维护进程中,将更换该传感器,可以使用度量标准上的检测器自动识别这种快速变化的类型(原图为彩色图——译注)下载原图
2.6坏道
由于微震噪声的普遍存在,台站噪声水平与参考模型的偏差提供了一种检测仪器有问题的方法,例如坏道或灵敏度显著降低的通道。在这种情况下,通道噪声水平比4~8s周期波段中的NLNM低5dB以上(例如,该频带中NLNM的偏差是-5以下)被识别为“坏道”,逻辑上的真实结果被注入数据库。根据之前在数据库中存储的结果,该指标利用了SEEDscan的可计算新指标的能力。图10显示了2012年8月IU台网的BBSR(百慕大圣乔治海洋科学研究所)台站的GuralpCMG-3TB仪器坏了。
2.7台站偏差
这个度量是对绝对基准的噪声水平度量的补充,该度量将台站的噪声水平与基准性能水平进行比较。基线通过PQLX使用第10个百分位数噪声水平估算(McNamaraandBuland,2004;McNamara,2009),每个通道使用大约10年的数据。然后,我们采用与NLNM偏差度量相同的方法,计算了4个频带中的功率谱和台站基线之间逐点差的平均值(图8)。图11示出了IW台网SMCO台站(美国科罗拉多州斯诺马斯)的长周期垂直偏差。
2.8事件与合成计算结果的比较
对于大地震,我们估算宽频带数据和长周期合成波形之间的比例因子,以识别仪器在记录强地震动的时间段内潜在的问题(Ekströmetal,2006)。我们的比较利用广泛分布的正态模式求和综合(Woodhouse,1988)程序Mineos(Masters,2010)。对于6.5级以上的大地震,我们计算由DQA处理的所有台站的合成计算。数据从发震时刻开始加窗,延长至4000s,去卷积得到位移,带通滤波在165~400s周期之间。这些参数可以根据感兴趣的窗口轻易改变。然后我们比较合成计算y(tn)和数据x(tn)之间的比例因子(逐点和)。
Σnx(tn)y(tn)Σny(tn)2 (1)
式中,tn是第n个数据点的时间。最后,制作视图供以后检查(图12)。
2.9区别
在具有共址宽频带传感器的台站,我们能够通过比较传感器之间的频谱功率差异(以dB为单位)来识别响应和传感器性能问题(Ringleretal,2010)。在DQA中,我们通过取4个频带(4~8s,18~22s,90~110s和200~500s周期)中PSD的逐点差的平均值来计算这种差异。我们的PSD使用与NLNM偏差度量中描述的相同参数来计算。次级(4~8s周期)和初级(18~22s周期)微震频带提供了两个大多数宽频带地震计在具有平坦速度响应的频率下的,潜在增益差异的估计。这也使我们能够识别其中一个仪器相对于另一个共址仪器具有较高噪声的情况(图13)。
2.10一致性
在具有两个共址的宽频带传感器的台站,我们将所有水平数据旋转到南北和东西方向后,比较传感器在4个特定频段(4~8s,18~22s,90~110s和200~500s周期)幅度平方的一致性。我们使用NLNM偏差度量中描述的韦尔奇平均法来估计波谱含量。由于初级和次级微震频带中的信噪比普遍较高,即使仪器响应没有在元数据中得到很好的表征,我们也能够比较两种仪器之间信号的相似性。作为在IU台网CCM台站(美国密苏里州大教堂洞穴)使用一致性度量的一个例子,发现STS-1和STS-2.5地震计之间的水平噪声非常一致,且随季节变化(图14)。众所周知,局部大气压力变化会引起拱顶的局部倾斜,从而导致噪声增加(Zürnetal,2007)。我们看到,在冬季和春季(当大气压力活动较高时),拱顶倾斜信号在共址的传感器之间更加一致,而在夏季月份(当大气活动较低时),这种一致性降低。
图12用于计算地震事件和合成矩阵比较的数据。比较了2014年7月11日中国数字地震台网(台网代码IC)XAN台站(中国西安市)记录的日本北部发生的M0=6.8事件,该地震距XAN台站27.2°。我们比较了合成事件(黑色)、主传感器(绿色)和次传感器(红色)迹线的垂直分量(顶部)、派生的南北分量(中间)和派生的东西分量(底部)。南北和东西向数据从潜在的非定向水平传感器派生。主传感器的比例因子为1.0(LHED),0.78(LHND)和0.99(LHZ)。类似地,次传感器的比例因子为0.99(LHED),0.81(LHND)和1(LHZ)(原图为彩色图——译注)
图12用于计算地震事件和合成矩阵比较的数据。比较了2014年7月11日中国数字地震台网(台网代码IC)XAN台站(中国西安市)记录的日本北部发生的M0=6.8事件,该地震距XAN台站27.2°。我们比较了合成事件(黑色)、主传感器(绿色)和次传感器(红色)迹线的垂直分量(顶部)、派生的南北分量(中间)和派生的东西分量(底部)。南北和东西向数据从潜在的非定向水平传感器派生。主传感器的比例因子为1.0(LHED),0.78(LHND)和0.99(LHZ)。类似地,次传感器的比例因子为0.99(LHED),0.81(LHND)和1(LHZ)(原图为彩色图——译注)下载原图
2.11地震事件的强震动比较
类似于地震事件与合成结果比较的度量,我们使用大地震(M0≥6.5)来验证具有共址宽频带传感器的台站的加速度计的性能(Ringler,2012a)。为此,我们计算加速度计x(tn)和宽频带传感器y(tn)长度为N的轨迹之间差值的均值平方根:
Σn(x(tn)−y(tn))2N (2)
图13IRIS/USGS台网(代码IU)MBWA台站(澳大利亚大理石酒吧)的主次传感器的东西向长周期分量(通道LH1和LH2旋转以产生LHED通道)在4~8s周期功率水平的差异。该图清楚地说明了从5月份开始,其中一个传感器出现了一个严重问题。彼得森新的低噪声模型(NLNM;Peterson,1993)或台站基线的噪声水平变化的调查表明,钻孔仪器GuralpCMG-3坏了(原图为彩色图——译注)
图13IRIS/USGS台网(代码IU)MBWA台站(澳大利亚大理石酒吧)的主次传感器的东西向长周期分量(通道LH1和LH2旋转以产生LHED通道)在4~8s周期功率水平的差异。该图清楚地说明了从5月份开始,其中一个传感器出现了一个严重问题。彼得森新的低噪声模型(NLNM;Peterson,1993)或台站基线的噪声水平变化的调查表明,钻孔仪器GuralpCMG-3坏了(原图为彩色图——译注)下载原图
图14在2012年1月1日至2013年12月31日期间,IRIS/USGS(台网代码IU)的CCM(美国密苏里州大教堂洞穴)台站仪器STS-1(位置代码00)和STS-2.5(位置代码10)的东西向长周期分量在200~500s周期的平均幅度平方的相干性(上图)。该图还显示了STS-1的长周期第二通道(通道名称LH2)分量与彼得森新的低噪声模型(NLNM;Peterson,1993)在200~500s周期内的平均偏差(下图)(原图为彩色图——译注)
图14在2012年1月1日至2013年12月31日期间,IRIS/USGS(台网代码IU)的CCM(美国密苏里州大教堂洞穴)台站仪器STS-1(位置代码00)和STS-2.5(位置代码10)的东西向长周期分量在200~500s周期的平均幅度平方的相干性(上图)。该图还显示了STS-1的长周期第二通道(通道名称LH2)分量与彼得森新的低噪声模型(NLNM;Peterson,1993)在200~500s周期内的平均偏差(下图)(原图为彩色图——译注)下载原图
图15由于现场温度很高,IRIS/USGS台网(代码IU)TUC台站(美国亚利桑那州图森)已成为强震动加速度计度量标准的试验场,传感器在现场反复出现故障。2013年春季,发现强震动加速度计(位置代码20)的长周期垂直通道(通道名称LNZ)的噪声较高。后来安装了新的镀镍强震动加速度计,发现其噪声水平变好了(原图为彩色图——译注)
图15由于现场温度很高,IRIS/USGS台网(代码IU)TUC台站(美国亚利桑那州图森)已成为强震动加速度计度量标准的试验场,传感器在现场反复出现故障。2013年春季,发现强震动加速度计(位置代码20)的长周期垂直通道(通道名称LNZ)的噪声较高。后来安装了新的镀镍强震动加速度计,发现其噪声水平变好了(原图为彩色图——译注)下载原图
图16众所周知,地面传感器的长周期水平噪声主要由倾斜噪声引起。IRIS/USGS台网(代码IU)的DWPF台站(美国佛罗里达州迪斯尼荒地保护区)具有一个井下主传感器(地面以下162m)和一个地面次传感器。通过比较大约3年的数据(2010年11月11日至2013年12月3日),我们可以看到井下主传感器(右下)的第一个长周期水平分量(通道代码LH1)在90~110s周期的新的低噪声模型(NLNM)(Peterson,1993)比地面传感器(位置代码10)的NLNM大约低32dB(左下)。这些噪声水平差异与理论噪声随深度的衰减一致(原图为彩色图——译注)
图16众所周知,地面传感器的长周期水平噪声主要由倾斜噪声引起。IRIS/USGS台网(代码IU)的DWPF台站(美国佛罗里达州迪斯尼荒地保护区)具有一个井下主传感器(地面以下162m)和一个地面次传感器。通过比较大约3年的数据(2010年11月11日至2013年12月3日),我们可以看到井下主传感器(右下)的第一个长周期水平分量(通道代码LH1)在90~110s周期的新的低噪声模型(NLNM)(Peterson,1993)比地面传感器(位置代码10)的NLNM大约低32dB(左下)。这些噪声水平差异与理论噪声随深度的衰减一致(原图为彩色图——译注)下载原图
该方均根差值是将两个仪器记录都反卷积计算成位移并带通滤波到4~20s周期后得到的。为了避免信号在高增益宽频带传感器上被削弱,我们在P波到达前120s开始,到S波到达后120s结束的时间窗口中对比仪器(图15)。
3、DQA示例
大多数情况下,DQA中的指标是数据质量的间接度量。例如,传感器增益的稳定性是重要的数据质量属性。但是,如果不进行校准,我们无法远程直接测量增益,并且必须依靠精心设计的指标来识别比年度校准计划更短的时间尺度的变化。同样,传统波形分析的局限之一是人眼难以识别噪声水平或响应的细微变化。DQA为我们提供了一种工具,可以同时检查多个指标并利用它们不同的敏感性。这里我们通过几个例子说明DQA的实用性。
3.1台站概要
图2示出了IC网络的DQA台站的概要视图。台站概要是DQA的“起点”,默认视图显示所有台站。此视图包含权重选项卡(允许用户选择哪些指标用于数据质量评估),这些选项将在第4节中讨论。例如:“导出”(允许用户复制、打印、创建当前视图的CSV表或PDF文档)、“列”(允许用户选择显示哪些度量)和“组”(允许用户选择用户定义的台站子集,如特定台网、区域、通信类型等)。也可以通过左上角的搜索按钮选择特定的台站或台网。可以通过日历日期或一年中的某一天来选择显示的时间段。
在台站概要级别显示的度量值是各个通道度量值的平均值。点击台站的度量将生成所选时间段的图形(例如,图4)。台站概要可以按任一列排序,例如,允许通过相对于NLNM的噪声水平作绝对排序,也可按有多少可用记录或地震计的质量块位置进行排序。
3.2台站视图
从台站概要中,可以通过单击台站代码来研究台站(图3)。台站视图包括元数据中标识的每个连续通道的条目,根据通道类型计算不同的度量。例如,可计算每个通道的可利用性、缺失多少记录和授时质量,但仅针对LH通道计算噪声水平。
台站视图还包括“衍生的”水平通道(例如,信道名称LHND)。这些通道是通过将水平分量旋转到真正的南北和东西向通道而生成的。这些可用于与合成地震图比较以及和所有传感器之间进行比较。
3.3噪声分析
使用DQA,我们能够识别可能提高台站噪声水平的仪器安装条件。IU台网的DWPF台站(美国佛罗里达州迪斯尼荒地保护区)有一个钻孔传感器(位置代码为00),安装深度为162m,以及一个二级拱顶传感器(位置代码为10)。通过比较各分向之间水平的噪声水平(图16),我们发现井下传感器的噪声水平在90~110s之间比二级拱顶传感器低32dB。这些噪声水平与作为深度函数的已知噪声衰减一致(Sorrells,1971)。
3.4传感器问题
图17显示了几个指标对传感器问题的敏感性。ANSS(台网代码为US)DGMT台站(美国蒙大拿州达格玛)于2011年年底开始出现问题,一直持续到2012年年初。该台站安装了两个宽频带传感器,因此在一致性中很容易发现该故障。然而,通过观察90s和110s的NLNM的偏差变化,以及事件与合成结果的比较度量,该故障也是显而易见的。
4、数据质量评估
开发DQA的动机之一是量化数据质量。数据质量非常难以定义,并且在很大程度上取决于要解决的问题或用户对数据的预期应用。对于GSN,数据质量评估通常在大地震之后进行,并且本质上是非常定性的。使用的少数量化指标之一是可用性,这是GSN的一种性能指标。
图17美国国家现代地震监测系统(台网代码US)的DGMT台站(美国蒙大拿州达格玛)的次传感器STS-2(位置代码10)的垂直分量于2011年年底开始遇到问题,该问题一直持续到2012年年初。后来确定该仪器的主机盒出现了故障。这可以从以下几个指标中观察到:(右)在90~110s波段与彼得森新的低噪声模型(NLNM)的偏差变化,(左下)事件比较合成测量,以及(左上)在200~500s周期内主传感器和次传感器之间的相干性。更换主机盒后,此问题已解决。在2012年下半年,该台站被观察到存在另一个问题(原图为彩色图——译注)
图17美国国家现代地震监测系统(台网代码US)的DGMT台站(美国蒙大拿州达格玛)的次传感器STS-2(位置代码10)的垂直分量于2011年年底开始遇到问题,该问题一直持续到2012年年初。后来确定该仪器的主机盒出现了故障。这可以从以下几个指标中观察到:(右)在90~110s波段与彼得森新的低噪声模型(NLNM)的偏差变化,(左下)事件比较合成测量,以及(左上)在200~500s周期内主传感器和次传感器之间的相干性。更换主机盒后,此问题已解决。在2012年下半年,该台站被观察到存在另一个问题(原图为彩色图——译注)下载原图
为了允许定量测量数据质量,DQA允许用户选择一个或多个指标,并将权重应用于各个指标和等级。例如,对于区域尺度的地震监测,用户可能会优先考虑4~8s和18~22s周期内的高可用性、授时质量和相对低噪声。对2013年10月1日至2013年12月31日期间的数据,所有5个指标应用相同权重,美国台网LKWY台站(美国怀俄明州黄石国家公园黄石湖)和AHID台站(美国爱达荷州奥本孵化场)显示所有数据的最高质量均是由ASL运作的(图18)。相比之下,对于全球地震监测,用户可能会优先考虑数据的高可用性、高授时质量、90~110s和200~500s周期内的低噪声以及低缺失数。图18(底部)产生了通过权重排序的台站,该权重给出了这些度量中的每一个权重为总权重的20%。
为了组合如图18所示的度量,我们将度量值从其固有单位转换为百分比。可用性和授时质量已经表示为百分比;其他指标按附录A中的描述进行转换。
5、讨论以及未来的工作
我们已经完成了DQA开发的初始阶段,并且在18个计划中已经实施了11个指标(表1)。第一组指标提供了DQA概念的证明,证明了其对区域、国家和全球地震台网数据质量分析的适用性。
图182013年10月1日至2013年12月31日期间,通过加权各种指标得出的数据质量“等级”插图。在顶部屏幕截图中,对可用性、授时质量以及4~8s和18~22s频段台站噪声基线的保真度进行平均加权,并显示了排序结果。在底部的屏幕截图中,对可用性、授时质量、缺失数据计数以及90~100s和200~500s频段的低噪声进行了平均加权,并显示了排序结果(原图为彩色图——译注)
图182013年10月1日至2013年12月31日期间,通过加权各种指标得出的数据质量“等级”插图。在顶部屏幕截图中,对可用性、授时质量以及4~8s和18~22s频段台站噪声基线的保真度进行平均加权,并显示了排序结果。在底部的屏幕截图中,对可用性、授时质量、缺失数据计数以及90~100s和200~500s频段的低噪声进行了平均加权,并显示了排序结果(原图为彩色图——译注)下载原图
进一步开发DQA的优先事项,包括完成剩余度量指标、通过提升绘图功能改进现有界面、将度量指标扩展到更高频率,以及开发其他界面以提供不同的指标视图,方便历史台站元数据和性能的验证,并允许监控数据质量目标。改进导出方法可以更容易地提取度量值。
6、结论
为了补充制定明确的数据质量目标,并以XML格式分发仪器质量信息,DQA旨在增强ASL识别和交流数据质量问题的能力。DQA补充了传统的波形检查,并提供了使用多种不同数据质量指标来表征数据质量的新功能。DQA旨在灵活地添加新指标,并且可移植以供网络运营商在其自己的客户端设备上使用。
尽管DQA仍处于开发阶段,但它已在ASL中用作数据质量控制工具和监测台站遥测。我们鼓励感兴趣的用户测试DQA并与ASL合作开发新指标或优化当前指标。Java代码可以通过可根据要求提供Web界面以及各种应用程序的其他代码。
附录A
表A1带有用于颗粒级配曲线的值的表格。第1列是度量;第2列是颗粒级配曲线方程式中使用的第一参数;第3列是颗粒级配曲线方程式中使用的第二参数;第4列是由两年的度量值估算的第一参数值;第5列是用m表示的90%最佳的平均值
为了将度量值转换为类似等级的百分比,我们使用了本附录中详述的颗粒级配曲线方案。通过计算颗粒级配曲线,我们为每个指标分配一个0%~100%之间的值。然后在DQA的概要页面中使用这些等级构成合计值。为了确定每个度量的颗粒级配曲线,我们使用了两年(2012年和2013年)的IU台网台站的度量结果分析了汇总度量值。对于每个度量,表A1的第二列中的派生度量值的转换在数值上从最佳到最差排序(对于一致性,这是以递减顺序排序,并且所有其他度量以递增的顺序排序)。选择这些派生度量以考虑负值和正值度量值。然后,我们计算得出最佳90%的度量值的平均值m,显示在表A1的第5列中。然后对指标进行加权,使得该平均值对应于“B”等或85%的中等等级,并且最佳等同于“A”或100%的等级。特定度量的等级可使用以下公式计算特定台站和日期的数据等级:
图A1对IRIS/USGS台站在2012年和2013年的每日缺失排序(上图)。下图描绘了台站的颗粒级配曲线,以百分比表示
图A2IRIS/USGS台站在2012年和2013年的满刻度质量位置百分比(上图)。下图描绘台站的颗粒级配曲线,以百分比表示
等级=100−15参数1−参数2m (3)
式中,参数1的度量值在表A1中第2列给出,参数2在表A1的第3列中定义,其相关值在第4列中给出。在任何情况下,我们都将等级限制在0~100%之间。我们在图A1~A6中显示了已经估算出的度量值的相应颗粒级配曲线。例如,在图A1中,上部图显示了每天的数据缺失数(每个台站的缺失总数除以730天),并且从具有最少缺失的台站到具有最大缺失的台站进行分类。图A1的下部图显示了由等式(3)估计的每个台站的等级。我们没有计算基于事件的度量的颗粒级配曲线。对于每一个图,上部图对应于针对给定的导出度量值从最佳到最差排序的台站,使得台站1是针对该度量的最佳执行台站,并且台站n是针对该度量的第n个最佳执行台站。然后,给定台站、日期和度量的等级将包括在总等级中。当不加权时,则默认值是对每个度量标准进行相等的加权。每个度量标准也可以通过给出总量的一定百分比来加权(例如,给授时质量10%的总量将意味着所有其他度量标准的权重相等,以计算总等级的其他90%)。
图A3IRIS/USGS台网在2012年和2013年彼得森新的低噪声模型偏差(上图),以dB为单位。下图将台站在4个频段(4~8s,18~22s,90~110s和200~500s周期)的颗粒级配曲线,以百分比表示
图A4IRIS/USGS台网在2012年和2013年的台站偏差(单位为dB)(上图)。下图描绘了台站在4个频段(4~8s,18~22s,90~110s和200~500s周期)的颗粒级配曲线,以百分比表示下载原图
图A52012年和2013年共址的IRIS/USGS台网的功率水平的绝对差值(上图),以dB为单位。下图描绘了4个频段(4~8s,18~22s,90~110s和200~500s周期)中的台站颗粒级配曲线,以百分比表示
图A62012年和2013年IRIS/USGS台网共址的宽频带传感器之间的一致性(上图),从最佳到最坏。下图描绘了台站在4个频带(4~8s,18~22s,90~110s和200~500s周期)的颗粒级配曲线,以百分比表示
A.T.Ringler,M.T.Hagerty,J.Holland,A.Gonzales,L.S.Gee,J.D.Edwards,D.Wilson,A.M.Baker,朱凤梅.数据质量分析器:地震数据的质量控制程序[J].世界地震译丛,2020,51(04):410-430.
分享:
随着社会经济不断发展,社会化进程不断加快,国际油田勘探工程也得到了较快的发展,全球工业生产,社会经济的发展对于石油的需求量越来越大,石油产业发展的相关技术研究也得到了业界的关注。目前,国际油田开采存在受到地质环境限制,石油勘探及开采项目开展会受到地质环境的限制,增加了石油勘探的难度。
2024-08-31目前我国地下金属矿山的开采正处于“由浅至深、由易至难、由富至贫”的关键转型期,在一个矿区内采用单一采矿方法进行回采的传统模式已难以实现矿产资源安全、经济、高效、充分回收的目标。近年来,协同开采理念的提出为化解这一难题提供了一条重要途径该理念的核心在于将不同采矿方法在同一矿区内进行最大程度整合。
2024-06-25随着全球化进程的加快和社会的不断发展,工业、军事等领域对矿产资源需求不断增大,但我国主要资源开采带的矿产储量逐渐减少,亟需对我国复杂地形的矿产资源进行勘探开采,因此需要更高性能和更加灵活的地层勘探仪器来探明地层结构,从而保障资源开采过程中人员和设备的安全。
2024-01-03随着全球化进程的加快和社会的不断发展,工业、军事等领域对矿产资源需求不断增大,但我国主要资源开采带的矿产储量逐渐减少,亟需对我国复杂地形的矿产资源进行勘探开采,因此需要更高性能和更加灵活的地层勘探仪器来探明地层结构,从而保障资源开采过程中人员和设备的安全。
2024-01-03油气管道是目前最重要的能源输送方式之一,我国陆上油气管道总里程长、分布广阔、沿线地质环境复杂多变。由于各方面的考虑,管道可能敷设在滑坡地带,也有可能在管道敷设后由于工程活动或者地址变动等种种原因导致沿线发生滑坡。而滑坡灾害对管道危害巨大,能够挤压管道导致管道变形甚至破坏,进而导致管道输送的油气泄露,
2023-12-29由于我国采矿技术的提升,以及煤矿开采范围的扩大,部分矿业公司在经营管理与生产活动中将面临着很多的安全难题,比如对安全技术的了解不足、对安全方面的资金支持欠缺等,使采矿过程中地质灾害问题频频出现。不论是矿业企业的管理者还是其他管理人员,都应当提升采矿过程中的安全生产能力,积极采取正确可行的安全措施,减少矿井地质灾害的风险,维护矿井职工的安全,确保我国矿业的可持续、安全、平稳的发展。
2023-12-06据中国地震台网正式测定,当地时间2023-02-06,土耳其发生4次地震,其中2次震级高达7.8。研究表明,地震前后大气中的水汽含量会出现异常变化[1,2,3,4,5]。大气可降水总量(total precipitable water, TPW)是表征大气中水汽含量的重要指标,而卫星遥感是反演TPW的重要手段之一[6,7]。
2023-11-29天水市是典型的山间河谷盆地型城市。区内黄土分布广,厚度大,垂直节理和裂隙发育,降雨集中分布,致使沟壑纵横,地貌地形支离破碎,地质环境十分脆弱[1,2,3],在自然因素以及人类工程活动影响下,滑坡、泥石流、崩塌、不稳定斜坡失稳等地质灾害现象频繁发生[4]。
2023-11-08在工程建设和岩土施工过程中,地质灾害尤其是滑坡问题时有发生,这主要是由于边坡的稳定性受到了岩土层变化的影响,因此,提高边坡的稳定性对预防滑坡问题至关重要。随着科学技术的不断发展,我国岩土施工技术也在不断地改进中,岩土施工技术的合理运用,对有效治理地质灾害起决定性作用,要求相关技术人员必须认识到科学合理应用其施工技术的重要意义。
2023-11-08乐矿能源(原乐平矿务局,简称乐矿)地处赣东北景德镇市境内,其下属的煤矿均分布在萍乐坳陷东北端,多在20世纪50、60年代建设。乐平矿区所属煤矿煤炭资源分布不均,开采条件相对较差,矿井规模都比较小,而且煤层瓦斯含量高、灾害严重,矿区矿井水文地质条件也较复杂。
2023-11-08我要评论
期刊名称:地学前缘
期刊人气:4039
主管单位:中华人民共和国教育部
主办单位:中国地质大学(北京),北京大学
出版地方:北京
专业分类:地质
国际刊号:1005-2321
国内刊号:11-3370/P
创刊时间:1994年
发行周期:双月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:2.546
影响因子:0.659
影响因子:0.149
影响因子:1.209
影响因子:2.866
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!