一、数据集:

首先介绍数据集参数:

英文简称 英文全称 中文全称 单位 换成正常单位 说明1 说明2
Time Time 时间 小时:分钟      
Temp Temperature 温度 摄氏度      
DO Dissolved Oxygen 溶解氧 mg/m3 1mg/m3 = 1x10-3mg/L    
Clar Visual Water Clarity 透明度 m   中文全称是否正确  
Turb Turbidity 浊度 NTU   单位全称nephelometric turbidity unit  
pH Hydrogen ion concentration 氢离子浓度        
Cond Electrical conductivity 电导率 uS/cm 在25℃下      
BOD5 Biochemical Oxygen
Demand-5 day incubation
生化需氧量
培养5天
ppm   在20℃下进行5天氧耗尽实验  
NH4-N Ammonia 氨氮浓度 mg/m3   该数据受到实验室NH4污染  
NO3+NO2 Nitrate+Nitrite nitrogen 硝酸盐+亚硝酸盐 mg/m3   主要存在硝酸盐  
TN Total Nitrogen(Organic N + NO3 + NH4) 总氮(有机氮+硝酸盐+铵) mg/m3      
DRP Dissolved Reactive Phosphate 溶解活性磷酸盐 mg/m3      
TP Total Phosphate 总磷 mg/m3      
A340 Absorbance @ 340nm 在340nm的吸光度 Abs x1000 采用四舍五入成整数    
A440 Absorbance @ 440nm 在440nm的吸光度 Abs x1000 采用四舍五入成整数    
A740 Absorbance @ 740nm 在740nm的吸光度 Abs x1000 采用四舍五入成整数    
g340 Absorbance co-efficient @ 340nm 在340nm的吸光度系数 /m   从340和740nm处的吸光度值计算得到  
g440 Absorbance co-efficient @ 440nm 在440nm的吸光度系数 /m   从440和740nm处的吸光度值计算得到  
T_coil Total coliforms 总大肠菌群 /100ml     数据从2005年开始记录
E_coil Feacal coliforms 粪大肠菌群 /100ml     数据从2005年开始记录

二、数据检测过程说明

1.上述表格中的时间、温度、溶解氧、透明度是在现场测量到的(DO是现场测量%DO,在实验室转换为ppmDO)

2.将水质样品收集在1升聚乙烯瓶中,气密密封,在冰箱中存储,24h内送到化学实验室进行分析。

3.收到样品后,加热至室温(样品瓶放置于水浴中),立即分析pH、电导率、浊度;然后将剩余样品进行二次取样到100ml的容器中获得总氮、吸光度、吸光度系数、铵、硝酸盐、溶解磷酸盐等数据。

4.将初始1升样品瓶中的剩余样品用于BOD测试(在20℃下进行5天的氧耗尽实验)。

三、数据缺失说明

整个数据的跨度从1989年1月~2018年12月,不过其中部分数据缺失:

  1. 1994年的氨和总氮数据丢失。
  2. 1989年1月~2008年12月,因为温度探头寿命耗尽,部分地区缺少温度数据。
  3. 1989年1月~1994年12月,分析实验在非空调环境下运行。从1995年1月,实验室迁移到新空调屋,样本分析过程引入的误差减少。
  4. 1989年1月~2001年12月,DRP、NO3、NH4、TN、TP数据都是采用人为采样的方法手动跟踪,后来才采用电子数据替代。
  5. BOD分析在2002年7月之后停止,仅保留AK2、RO2、WA9站点,因为BOD在大多数场所都较低,没有明显变化趋势。
  6. 从2002年2月开始,进行细菌分析(总大肠菌群和粪便大肠菌群)

四、数据测量地点说明

河流英文名称 河流中文名称 样本采集地英文名称 数据集名称 数据集个数
Clutha 克鲁萨河 Balclutha DN4 29
Luggate Br AX1 29
Millers Flat AX4 29
Manawatu     玛纳瓦图河   Opiki Br WA9 29
Teachers Coll WA8 29
Weber Rd WA7 29
Mataura   马陶拉河  Parawa DN6 29
Seaward Down DN5 29
Mohaka    莫哈卡河 Glenfalls HV6 29 
Raupunga HV5 29
Motueka   莫图伊卡河 Woodstock NN1 29 
Gorge NN2 29
Ngahere   纳黑里河  Chesterhope HV3 29 
Kuripapango HV4 29
Opihi   奥皮希河  Grassy Banks TK1 29
Rockwood TK2 29
Oreti   奥雷蒂河  Lumsden DN77 29
Riverton HW Br DN8 29
Rangitaiki    朗伊泰基河  Murupara RO3 29 
Te Teko RO5 29
Rangitikei   朗伊蒂基河  Kakariki WA6 29 
Mangaweka WA5 29 
Ruamahanga      鲁玛昂加河 SH2 WN5 29 
Waihenga WN3 29
Wardells WN4 29
Taieri   泰里河  Outram DN3 29
Tiroiti DN1 29
Tarawera    塔拉威拉河(黑色排水沟) Awakaponga RO2 29
outlet RO1 29
Waikato    怀卡托河   Hamilton Traffic Br HM3 29
Rangiriri HM4 29
Reids Farm RO6 29
Waipa    怀帕河  Otewa HM1 29
Whatawhata HM2 29
Wairau    怀劳河   Dip Flat NH3 29
Tuamarina NH4 29
Purua WH4 29
Waitaki   怀塔基河  kurow TK4 29
SH1 Br TK6 29
Whanganui   旺加努伊河  Paetawa WA4 29
Te Maire TU1 29

AN之数据集的更多相关文章

  1. SSD框架训练自己的数据集

    SSD demo中详细介绍了如何在VOC数据集上使用SSD进行物体检测的训练和验证.本文介绍如何使用SSD实现对自己数据集的训练和验证过程,内容包括: 1 数据集的标注2 数据集的转换3 使用SSD如 ...

  2. HTML5 数据集属性dataset

    有时候在HTML元素上绑定一些额外信息,特别是JS选取操作这些元素时特别有帮助.通常我们会使用getAttribute()和setAttribute()来读和写非标题属性的值.但为此付出的代价是文档将 ...

  3. 数据集偏斜 - class skew problem - 以SVM松弛变量为例

    原文 接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C.回头看一眼引入了松弛变量以后的优化问题: 注意其中C的位置,也可以回想一下C所起的 ...

  4. Lind.DDD.ExpressionExtensions动态构建表达式树,实现对数据集的权限控制

    回到目录 Lind.DDD框架里提出了对数据集的控制,某些权限的用户为某些表添加某些数据集的权限,具体实现是在一张表中存储用户ID,表名,检索字段,检索值和检索操作符,然后用户登陆后,通过自己权限来构 ...

  5. Lind.DDD.Caching分布式数据集缓存介绍

    回到目录 戏说当年 大叔原创的分布式数据集缓存在之前的企业级框架里介绍过,大家可以关注<我心中的核心组件(可插拔的AOP)~第二回 缓存拦截器>,而今天主要对Lind.DDD.Cachin ...

  6. 数据集转换为Json

    数据集转换为Json 第一步:新建一个类对象  通常我会写三个属性:状态.返回信息.数据集 第二步:新建一个JSON转换类 第三步:把类对象当做参数传入JSON转换类 ———————————————— ...

  7. IRIS数据集的分析-数据挖掘和python入门-零门槛

    所有内容都在python源码和注释里,可运行! ########################### #说明: # 撰写本文的原因是,笔者在研究博文“http://python.jobbole.co ...

  8. fetch_20newsgroups 数据集导入失败: no handlers could be fetch_20newsgroups

    最简单的办法 下载'20news-bydate.pkz', 放到C:\\Users\[Current user]\scikit_learn_data 下边就行. 实际上 scikit learning ...

  9. Fast RCNN 训练自己的数据集(3训练和检测)

    转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https://github.com/YihangLou/fas ...

  10. Fast RCNN 训练自己数据集 (2修改数据读取接口)

    Fast RCNN训练自己的数据集 (2修改读写接口) 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ http ...

随机推荐

  1. 关于STLINK

    关于STLINK 1.STLIN固件升级 1)打开ST-LINK Utility,选择ST-LINK->Firmware update 2)连接ST-LINK 3)可以看到STLINK当前的软件 ...

  2. JAVA基础学习-多态 对象转型 final

    一.多态的产生条件 1:继承  存在继承的类之间 2:方法重装 3:父类继承子类重装的方法 子类的对象 也是属于父类的 二:对象的转型 1:向上转型:当子类转型成父类时 例如:Animal a = n ...

  3. codeforces1213F Unstable String Sort 思维

    题目传送门 题意:a和b都代表字符串的下标,至少用k个字符,构造一个长度为n的字符串,将这个字符串中的字符按无论是按$a$写还是按$b$写,字典序都非递减. 思路:如果将$a[l,r]=b[l,r]$ ...

  4. ubtuntu下虚拟环境搭建【python】

    为什么要搭建虚拟环境? 在开发过程中, 当需要使用python的某些工具包/框架时需要联网安装 比如联网安装Flask框架flask-0.10.1版本 sudo pip install flask== ...

  5. Vue学习笔记【21】——Vue中的动画(v-for 的列表过渡)

    定义过渡样式:  <style>    .list-enter,    .list-leave-to {      opacity: 0;      transform: translat ...

  6. linux IPC socket

    套接字是通讯端点的抽象 创建一个套接字 #include <sys/types.h> #include <sys/socket.h> int socket(int domain ...

  7. hive UDAF开发和运行全过程

    介绍 hive的用户自定义聚合函数(UDAF)是一个很好的功能,集成了先进的数据处理.hive有两种UDAF:简单和通用.顾名思义,简单的UDAF,写的相当简单的,但因为使用Java反射导致性能损失, ...

  8. 【UR #2】跳蚤公路

    [UR #2]跳蚤公路 参照yjc方法.也就是地铁环线那个题. 求每个点不在负环内的x的取值范围.然后所有1到j能到i的j的范围取交.得到答案. 每个边形如kx+b的直线,每个环也是 每个点不在负环内 ...

  9. mongdb 备份还原导入导出

    -------------------MongoDB数据导入与导出------------------- 1.导出工具:mongoexport     1.概念:         mongoDB中的m ...

  10. 杂项-WebService:WebService

    ylbtech-杂项-WebService:WebService Web service是一个平台独立的,低耦合的,自包含的.基于可编程的web的应用程序,可使用开放的XML(标准通用标记语言下的一个 ...