在实际工作中,往往需要对取得的数据资料进行整理,使其满足特定的分析需求,下面介绍SPSS在资料整理方面的一些功能. 1.加权个案加权个案是指给不同的个案赋予不同的权重,以改变该个案在分析中的重要性.为什么要这么做呢?比如某些原始的数据资料每一行代表一个个案,在实际分析时,通常会整理成列联表或频数表,即增加一个频数变量,对重复取值的个案进行计数,这样整理之后数据内容会简化很多,但如果直接使用的话还不行,因为每种取值的个数不同,导致权重不同,因此需要加权处理.SPSS的加权个案在数据菜单的加权个案过…
有时我们需要对数据资料按照某个规则进行归组,如 在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3 有两种方法可以实现: 1.使用计算变量功能 <1>打开转换-计算变量菜单,定义组变量名group,并在数字表达式中赋值为1,点击确定,这样资料中新增了一个名为group的变量,并且值全部为1<2>打开转换-计算变量菜单,在数字表达式中赋值为2,点击左下方“如果”按钮,设置条件年龄>=30 & 年龄<=40,点击确定,之后看到g…
首先说一下什么是离散化以及连续变量离散化的必要性. 离散化是把无限空间中无限的个体映射到有限的空间中去,通俗点讲就是把连续型数据切分为若干“段”,也称bin,离散化在数据分析中特别是数据挖掘中被普遍采用,主要原因有: 1.算法需要.有些数据挖掘算法不能直接使用连续变量,必须要离散化之后才能纳入计算,在数据挖掘软件中,表面上看可以直接使用连续变量进行计算,实际上在软件后台已经对其进行了离散化预处理. 2.降低异常数据的敏感度,使模型更加稳定.我们知道极端值和异常值会使模型参数拟合的不准确,误差过大…
常常忘记mysql的一些命令行操作,甚至于说,比较复杂的sql格式记不住或忘记了,也可能根本不会考虑去记,因此,做一下汇总,当下次出现恍惚时不至于去百度挨个找,有时就是记不起来,但是只要给点药引子,立马会想起来. 一.mysql基础操作 mysql命令规则:每行sql后边都跟个分号表示一个命令语句结束 1.登录本地mysql数据库 $ mysql -u root -p$ password 2.更改root密码 mysql>mysqladmin -uroot password 'yourpassw…
1.mysql简单的查询:select 字段1,字段2...  from tablename; 如果字段那里写一个*,代表查询所有的字段,等同于指定出所有的字段名,因此如果要查询所有字段的数据,一般都是用*. 2.去重查询:select distinct 字段1,字段2... form tablename: 可以结合上一张图的结果来对比. 3.直接在查询时做数学四则运算,加减乘除余: 4.查询时给查询结果字段重命名:select 字段1 as 名称1,字段2 as 名称2 ... from ta…
1.使用order by对查询的结果进行排序,asc升序,desc降序: 也可以在order by后指定多个字段名和排序方式进行多级排序: 2.使用limit限制查询结果的数量: 上图中的0,代表查询的开始位置,也可以理解为跳过的数量:上图中的2代表需要查询出的数量.这个表中有3条数据,因为限制了条数为2,因此实际结果只是两条.另外,这里的初始位置是0,实际上可以不写,默认就是0: 这里还有一种情况,就是指定查询结果的数量可能大于表中的实际数量,这个时候返回结果会返回表中所有符合条件的数据,例如…
1.插入单条数据:insert into tablename(字段名1,字段名2,...) values(值1,值2,...); 从图中可以看出,插入时不需要每个字段都有值(在没有相关的约束前提下),但是需要注意的是字段的数量和后边的值的数量必须一致,还要和自定的字段的顺序一致,类型也要一致,否则会报错.另外,如果没有指定任何字段的情况下,默认是选择了所有字段,则必须每个字段都有对应的值,并且需要和表中的字段顺序一致,否则会报错,如图: 2.插入多条数据:insert into tablenam…
1.单条件查询:select 字段名 from tablename where 条件: 2.简单多条件查询,使用&&或者between and等: 3.is null和is not null查询,这里要注意null不是空字符串不是0: 4.in和not in查询,相当于是用or把in后边的集合元素连起来.注意如果in后边带的集合中存在null,那么不会影响结果,但not in后边集合中有null,就不会查处任何结果,not in也查不出null: 5.like模糊查询(不仅适用字符串):…
各种张量初始化 创建特殊类型的tensor a = torch.FloatTensor(2,3) a = torch.DoubleTensor(2,3) ... 设置pytorch中tensor的默认类型 torch.set_default_tensor_type(torch.DoubleTensor) 更改tensor类型 a.float() 各种常用初始化 torch.randn_like() torch.rand(3,3) #创建 0-1 (3,3)矩阵 torch.randn(3,3)…
各种张量初始化 创建特殊类型的tensor a = torch.FloatTensor(2,3) a = torch.DoubleTensor(2,3) ... 设置pytorch中tensor的默认类型 torch.set_default_tensor_type(torch.DoubleTensor) 更改tensor类型 a.float() 各种常用初始化 torch.randn_like() torch.rand(3,3) #创建 0-1 (3,3)矩阵 torch.randn(3,3)…