//stata操作
*************************数据基本操作******************************
gen varname = value //定义变量
replace varname = newvalue if ... //修改满足条件...的varname的值
drop(varname) //删除varname变量
sort (var) //按var升序排列
gsort -var //按var降序排列
strlower("string") //将string字符串都改为小写
strupper("string") //将string字符串都改为大写
strproper("string") //将string字符串每个单词的首字母都大写
keep if ... //保留满足条件...的数据
qui ... //隐藏...执行过程
return list //返回操作结果列表
list var1 var2 //以列表的形式显示var1 var2的值
summarize(var),detail //统计var在表中的一些数学值信息(最大最小、分位数、和....)
l.var //当前var值的前一个var值
gen newname=substr(varname,cut-begin,cut-length) //截取字符串
destring varname,generate(newname)|replace float //字符串转换数值(generate or replace)
encode varname,generate(newname) //将字符转化为数值但显示valuelabel(字符值)
clear //清除数据
set more off //自动显示所有过程
mkdir filename //建立文件夹 forvalues i = a/b //i值从a-b循环,包括a b
foreach i in a b c d //i值依次等于a b c d
foreach i of var varname //i值依次遍历varname列表 egen newvar = std(var) //z标准化处理
`var' //引用var的值
******************************************************************** ************************坐标轴隐藏*********************************
yscale(off)
xscale(off)
*******************************************************************
************************字符型横坐标设置****************************
gen var = _n
label val var varlabel //为var添加显示的varlabel
label define varlabel "value1" "value2" //var值为1时,varlabel=value1
//此时,使用var作为横坐标参与画图 设置xlabel(range,valuelable) 即可
******************************************************************** *****************************数据补全*******************************
teset var,newvar
tsfill,full //显示缺值
replace varname = newvalue if varname = . //补充缺值
******************************************************************** **************************文件读取与输出****************************
use dtaname.dta,clear //引用dta文件
import delimited csvname.csv,encoding(utf8) clear //引用utf8编码的csv文件 export delimited filename //输出数据到filename.csv中
graph export name.png/.tif , as(png/tif) replace save filename.dta //文件保存
******************************************************************** *****************************=中文转码******************************
unicode analyze name.csv
unicode encoding set gb18030
unicode translate name.csv,transutf8
******************************************************************** ******************************图形合并******************************
graph combine .gph .gph .gph ,ycommon xsize() ysize() graphregion(fcolor(white)) cols() rows() //x|ysize 组合图形的宽度长度
//缺点:没有图例操作
//如有对图例的特殊操作可使用 grc1leg ,使用前需先安装grc1leg第三方包
grc1leg .gph .gph,ycommon graphregion(fcolor(white)) pos() //grcleg有且尽可能使用1.gph的图例,若2.gph图例与1.gph不同。可在1.gph中增加相应颜色的线作出图例后手动hide多于的线
******************************************************************** ***********************各类图形绘制(主用twoway)*********************
//坐标轴以及网格线去除方法
yscale(off) xscale(off) ylabel(,nogrid) xlabel(,nogrid)
//直线line
(twoway) line y_1 [y_2 y_3 ...] x,lcolor() lwidth() lpattern(dash) //lpattern(dash)画虚线时使用
//带点的线
(twoway) scatter y x ,connect() lcolor() mcolor() //connect(1)表示点用直线连接 mcolor()点的颜色
//柱状图
twoway bar y x ,barw() color()
//多类型图
twoway (line y x)(bar y x) ,title() legend() saving() //saving保存为gph格式
//部分option设置
//横、纵坐标设置
x|ytitle(" ",size()) x|ylab(start(step)end|#length|none,labsize() format(%-9.2f) valuelabel angle())
//标题设置
title("",position(#)) //1<=#<=12 ,钟表方位
//背景颜色设置
graphregion(fcolor(white))
//legend设置
legend(off) //不显示图例
legend(symx() symy() cols()|rows() label( " ") label( " ") order( ) position(#) ring()) //symx|y 图标的宽度|长度;order 需要显示的图标;label 需要显示的图例;ring(0) 图例在坐标轴内
******************************************************************* *******************************************************************
//平稳性检验
dfuller / pperron / kpss
******************************************************************* ********************统计某一变量各个变量值的出现次数*******************
//先将key_word列所有字符都转化为小写
foreach i of var key_word{
    replace key_word = strlower(key_word)
}
//按照key_word首字母顺序排列
sort key_word
//统计每个key_word出现的次数
duplicates tag key_word,gen(frequency)
replace frequency = frequency + 1
//删除变量中相同的值(可同时考虑多个变量)
duplicates drop x  y, force
*****************************************************************

stata操作的更多相关文章

  1. 控制变量行业年份回归时在STATA里怎么操作_stata 分年份回归

    控制变量行业年份回归时在STATA里怎么操作_stata 分年份回归 我希望做一个多元回归,但需要控制年份和行业. (1)年份有7年2006-2012,听说STATA可以自动设置虚拟变量,请问命令是怎 ...

  2. Stata和Matlab联合处理金融数据

    Stata是统计学专业软件,可以很方便的对数据处理,但几乎只能按照整行整列进行,而且每次只能加载一个矩阵(dta文件),如果要用到多个矩阵数据进行操作或进行复杂的循环控制,就力不从心了. 而Matla ...

  3. Pandas系列(十一)-文件IO操作

    数据分析过程中经常需要进行读写操作,Pandas实现了很多 IO 操作的API,这里简单做了一个列举. 格式类型 数据描述 Reader Writer text CSV read_ csv to_cs ...

  4. Pandas IO 操作

    数据分析过程中经常需要进行读写操作,Pandas实现了很多 IO 操作的API 格式类型 数据描述 Reader Writer text CSV read_csv to_csv text JSON r ...

  5. pandas模块的数据操作

    数据操作 数据操作最重要的一步也是第一步就是收集数据,而收集数据的方式有很多种,第一种就是我们已经将数据下载到了本地,在本地通过文件进行访问,第二种就是需要到网站的API处获取数据或者网页上爬取数据, ...

  6. 关于DOM的操作以及性能优化问题-重绘重排

     写在前面: 大家都知道DOM的操作很昂贵. 然后贵在什么地方呢? 一.访问DOM元素 二.修改DOM引起的重绘重排 一.访问DOM 像书上的比喻:把DOM和JavaScript(这里指ECMScri ...

  7. Sql Server系列:分区表操作

    1. 分区表简介 分区表在逻辑上是一个表,而物理上是多个表.从用户角度来看,分区表和普通表是一样的.使用分区表的主要目的是为改善大型表以及具有多个访问模式的表的可伸缩性和可管理性. 分区表是把数据按设 ...

  8. C# ini文件操作【源码下载】

    介绍C#如何对ini文件进行读写操作,C#可以通过调用[kernel32.dll]文件中的 WritePrivateProfileString()和GetPrivateProfileString()函 ...

  9. js学习笔记:操作iframe

    iframe可以说是比较老得话题了,而且网上也基本上在说少用iframe,其原因大致为:堵塞页面加载.安全问题.兼容性问题.搜索引擎抓取不到等等,不过相对于这些缺点,iframe的优点更牛,跨域请求. ...

随机推荐

  1. Flask博客类登录注册验证模块代码(十四)

    1 文件系统 blog #博客类 App forms #表单 __init__.py user.py models #模型 __init__.py user.py static #静态文件 templ ...

  2. 【2017-06-06】Qt中的键盘事件:QKeyEvent及相关处理函数

    QKeyEvent及其相关的处理函数,比如QKeyPressEvent.QKeyReleaseEvent()等在QtGui编程中非常常用,尤其是需要借助标准键盘的编码来实现一些自定义功能的时候. 这算 ...

  3. 原文:I don’t want to see another “using namespace xxx;” in a header file ever again

    http://stackoverflow.com/questions/5849457/using-namespace-in-c-headers http://stackoverflow.com/que ...

  4. 通过一个例子学习Kubernetes里的PersistentVolumeClaim的用法

    Kubernetes的pod本身是无状态的(stateless),生命周期通常比较短,只要出现了异常,Kubernetes就会自动创建一个新的Pod来代替它. 而容器产生的数据,会随着Pod消亡而自动 ...

  5. 接口测试get请求url拼接函数(python)

    get请求地址一般是 协议+域名+端口+路径+参数,除了协议和域名其他均可为空.  http(s)://domain:port/path?key1=value1&key2=value2& ...

  6. 【洛谷2624】[HNOI2008] 明明的烦恼(Python+利用prufer序列结论求解)

    点此看题面 大致题意: 给你某些点的度数,其余点度数任意,让你求有多少种符合条件的无根树. \(prufer\)序列 一道弱化版的题目:[洛谷2290][HNOI2004] 树的计数. 这同样也是一道 ...

  7. SSH 本地和服务器传输

    [转]https://www.cnblogs.com/magicc/p/6490566.html SCP 使用方式如下: 1.上传本地文件到服务器 scp /path/filename usernam ...

  8. 【转】eclipse 错误信息 "File Search" has encounter a problem 解决

    在eclipse中使用搜索功能,发生错误: "File Search" has encounter a problem 仔细看了一下自动跳出的错误日志(Error Log),发现: ...

  9. (第六场)Singing Contest 【模拟】

    题目链接:https://www.nowcoder.com/acm/contest/144/A 标题:A.Singing Contest | 时间限制:1 秒 | 内存限制:256M Jigglypu ...

  10. [19/03/16-星期六] 常用类_Date时间类&DateFormat类

    一.Date时间类 计算机中 以1970 年 1 月 1 日 00:00:00定为基准时间,每个度量单位是毫秒(1秒的千分之一) 用ong类型的变量来表示时间,如当前时刻数值:long  now =n ...