这篇恐怕是有始以来命名最无奈标题了。需要写一下攻略。

业内人士都熟知NPInter,但是该数据库一直以来访问受限。不过终于能访问得到数据集。

但是蛋疼的是2.0的数据库id的命名方法实在奇葩,想了很多办法都难以攻破瓶颈。于是想到用3.0的数据库ID联查一下ncIdentifier。

终于ncIdentifier被验证可行,但是问题又来了:noncode数据库里找不到其中的一些序列。

先得读读核酸研究,搞明白命名方法。https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3965073/

先后尝试用12个数据库中的8个,终于LNCipedia算是良心库,http://www.oebiotech.com/Article/lncrnabtsj.html

12个数据库的相关文章:

www.360doc.com/content/17/0310/11/19913717_635515733.shtml

经过十动然拒,不过最终结果虽然称不上喜大普奔,但是回想起郁闷地想办法找序列,还算是细思恐极的过程。

此外,找到序列还是有遗留工作,得把序列从网上爬取下来存成fasta。

***

补充一下,中科院这种格式的ID还有一个数据库可查NPInter的序列,是印度加尔各答珀色研究所搞的。 bicresources.jcbose.ac.in/cgi-bin/lncrbase

追评一下这个数据库,有坑。比如n410143,查到的序列号是另外一种格式,需要再对照图寻找

**

最新探坑进展:ipedia和jcbose库里都没有的,比如n381557得用联查法,得到noncode序列ID格式从Noncode数据库里找

**

今天终于收集完了所有RNA数据。

总结:

第一步,先根据2.0已有的github数据提取所有目标序列;

第二步,抽取出未查找到的ID表;

第三步,到印度的数据库去进行查找 http://bicresources.jcbose.ac.in/zhumur/lncrbase;

第四步,到noncode在线查找第三步仍未找到的序列;

第五步,到NPInter下载2.0和3.0两个库,对第四步仍未查找到的序列,通过联查法获取3.0的noncode格式ID,到NPInter在线查找,找到对应RPI号,再跳转到noncode对应RNA转录序列的列表,选取序列

第六步,使用根特大学的数据库进行补充验证(可选)

*******

没想到两周之后遇到新的坑:superfamily的某些id得再uniprot里面猜。探坑结束再发。找了一些资源

GDB、GenBank、SWISS-PROT、PIR等可查询蛋白质的其它信息;
PDB主要应用于蛋白质结构预测和结构同源性比较。NRL-3D数据库则是PDB数据库中所有蛋白质序列的信息。http://www.rcsb.org/pdb/

******

最近又看到两个数据库:http://www.cuilab.cn/lncrnadisease

http://rtools.cbrc.jp/LncRRIsearch/help.cgi

下面还有篇科普文:http://www.sohu.com/a/144748065_786581

以及使用基因通路和其他几何方法的方法

http://blog.sciencenet.cn/blog-430956-917432.html

https://www.slideserve.com/nimrod/phd-prof-chun-ting-zhang-center-of-bioinformatics-tianjin-university

NPInter数据集的奇葩标号的出坑秘籍的更多相关文章

  1. 华为CloudIDE免费公测,带你出坑带你飞

    你的代码仓库上线了吗?是不是有时候遇到这样的问题? 只想浏览一下代码,却发现线上浏览效果不佳,高亮显示什么的都没有.而在桌面端浏览要需要先同步代码,再用桌面端的IDE打开.尤其是使用git的时候,先要 ...

  2. python函数中把列表(list)当参数时的"入坑"与"出坑"

    在Python函数中,传递的参数如果默认有一个为 列表(list),那么就要注意了,此处有坑!! 入坑 def f(x,li=[]): for i in range(x): li.append(i*i ...

  3. 反爬虫:利用ASP.NET MVC的Filter和缓存(入坑出坑) C#中缓存的使用 C#操作redis WPF 控件库——可拖动选项卡的TabControl 【Bootstrap系列】详解Bootstrap-table AutoFac event 和delegate的分别 常见的异步方式async 和 await C# Task用法 c#源码的执行过程

    反爬虫:利用ASP.NET MVC的Filter和缓存(入坑出坑)   背景介绍: 为了平衡社区成员的贡献和索取,一起帮引入了帮帮币.当用户积分(帮帮点)达到一定数额之后,就会“掉落”一定数量的“帮帮 ...

  4. Filezilla配置FTP中的坑以及出坑办法

    做本科生助教,老板让配置一个FTP传资料交作业,找了一台Windows服务器捣鼓,开始按网上教程自己配置特别麻烦,何西西说用Filezilla比较方便,就去Filezilla官网下载了Filezill ...

  5. React爬坑秘籍(一)——提升渲染性能

    React爬坑秘籍(一)--提升渲染性能 ##前言 来到腾讯实习后,有幸八月份开始了腾讯办公助手PC端的开发.因为办公助手主推的是移动端,所以导师也是大胆的让我们实习生来技术选型并开发,他来做code ...

  6. Android项目开发遇到的问题(64K的错误)的解决之路,从入坑到出坑

    自己一个android项目,一直以来进展还算顺利,没有遇到什么严重性的问题,今天准备给同事手机上安装一下玩玩,谁知丢人丢大,无法build apk!报错!my god,我开发没问题啊,我手机连上usb ...

  7. 反爬虫:利用ASP.NET MVC的Filter和缓存(入坑出坑)

    背景介绍: 为了平衡社区成员的贡献和索取,一起帮引入了帮帮币.当用户积分(帮帮点)达到一定数额之后,就会“掉落”一定数量的“帮帮币”.为了增加趣味性,帮帮币“掉落”之后所有用户都可以“捡取”,谁先捡到 ...

  8. springboot踩坑出坑记

    4月15到4月17我都在把毕设从eclipse重构到IDEA中,springboot最让我头疼的是它的版本问题,因为每一个版本对应的依赖包都有可能出错,这里分享一下如何成功移植用eclipse写的sp ...

  9. indexDB出坑指南

    对于入了前端坑的同学,indexDB绝对是需要深入学习的. 本文针对indexDB的难点问题(事务和数据库升级)做了详细的讲解,而对于indexDB的特点和使用方法只简要的介绍了一下.如果你有一些使用 ...

随机推荐

  1. Rabbit MQ 学习 (二)

    接连上一篇 :安装Erlang环境 之后,这篇安装 Rabbit Server 官网下载安装包:http://www.rabbitmq.com/install-windows.html 打开安装一路下 ...

  2. swfupload组件上传文件

    前段时间做文件上传用的是H5的一个插件,由于浏览器的兼容性不好,所以又换了一个Flash版本的上传文件插件,感觉这个上传插件的使用方式跟H5的差不多,有些雷同.不过,由于后续浏览不再支持Flash(略 ...

  3. DOS下格式化移动硬盘

    有的时候移动硬盘出现问题,在Win下没法操作,只能到dos下格式化.以下是用Win自带的diskpart完成格式化. 1  win + r   -> cmd  进入dos 2  diskpart ...

  4. 路飞学城Python-Day23(practise)

    本章总结 练习题 什么是C/S架构? 互联网协议是什么?分别介绍五层协议中每一层的功能? 基于tcp协议通信,为何建立链接需要三次握手,而断开链接却需要四次挥手 为何基于tcp协议的通信比基于udp协 ...

  5. Shell(四)函数

    函数 linux shell 可以用户定义函数,然后在shell脚本中可以随便调用. 一.格式 shell中函数的定义格式如下: [ function ] funname [()] { action; ...

  6. pycharm 2018 3.4 for mac破解

    使用pycharm的小伙伴都知道,pycharm分为社区版和专业版,这里具体区别不作过多介绍.本文带大家安装mac版的2018 pycharm 3.4 1.去官网下载pycharm 3.4 for m ...

  7. Java String 字符串截取和获取文件的上级目录

    public String test() { String root = ServletActionContext.getServletContext().getRealPath("/&qu ...

  8. NOIP2018提高组金牌训练营——搜索专题

    NOIP2018提高组金牌训练营——搜索专题 1416 两点 福克斯在玩一款手机解迷游戏,这个游戏叫做”两点”.基础级别的时候是在一个n×m单元上玩的.像这样: 每一个单元有包含一个有色点.我们将用不 ...

  9. 使用InstelliJ IDEA创建Spring MVC应用程序

    环境版本 Windows 8.1 IDE:InstelliJ IDEA 13    Spring:Spring 4.1.1 & Spring MVC 4.1.1    WebLogic 10. ...

  10. How-to-quick-getting-started-for-Frontend

    一转眼已一年多不专注前端方面的开发工作,这一年前端方面的技术又是新天地,偶然接到内部团队邀请我给他们做一个前端的讲座,希望能帮助他们快速.且深刻了解前端这个行业以及行业内的知识,这可真有点让我为难,由 ...