新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Biomatics, Gene Ontology(基因本体)
    [返回] 计算机科学论坛计算机技术与应用『 生物信息学 』 → 二级数据库 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 11045 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 二级数据库 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 生物信息学 』 的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 二级数据库


    二级数据库                            


    发信人: palomino (~快马加鞭~), 信区: Bioinformatics
    标  题: 二级数据库
    发信站: 北大未名站 (2002年03月25日13:42:36 星期一), 转信

                               二级数据库


    上面介绍的基因组数据库、序列数据库和结构数据库是最基本、最常用的的分子生物信
    息数据库。以基因组、序列和结构数据库为基础,结合文献资料,研究开发更具特色、
    更便于使用的二次数据库,或专用数据库信息系统,已经成了生物信息学研究的一个重
    要方面。随着互联网技术的发展和普及,这些数据库多以Web界面为基础,不仅具有文字
    信息,而且以表格、图形、图表等方式显示数据库内容,并带有超文本连接。从用户角
    度看,许多二次数据库实际上就是一个专门的数据库信息系统。必须说明,二次数据库
    和一次数据库之间,其实并没有明确的界限,上述GDB和AceDB基因组数据库、SCOP和CA
    TH结构分类数据库,无论从内容,还是用户界面,实际上都具有二次数据库的特色。即
    使是最基本的蛋白质序列数据库SwisProt,也已经增加了许多与其它数据库的交叉索引
    ,蛋白质分析专家系统ExPASy提供的SwissProt浏览网页,同样具有表格、图形等功能。


    基因组信息二次数据库

    本章已经介绍了不少基因组数据库和基因组信息资源。此处,简单介绍法国巴斯德研究
    所构建的大肠杆菌基因组数据库,作为基因组二次数据库的一个实例。该数据库除了具
    有浏览、检索和数据库搜索(BALST/FASTA)功能外,还将大肠杆菌基因组用环形图表示,
    点击图中某个区域,就会显示该区域基因分布图,也可以用键盘输入起始位置和序列长
    度检索,使用十分方便。有关大肠杆菌和其它已经完成全序列测定的细菌基因组的二次
    数据库还有很多,巴斯德研究所还开发了枯草杆菌基因组数据库。
    德国生物工程研究所开发的真核生物基因调控转录因子数据库TransFac是一个比较完善
    的二次数据库,包括顺式调控位点、基因、转录因子、细胞来源、分类和调控位点核甘
    酸分布6个子库。该二次数据库始建于1988年,采用关系数据库模式,用表格存放数据。
    1997年起,基于Web的版本开始上网,北京大学生物信息中心建有镜象。目前,该数据库
    正在进一步开发,如构建各种转录因子在不同细胞组织中的表达特异性数据库等[Winge
    nder]。


    蛋白质序列二次数据库

    蛋白质序列二次数据库的问世已经有几年的历史,Prosite数据库是第一个蛋白质序列二
    次数据库,90年代初期开始构建,现由瑞士生物信息学研究所SIB维护[Hofmann等, 199
    9]。Protsite数据库是基于对蛋白质家族中同源序列多重序列比对得到的保守性区域,
    这样区域通常与生物学功能有关,例如酶的活性位点、配体或金属结合位点等。因此,
    Prosite数据库实际上是蛋白质序列功能位点数据库。通过对Prosite数据库的搜索,可
    判断该序列包含什么样的功能位点,从而推测其可能属于哪一个蛋白质家族。Prosite数
    据库实际上包括两个数据库文件,一个为数据文件即Prosite,该文件给出了能进行匹配
    的序列及序列的详细信息。另一个为说明文件PrositeDoc,PrositeDoc说明文件中给出
    该序列模式的生物学功能及其文献资料来源。Prosite数据库使用正则表达式来表示序列
    模式,例如:[GSK]-F-x(2)-[LIVMF]-x(4)-[RKEQA]-x(2)-[RST]-x-[GA]-x-[KN]-P-x-T
    .这里,方括号中为可选残基,如第一个方括号[GSK]中3个残基中甘氨酸G、丝氨酸S和赖
    氨酸L中的任意一个均可出现。x(2)表示可以有两个任意残基。因此,序列片段GFxxLxx
    xxRxxRxGxKPxT是其中一种可能的模式。
    Prosite数据库基于多序列比较得到的单一保守序列片段,或称序列模体。除Prosite外
    ,蛋白质序列二次数据库还有蛋白质序列指纹图谱数据库Prints(Attwood, 1998)、蛋白
    质序列模块数据库Blocks(Henikoff, 1998)、蛋白质序列家族数据库Pfam(Sonnhammer,
    1998)、蛋白质序列谱数据库Profile、蛋白质序列识别数据库Identify等[http://ww
    w.cbi.pku.edu.cn/chinese/documents/bioinfor/overview/web5/link1.2.5.2.html
    ]。这些数据库的共同特点是基于多序列比对,它们的不同之处是处理比对结果的原则
    和方法,Prints和Blocks利用了序列中的多重保守片段,Profiles着眼于构建序列概貌
    库,而Pfam采用了隐马氏模型,Identify则利用模糊正则表达式的概念。应该说,这些
    方法各有一定的特色。
    从某种意义上说,蛋白质序列二次数据库实际上也是蛋白质功能数据库,因为从这些数
    据库中,可以得到有关蛋白质功能、家族、进化等信息


    蛋白质结构二次数据库

    蛋白质结构数据库PDB主要存放原子坐标,属于一次数据库。早在80年代,就已经出现了
    从PDB数据库的坐标数据中提取信息的程序,并在此基础上构建了蛋白质二级结构构象参
    数数据库(Definition of Secondary Structure of Proteins,简称DSSP)。DSSP数据库
    根据PDB中的原子坐标,计算每个氨基酸残基的二级结构构象参数,包括氢键、主链和侧
    链二面角、二级结构类型等。90年代以来,随着PDB数据库数据量的增长,出现了许多蛋
    白质分类数据库。蛋白质家族数据库(Families of Structurally Similar Proteins,
    简称FSSP)就是其中的一个。它把PDB数据库中的蛋白质通过序列和结构比对进行分类。
    与DSSP和FSSP相关的另一个蛋白质结构数据库是同源蛋白数据库(Homology Derived Se
    condary Structure of Proteins,简称HSSP)。该数据库不但包括已知三维结构的同源
    蛋白家族,而且包括未知结构的蛋白质分子,并将它们按同源家族分类。这3个蛋白质结
    构二次数据库为蛋白质分子设计、蛋白质模型构建和蛋白质工程等研究提供了很好的信
    息资源和工具[Sander, 1990]。
    除了DSSP、FSSP、HSSP外,还有其它许多不同种类和层次的蛋白质结构二次数据库,如
    蛋白质结构域分配数据库、蛋白质回环分类数据库等。

    --
    Tomorrow is another day.

    ※ 来源:·北大未名站 bbs.pku.edu.cn·[FROM: 162.105.53.86]


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/9/23 2:05:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 生物信息学 』 的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 20:31:48

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    3,593.750ms