以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 生物信息学 』   (http://bbs.xml.org.cn/list.asp?boardid=46)
----  [合集]哪位能解释一下bootstrap和jack kni  (http://bbs.xml.org.cn/dispbbs.asp?boardid=46&rootid=&id=10447)


--  作者:admin
--  发布时间:9/23/2004 2:05:00 AM

--  [合集]哪位能解释一下bootstrap和jack kni


[合集]哪位能解释一下bootstrap和jack kn


发信人: kingsyl (Molecular Machine To Be Studied), 信区: Bioinformatics
标  题: [合集]哪位能解释一下bootstrap和jack kni
发信站: 北大未名站 (2004年03月21日20:15:23 星期天), 站内信件

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  哪位能解释一下bootstrap和jack knife?                                   
时间  北大未名站 (2003年10月16日00:50:12 星期四), 转信                       
───────────────────────────────────────
虽然这两个概念在进化里面用的很多,但其实是比较普遍的统计的概念。那位能给解释一
下?

───────────────────────────────────────
作者  biomagic (sophie's), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日01:07:27 星期四), 转信                       
───────────────────────────────────────
jack 没有用过,bootstrap到是接触过。
它的目的是用来检验构件的进化树的统计显著性。
phylip中,它把提交的align按照位置打乱,保持原有的比例,构件出新的align
一般是100,1000;然后对于不同的align分别的算距离(距离法),构树;
最后,统计每一支的出现频率,作出一个consense的树。

对于用距离法作的树,一定要进行bootstrap;对于用max likelihood作的树。现在的文
章中也基本上用了检验。

我有一点疑问:因为bootstrap的初衷是对于真实的‘树’的模拟,来寻找字母(碱基,
残疾,表型,。。。)之间的替换方式;而max likelihood做法的本身就是要找到最优的
概率;所以进行完max likelihood的分析后,是否还要,还有必要进行bootstrap?

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 虽然这两个概念在进化里面用的很多,但其实是比较普遍的统计的概念。那位能给解释一
: 下?

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日06:54:23 星期四), 转信                       
───────────────────────────────────────
bootstrap is resampling with replacement.

jackknife is n-1 "knock one out" resamples for n data

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 虽然这两个概念在进化里面用的很多,但其实是比较普遍的统计的概念。那位能给解释一
: 下?

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日07:03:52 星期四), 转信                       
───────────────────────────────────────
【 在 biomagic (sophie's) 的大作中提到: 】
: jack 没有用过,bootstrap到是接触过。
: 它的目的是用来检验构件的进化树的统计显著性。
: phylip中,它把提交的align按照位置打乱,保持原有的比例,构件出新的align
                                         ~~~~~~~~~~~~~~which ratio?
resample with replacement, how can you keep the nucleotide/aa frequencies
for a sequence?

: 一般是100,1000;然后对于不同的align分别的算距离(距离法),构树;
: 最后,统计每一支的出现频率,作出一个consense的树。
: 对于用距离法作的树,一定要进行bootstrap;对于用max likelihood作的树。现在的文
: 章中也基本上用了检验。
: 我有一点疑问:因为bootstrap的初衷是对于真实的‘树’的模拟,来寻找字母(碱基,
: 残疾,表型,。。。)之间的替换方式;而max likelihood做法的本身就是要找到最优的
: 概率;所以进行完max likelihood的分析后,是否还要,还有必要进行bootstrap?
: ...........................
bootstrap values mean the support for a specific branch. No tree is true.

───────────────────────────────────────
作者  biomagic (sophie's), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日09:38:58 星期四), 转信                       
───────────────────────────────────────
why ‘no tree is true'?

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
:                                          ~~~~~~~~~~~~~~which ratio?
: resample with replacement, how can you keep the nucleotide/aa frequencies
: for a sequence?
: bootstrap values mean the support for a specific branch. No tree is true.

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:05:17 星期四), 转信                       
───────────────────────────────────────
no model is correct

【 在 biomagic (sophie's) 的大作中提到: 】
: why ‘no tree is true'?

───────────────────────────────────────
作者  biomagic (sophie's), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:07:07 星期四), 转信                       
───────────────────────────────────────
【 在 dayhoff (愤怒的小马) 的大作中提到: 】
:                                          ~~~~~~~~~~~~~~which ratio?
: resample with replacement, how can you keep the nucleotide/aa frequencies
: for a sequence?
当频率保持一定的时候才能够保整个样本空间的无偏吧。我是这样理解的。

: bootstrap values mean the support for a specific branch. No tree is true.

───────────────────────────────────────
作者  biomagic (sophie's), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:08:25 星期四), 转信                       
───────────────────────────────────────
:)

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
: no model is correct

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:12:27 星期四), 转信                       
───────────────────────────────────────
for a pairwise alignment

AAATTCCCGCG
AATTTCTCGGG

a bootstrap result can be

TTTTTTTTTTT
TTTTTTTTTTT

in extreme case

anything is fixed?

【 在 biomagic (sophie's) 的大作中提到: 】
: 当频率保持一定的时候才能够保整个样本空间的无偏吧。我是这样理解的。

───────────────────────────────────────
作者  biomagic (sophie's), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:16:50 星期四), 转信                       
───────────────────────────────────────
yes
Because one column shows T:T, so this is true. However, if 100
or more sequences are all like this, can you say that bootstrap
shows any meanings. The total alignments have to make each column
has nearly equal probablity.

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
: for a pairwise alignment
: AAATTCCCGCG
: AATTTCTCGGG
: a bootstrap result can be
: TTTTTTTTTTT
: TTTTTTTTTTT
: in extreme case
: anything is fixed?

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:19:16 星期四), 转信                       
───────────────────────────────────────
that's right

just realize I misunderstand your original point

sorry

【 在 biomagic (sophie's) 的大作中提到: 】
: yes
: Because one column shows T:T, so this is true. However, if 100
: or more sequences are all like this, can you say that bootstrap
: shows any meanings. The total alignments have to make each column
: has nearly equal probablity.

───────────────────────────────────────
作者  biomagic (sophie's), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日10:31:03 星期四), 转信                       
───────────────────────────────────────
In fact, I misunderstood this point at the first glance on
bootstrap, too.

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
: that's right
: just realize I misunderstand your original point
: sorry

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日12:22:43 星期四), 转信                       
───────────────────────────────────────
or, an alternative statement is,
every modle is true with certain probability
:)

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
: no model is correct

───────────────────────────────────────
作者  hek (From CS to DS), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日16:55:14 星期四), 转信                       
───────────────────────────────────────
jack其实就是parsimony中类似于NJ中的bootstrap的检验方法。
具体做法与bootstrap也类似。

其实深里讲,bootstrap也有多种不同做法。我刚看过,似懂非懂。

【 在 biomagic (sophie's) 的大作中提到: 】
: jack 没有用过,bootstrap到是接触过。
: 它的目的是用来检验构件的进化树的统计显著性。
: phylip中,它把提交的align按照位置打乱,保持原有的比例,构件出新的align
: 一般是100,1000;然后对于不同的align分别的算距离(距离法),构树;
: 最后,统计每一支的出现频率,作出一个consense的树。
: 对于用距离法作的树,一定要进行bootstrap;对于用max likelihood作的树。现在的文
: 章中也基本上用了检验。
: 我有一点疑问:因为bootstrap的初衷是对于真实的‘树’的模拟,来寻找字母(碱基,
: 残疾,表型,。。。)之间的替换方式;而max likelihood做法的本身就是要找到最优的
: 概率;所以进行完max likelihood的分析后,是否还要,还有必要进行bootstrap?
: ...........................

───────────────────────────────────────
作者  hek (From CS to DS), 信区: Bioinformatics                              
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日16:57:38 星期四), 转信                       
───────────────────────────────────────
确实不需要保证频率恒定。
要保证频率恒定,就不再是随机抽取不同的列,而且可以抽重了,
而是自身颠倒位置(保持alignment的列不变)。

【 在 biomagic (sophie's) 的大作中提到: 】
: 当频率保持一定的时候才能够保整个样本空间的无偏吧。我是这样理解的。

───────────────────────────────────────
作者  newjun (闲), 信区: Bioinformatics                                      
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月16日19:09:36 星期四) , 站内信件                  
───────────────────────────────────────
Nod!
"All models are wrong but some are usefu"
一个被称作"Geoge Box"的人说的。

【 在 yix (Punk) 的大作中提到: 】
: or, an alternative statement is,
: every modle is true with certain probability
: :)

───────────────────────────────────────
作者  ttd (老猫), 信区: Bioinformatics                                       
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月17日10:11:47 星期五), 转信                       
───────────────────────────────────────
本质上,bootstrap用于检验由样本得到的统计量的可信度。
如果一个来自正态总体的样本S,我们可以根据它计算出u和sigma,
而用bootstrap可以估计出u和sigma的可信度。
bootstrap是个古怪而有简单的方法。每个人都会用,审稿人
也整不太清楚,所以受欢迎.:)

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 虽然这两个概念在进化里面用的很多,但其实是比较普遍的统计的概念。那位能给解释一
: 下?

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月17日16:30:25 星期五), 转信                       
───────────────────────────────────────
看来受欢迎,还是由于审稿人整不清楚啊。。。
呵呵。
【 在 ttd (老猫) 的大作中提到: 】
本质上,bootstrap用于检验由样本得到的统计量的可信度。
如果一个来自正态总体的样本S,我们可以根据它计算出u和sigma,
而用bootstrap可以估计出u和sigma的可信度。
bootstrap是个古怪而有简单的方法。每个人都会用,审稿人
也整不太清楚,所以受欢迎.:)

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 虽然这两个概念在进化里面用的很多,但其实是比较普遍的统计的概念。那位能给解释一
: 下?

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月17日16:38:05 星期五), 转信                       
───────────────────────────────────────
3个referee, 总是有懂得了

胡来是不行的
不过这个东西做起来简单,有比较好看

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 看来受欢迎,还是由于审稿人整不清楚啊。。。
: 呵呵。
: 本质上,bootstrap用于检验由样本得到的统计量的可信度。
: 如果一个来自正态总体的样本S,我们可以根据它计算出u和sigma,
: 而用bootstrap可以估计出u和sigma的可信度。
: bootstrap是个古怪而有简单的方法。每个人都会用,审稿人
: 也整不太清楚,所以受欢迎.:)

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月17日20:49:07 星期五), 转信                       
───────────────────────────────────────
开玩笑

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 看来受欢迎,还是由于审稿人整不清楚啊。。。
: 呵呵。
: 本质上,bootstrap用于检验由样本得到的统计量的可信度。
: 如果一个来自正态总体的样本S,我们可以根据它计算出u和sigma,
: 而用bootstrap可以估计出u和sigma的可信度。
: bootstrap是个古怪而有简单的方法。每个人都会用,审稿人
: 也整不太清楚,所以受欢迎.:)

───────────────────────────────────────
作者  Auction (御风而行), 信区: Bioinformatics                               
标题  Re: 哪位能解释一下bootstrap和jack knife?                               
时间  北大未名站 (2003年10月18日09:39:29 星期六), 转信                       
───────────────────────────────────────
??
bootstrap被误用倒是有可能,
但是审稿人不清楚是绝对不可能的。
【 在 ttd (老猫) 的大作中提到: 】
: 本质上,bootstrap用于检验由样本得到的统计量的可信度。
: 如果一个来自正态总体的样本S,我们可以根据它计算出u和sigma,
: 而用bootstrap可以估计出u和sigma的可信度。
: bootstrap是个古怪而有简单的方法。每个人都会用,审稿人
: 也整不太清楚,所以受欢迎.:)


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
265.625ms