以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 生物信息学 』   (http://bbs.xml.org.cn/list.asp?boardid=46)
----  [合集]生统与进化入门感想[二]    (http://bbs.xml.org.cn/dispbbs.asp?boardid=46&rootid=&id=10460)


--  作者:admin
--  发布时间:9/23/2004 2:05:00 AM

--  [合集]生统与进化入门感想[二]  


[合集]生统与进化入门感想[二]          


发信人: kingsyl (Molecular Machine To Be Studied), 信区: Bioinformatics
标  题: [合集]生统与进化入门感想[二]  
发信站: 北大未名站 (2004年03月21日20:28:28 星期天), 站内信件

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  生统与进化入门感想[二]                                                 
时间  北大未名站 (2003年10月10日01:21:42 星期五), 转信                       
───────────────────────────────────────
看生统感觉看不大下去了。以前虽然是学过概率统计这个课的,但是总有几年的时间,渐
渐的就忘得差不多的。有几个问题挡在这里,想不大明白:
1.statistics significant。这个当然是我最关心的,如果是的话,那么自然做出来的东
西是比较可靠的,如果没有的话,那就等于是实验白做了的。师兄有次跟我说了个
p<0.05,呵呵,不懂怎么来的,虽然我在别人的讲座里,偶尔也听过。
2.tailed test,不管是two-也好,right, left也好,我都稀里糊涂,看过fisher's
exact test,用法很简单,结果也容易判读,无非就是看看哪个是p<0.05。不过有什么意
义呢?

另外,bootstrap, 或者leave-one-out,一种检验方法,就是把原来的数据,除掉一些,
然后重算,看看是不是能够还能得到稳定的结果,用目前的统计软件能做么?

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日01:53:25 星期五) , 站内信件                  
───────────────────────────────────────
偶这几天一直了在看这篇文章,不过实在没什么心得,否则偶就先写了。。。

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 看生统感觉看不大下去了。以前虽然是学过概率统计这个课的,但是总有几年的时间,渐
: 渐的就忘得差不多的。有几个问题挡在这里,想不大明白:
: 1.statistics significant。这个当然是我最关心的,如果是的话,那么自然做出来的东
: 西是比较可靠的,如果没有的话,那就等于是实验白做了的。师兄有次跟我说了个
: p<0.05,呵呵,不懂怎么来的,虽然我在别人的讲座里,偶尔也听过。
: exact test,用法很简单,结果也容易判读,无非就是看看哪个是p<0.05。不过有什么意
: 义呢?
: 另外,bootstrap, 或者leave-one-out,一种检验方法,就是把原来的数据,除掉一些,
: 然后重算,看看是不是能够还能得到稳定的结果,用目前的统计软件能做么?

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:00:19 星期五), 转信                       
───────────────────────────────────────
p-value means the probability that you will make a type I error (reject null
hypothesis when it is true). If the p-value is less than 0.05, then the
expected number of false positive will be less than 5%.

two-sided or one-sided tests, they are both dependent on your null
hypothesis. Make it clear what your null hypothesis is.

bootstrap is just a resampling method with replacement. The purpose is to
estimate your statistics without more real experiments. jackknife is similar
at this point. There must be a R package for those procedures. Also it is
not hard to implement in any language although reinventing wheel is stupid.

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 看生统感觉看不大下去了。以前虽然是学过概率统计这个课的,但是总有几年的时间,渐
: 渐的就忘得差不多的。有几个问题挡在这里,想不大明白:
: 1.statistics significant。这个当然是我最关心的,如果是的话,那么自然做出来的东
: 西是比较可靠的,如果没有的话,那就等于是实验白做了的。师兄有次跟我说了个
: p<0.05,呵呵,不懂怎么来的,虽然我在别人的讲座里,偶尔也听过。
: 2.tailed test,不管是two-也好,right, left也好,我都稀里糊涂,看过fisher's
: exact test,用法很简单,结果也容易判读,无非就是看看哪个是p<0.05。不过有什么意
: 义呢?
: 另外,bootstrap, 或者leave-one-out,一种检验方法,就是把原来的数据,除掉一些,
: 然后重算,看看是不是能够还能得到稳定的结果,用目前的统计软件能做么?
: ...........................

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:03:48 星期五), 转信                       
───────────────────────────────────────
you should read the book of "chen(2) xi(1) ru(2)"

you are in ustc and it is easy to obtain for you, right?

haha

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 看生统感觉看不大下去了。以前虽然是学过概率统计这个课的,但是总有几年的时间,渐
: 渐的就忘得差不多的。有几个问题挡在这里,想不大明白:
: 1.statistics significant。这个当然是我最关心的,如果是的话,那么自然做出来的东
: 西是比较可靠的,如果没有的话,那就等于是实验白做了的。师兄有次跟我说了个
: p<0.05,呵呵,不懂怎么来的,虽然我在别人的讲座里,偶尔也听过。
: 2.tailed test,不管是two-也好,right, left也好,我都稀里糊涂,看过fisher's
: exact test,用法很简单,结果也容易判读,无非就是看看哪个是p<0.05。不过有什么意
: 义呢?
: 另外,bootstrap, 或者leave-one-out,一种检验方法,就是把原来的数据,除掉一些,
: 然后重算,看看是不是能够还能得到稳定的结果,用目前的统计软件能做么?
: ...........................

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:30:13 星期五), 转信                       
───────────────────────────────────────
nice!!! 这几个问题解释之后,我觉得理解的要方便很多了,谢谢。

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
: p-value means the probability that you will make a type I error (reject null
: hypothesis when it is true). If the p-value is less than 0.05, then the
: expected number of false positive will be less than 5%.
: two-sided or one-sided tests, they are both dependent on your null
: hypothesis. Make it clear what your null hypothesis is.
: bootstrap is just a resampling method with replacement. The purpose is to
: estimate your statistics without more real experiments. jackknife is similar
: at this point. There must be a R package for those procedures. Also it is
: not hard to implement in any language although reinventing wheel is stupid.

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:32:37 星期五), 转信                       
───────────────────────────────────────
真是ft,这本书实在是。。。难的地方完全看不懂,简单的地方实在没有意思。。。老师
随便讲讲就考试了,sigh..当时不是觉得统计没用么?现在知道错误了。
【 在 dayhoff (愤怒的小马) 的大作中提到: 】
: you should read the book of "chen(2) xi(1) ru(2)"
: you are in ustc and it is easy to obtain for you, right?
: haha

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:35:08 星期五), 转信                       
───────────────────────────────────────
Statistical Inference
by George Casella, Roger L. Berger

If you can obtain this one, quite straitforward

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 真是ft,这本书实在是。。。难的地方完全看不懂,简单的地方实在没有意思。。。老师
: 随便讲讲就考试了,sigh..当时不是觉得统计没用么?现在知道错误了。

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:38:13 星期五), 转信                       
───────────────────────────────────────
这个,我还是先老老实实看看一些入门的书,还没学会走,先不学爬了,呵呵。

【 在 dayhoff (愤怒的小马) 的大作中提到: 】
Statistical Inference
by George Casella, Roger L. Berger

If you can obtain this one, quite straitforward

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 真是ft,这本书实在是。。。难的地方完全看不懂,简单的地方实在没有意思。。。老师
: 随便讲讲就考试了,sigh..当时不是觉得统计没用么?现在知道错误了。

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:51:48 星期五), 转信                       
───────────────────────────────────────
this paper mainly talks about solving multiple testing problem.

Although multiple testing problem is a longstanding one and Bonferroni
correction is the standard procedure to solve this problem.

With the number of tests increases, Bonferroni correction might be too
conservative. so the concept of false discovery rate is introduced to help
get as many significant results as possbile while still control the number
of false positives.

It might be good to read some other papers of Storey's.

【 在 Feynman (早知道等下辈子再做帅哥了) 的大作中提到: 】
: 偶这几天一直了在看这篇文章,不过实在没什么心得,否则偶就先写了。。。

───────────────────────────────────────
作者  dayhoff (愤怒的小马), 信区: Bioinformatics                             
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日02:53:13 星期五), 转信                       
───────────────────────────────────────
this IS an introductory book

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 这个,我还是先老老实实看看一些入门的书,还没学会走,先不学爬了,呵呵。
: Statistical Inference
: by George Casella, Roger L. Berger
: If you can obtain this one, quite straitforward

───────────────────────────────────────
作者  newjun (闲), 信区: Bioinformatics                                      
标题  Re: 生统与进化入门感想[二]                                             
时间  北大未名站 (2003年10月10日09:10:36 星期五) , 站内信件                  
───────────────────────────────────────
1.statistics significant。p<0.05好像是从物理上来的,大概叫95的可信度吧
大概意思是A和费A出现的概率

另外,bootstrap, 或者leave-one-out,不用专门的软件,Phylip就可以


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
93.750ms