中国在世界啤酒市场所占份额正在快速成长。在过去十二年里,中国从几乎不怎么消费啤酒到现在成为世界上最大的啤酒消费国。所消费的啤酒数量已经远远超过美国及欧洲。依据Credit Suisse’s World Map of Beer的数据统计显示,中国每年的啤酒消费以每年10%的速度增长。这于世界的啤酒制造商来说,是一个非常好的事情。ABI, SABMiller, Carlsberg 和 Heineken享有世界近一半的市场份额,但有数据表明,它们在美国市场销售正逐年下降。而恰恰是中国市场给了它们很大的转机。而且中国正在成长的市场也让啤酒商们很受鼓舞。
来源:http://economist.com/node/16839104
一般的,当我们使用BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序)时,我们会注意到这里有一个E值。那么这个E value是什么呢?怎么来理解这个值呢?
下面是一个平常的blast结果,
| Sequences producing significant alignments: | Score (S) | E |
| gi|83574104|Moth_2374|sporulation – prote… | 202 | 2e-53 |
| gi|83573446|Moth_1696|Sporulation – prote… | 112 | 1e-26 |
| gi|83571874|Moth_0087|sporulation – prote… | 95 | 3e-21 |
| gi|83573435|Moth_1685|Substrate-binding -… | 27 | 1.0 |
后面有两个值,一个是S值,一个E值。可以发现,结果是依据S值的高低来显示的。
S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。
E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
E值的计算:
E=Kmn(e-lambda*S)
其中,K和lambda与数据库和算法有关,是个常量;m代表目标序列的长度,n代表数据库的大小,S就是前面提到的S值。
通常来讲,我们认为E值小于10-5就是比较可性的S值结果。我们可以想象,相同的数据库,E=0.001时如果有1000条都有机会S值比现在这个要高的话,那么不E设置为10-6时可能就会只得到一条结果,就是S值最可靠的那个。
但是E值也不是万能的。它在以下几个情况下有局限性:
1. 当目标序列过小时,E值会偏大,因为无法得到较高的S值。
2. 当两序列同源性虽然高,但有较大的gap(空隙)时,S值会下降。这个时候gap scores就非常有用。
3. 有些序列的非功能区有较低的随机性时,可能会造成两序列较高的同源性。
BLAST试图去避免这些问题,但是还是应该自己有个清晰的概念。
E值总结:
E值适合于有一定长度,而且复杂度不能太低的序列。
当E值小于10-5时,表明两序列有较高的同源性,而不是因为计算错误。
当E值小于10-6时,表时两序列的同源性非常高,几乎没有必要再做确认。
下面这个flash显示了世界各国主要城市之间的交通现状。有些地方距离很近,但彼此的交通去要花很长的时间,有的很远,去紧密联系着。
Tags: 幻灯片
![taxes[1] 美国的税务](http://www.qiuworld.com/blog/wp-content/uploads/2010/08/taxes1-332x2480.jpg)
![MNT-US-DEBT-R3[1] 美国国债持有者构成图](http://www.qiuworld.com/blog/wp-content/uploads/2010/08/MNT-US-DEBT-R31-560x609.jpg)
![201034NAM468[1] 世界啤酒市场份额分布图](http://www.qiuworld.com/blog/wp-content/uploads/2010/08/201034NAM4681-560x390.gif)





