首先声明,这里并不是我用perl来写个算法。如果需要算法相关的东西,得去看文献。
这里,其实只是借对格兰氏阳性细菌蛋白质定位的预测为例,来说明如何利用他人提供的在线查询功能来实现批处理。
假设现在有一个完整的基因组需要您去预测它当中的每一个开放阅读框翻译出来的蛋白质可能的细胞内定位,怎么办呢?手工一个一个提交到网站上去?一共会有四五千个蛋白,等你提交完,你的手和大脑都会不工作了吧?要不自己下载个软件来本地预测吧?我试过去安装那些要求的软件环境,也许是我的系统过新吧,一个c语言库的版本,一个g77让我就头大得不知道该怎么继续下去。于是我还是下定决心,用perl的lwp来伪装成浏览器提交申请,自动批处理吧。也许一觉醒来,全部都做完了。
我们要用到的网站是http://www.psort.org/psortb/。据网站上宣传,Based on a study last performed in 2010, PSORTb v3.0.2 is the most precise bacterial localization prediction tool available. 第二个原因就是can currently submit one or more Gram-positive or Gram-negative bacterial sequences or archaeal sequences in FASTA format。这对于研究格兰氏阳性菌的我来说的确很不错的网站。
最基本的,用lwp来虚拟提交一份表单上去:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | #!/usr/bin/perl use LWP::UserAgent; $ua = LWP::UserAgent->new; $ua->agent("Mozilla 8.0 beta"); use HTTP::Request::Common qw(POST); my $req = (POST 'http://www.psort.org/psortb/results.pl', ["seq" => ">$genes{name}\n$genes{translation}", "organism" => "bacteria", "gram"=>"positive", "advancedgram"=>"none", "format"=>"long", "sendresults"=>"display"); $request = $ua->request($req); print $request->as_string; |
结果得到的,怎么都是500 Internal Server Error。于是在网上狂google,也没有找到直接的答案。半夜两点,突然想起,为什么不自己想法来解决问题。于是开始用tcpdump抓包,对比从firefox发送出去的包和perl发送出去的包,具体看看有什么不同。 读取更多/Read the rest of this entry »
成年人当中,男女上网的比例均等,约为74%。
18-29年龄段上网的比例最大,约93%。随着年龄的增大,上网比例下降。
收入多少对上网带宽呈现正相关。而教育程度与上网比例关系为,教育程度越高,上网的比例越大。
上网的人群当中,38%的人一天内会多次使用网络;21%的人一天一次;13%的人一周3-5次;13%的人一周1-2次;4%的人几周一次。较2005年六月,上网的次数均有增加。
有58%的人使用台式机上网,有46%的人使用笔计本上网。其中有一部分人即有台机,也有本子。
写博客的人群龄分布:18-24岁:7%;25-34岁:25%;35-44岁:28%;45-49:11%;50-54:10%;55-64:14%。
互联网与生活最密切的国家:挪威,瑞典,芬兰,荷兰,美国。
互联网速最快的五个国家:日本,韩国,芬兰,瑞典,法国。
美国手机网络平均速度为700Kbps左右。
世界上有27%至55%的数据流量是因为bittorrent,其更是占据就点对点(p2p)数据量的45%至78%。
2001年四月,美国程序员Bram Cohen设计了BitTorrent通讯协议,用于点对点大文件的网络分享。在之前的点对点协议当中,点与点之间是单对单的关系,文件共享的速度取决于单点的最低网速。而BitTorrent通讯协议使点对点变成了多点对多点的交叉网络结构,每个共享文件的下载源不再只是一个,而是多个,下载的同时,又成为下载源。这就意味着虽然每一个下载源的上传速度有限,但是总和起来也将是一个更高的速度。
Cohen在2001年夏发布了第一款BitTorrent测试软件。但是一开始这款软件并没有推广开来。于是Cohen想了个办法,开始使用大量的免费的黄色视频资源来吸引用户。五年以后,BitTorrent软件就变得非常流行了。而Cohen办了一个小型的公司,有个5人的团队来开始用于搜索BT种子资源的搜索引擎。从那以后,BT搜索就流行了起来。
著名的BT资源站,pirate bay访问量排名109,mininova.org访问量排名108,torrentz.com访问量排名192。现在全球通过BT共享的数据达到了千TB。
虽然BT网站都在小心地摸着法律的边缘,不让自己身陷绝地,但是人们还是很容易的从这些网站上得到任何自己想得到的资源,无论它是合法的,还是非法的。pirate bay还设定了用于要求种子提供者自律的tracker机制,让每一个种子的都由其上传者对其合法性负责,但是仍然无法避免大量非法的资源共享。
当面临350万的巨额罚款时,有辩护律师说:这让人很不好理解,公司要因为别人共享的数据而被罚款。
因为BT工具的滥用,以及它对网络带宽的耗用,许多网络服务商都禁止了BT协议。
然而BT协议在大文件共享方面无以比拟的优势还是吸引了许多公司使用该协议来分布自己的资源,这其中就包括著名的游戏制作商暴雪公司。
在2009年当中,有1656227个恶意软件处于激活状态,而在2002年,这个数字只有20000左右。这些软件总计260万恶意代码。
有23%的恶意软件在美国被侦测到,而这些恶意软件造成数据丢失所带来的损失平均每次高达670万美金。而27%的数据破坏发生在教育部门。
关于钓鱼网站,有76%所模仿的都是财物网站,有24%模仿的是网络服务提供商,零售业,网络管理部门,以及在线游戏。
32%被盗的信用卡信号都会被出售以换取现金,以规避直接盗用的风险。价格分别为,每个卡号$0.06-$30,每帐户$10-$1000。
赛门铁克公司每天要处理80亿垃圾邮件和钓鱼网站。大约每天有75000台计算机感染病毒,其中13%属于中国,使中国成为肉机数量最多的国家,也是受恶意软件损害最严重的国家。4%属于布宜諾斯艾利斯,使它成为受害最严重的城市。
当漏洞出现后,Apple公司平均需要花9天时间为safari来发布补丁,而mozilla只需要一天就可以为firefox发布补丁。
现在越来越多的手机做为网络终端设备为人们上网时使用,并且成为了第七大媒体。那么它上网时的安全问题是不是也受到了人们足够的重视呢?
调查表明有23%在智能手机上安装了安全软件,有44%的人认为手机上网会比电脑上网更安全,或者至少安全性能差不多。
15%的人认为手机上网安全问题应该是由手机制造商负责,有35%的人认为应该由手机运营商负责,有55%的人认为应该由自己负责。(注,这里大于100%是因为有些人对此问题有多项选择)
对比三大智能手机:iphone,windows mobile,RIM黑莓机,其中无论是操作系统,手机运营商还是数据传输过程来看,黑莓机的安全性均最高,而windows mobile次之,而安全考虑最差的居然是iphone。iphone的安全主要依赖于手机运营商来提供。
对于两大开放的手机操作系统平台:Android和symbian,其安全考虑的思维安全不同,Android要求用户自身来判断软件是否安全,所有的软件安装运行都需要用户授权。这意味着用户对自己的手机安全负责。而symbian则不同,所有可以在其上安装的软件都必须有数字签名,而这些数字签名都需要软件设计者传真自己的ID才能获取,这就意味着symbian上所有可运行的软件都可以追踪到负责单位。也就是说symbian会手机安全主动承担了更多的责任。
超安全手机,听个名吧:奥巴马使用的Sectra Edge,Xaos Gamma。
我们知道,许多音乐人已经开始放弃传统的CD销售方式而转入网络下载销售,或者说有许多新人是通过网络而走红的。于是现在出现了一个词语,网络音乐。
平常人对于网络音乐是否可以真的让一个艺术家生存下来有所疑问。因为行业内销售收入是一个秘密,人与人是不非常不同的,所以这个问题就变得非常难以回答。 但是我们总是可以从某些其它的角度去了解这个行业内的收入现状(单纯的音乐销售收入)。信息总是有用的。
下面这个图并不是百分之百的准确,但是却是非常有用的一个参考。图中表示了美国音乐人月最低收入为$1,160的话,以不同的方式销售音乐,应该卖出多少张才能达到这个收入。比如说自制CD,你需要卖出143张;音乐合集,155张;音乐合集下载,1229次;MP3下载,1562〜2044次;亚马逊下载,12,399次;……
现在的七大媒体分别是:印刷品(包括书,杂志,和新闻报纸);音乐及电影;剧院;电台;电视;网络;以及手机。
新媒体不可能完全取代旧媒体,但会在某种形式上改变旧媒体;同时新媒体的出现与流行是与其形为方式及手段的创新而形成的。
手机这一媒体必将成为未来媒体形式的主流。手机现在的输入手段上较电脑有了更多的选择,除了键盘外,手机还有触摸屏,相机,2维码扫描,麦克风,平衡感应器,GPS定位等。它还拥有一些独特的特性,个人媒体,永远在线,便携,通畅的支付体系,精确的受众群,冲动时可及,消费的可记录性。
来看一眼日本电子书市场,手机读物已经远远超出了电脑读物的销售量。
这次的示意图和上次的不同。上次着重于航海定位,这次着重于陆地定位。
公元前3200年,星相定位。
公元前1100-1200年,磁定位。
大约公元前1000年,烟火定位。
从公元前1000年起,鸽子示位。
十九世纪,无线电波定位。
1960年,卫星GPS定位。
1990年,GPS导航器进入民用。
2000年,GPS嵌入智能手机系统。
如今,定位技术正逐步整合进所有的网络应用。
如果你还在用着百兆网络而享受其高速的话,现在google推出的千兆光纤入户的计划可能已经让你很震惊了。千兆光纤入户意味着每家每户都拥有以前骨干网的通讯能力。
那么问题来了,未来的骨干网应该有多快,才能真正负荷千兆入户的使用呢?对,TB级的速度。这可能吗?
日本NTT公司于上周进行了240公里的实验测试,得到了至今为止世界上最快的光纤通迅速度,69.1TB/s。这种速度是基于波分复用(Wavelength Division Multiplexing,WDM)技术,更准确的说,应该是高密度波分复用技术,因为它使用了432股171GB/s的光波同时在光纤内传播,总和通讯能力达到69.1TB/s。这一技术将被应用于未来几年内NTT骨干网的铺设。
更多技术内容请转至:http://www.physorg.com/news189430420.html
什么是OAuth呢?简单的来讲,就是open-standard Authorization protocol,开放的授权接入协议。以前google就在这方面做得不错,支持oAuth接入来共享用户的联系人,但是现在,它走得更远了,它可以支持通过oAuth邮件的第三方接入,这与pop和imap不同,它不但支持客户端,还支持网络应用。这为我们提供了一种更为开放的gmail应用方式。可以说,如果你有关于email应用的点子,你都可以使用oAuth来在Gmail上实现。
读取更多/Read the rest of this entry »









